C-Eval全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat, APUS的AiLMe-100B v1。然而值得关注的是,在难题排行榜中,APUS位列全球榜首!


C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。(马爱)
来源:光明网
Copyright © 2001-2026 湖北荆楚网络科技股份有限公司 All Rights Reserved
互联网新闻信息许可证 4212025003 -
增值电信业务经营许可证 鄂B2-20231273 -
广播电视节目制作经营许可证(鄂)字第00011号
信息网络传播视听节目许可证 1706144 -
互联网出版许可证 (鄂)字3号 -
营业执照
鄂ICP备 13000573号-1
鄂公网安备 42010602000206号
版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像