日前,在知名的挪威门萨智商测试中, GPT-5 创下了模型中最差的记录:
GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。
GPT-5 得分 118,线下测试得分 70。
但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。
据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。
不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。
值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。
而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。
来源:新浪科技
出品:荆楚网(湖北日报网)
Copyright © 2001-2025 湖北荆楚网络科技股份有限公司 All Rights Reserved
互联网新闻信息许可证 42120170001 -
增值电信业务经营许可证 鄂B2-20231273 -
广播电视节目制作经营许可证(鄂)字第00011号
信息网络传播视听节目许可证 1706144 -
互联网出版许可证 (鄂)字3号 -
营业执照
鄂ICP备 13000573号-1 鄂公网安备 42010602000206号
版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像