“天才”！OpenAI o3 成全球 IQ 最高的 AI 大模型-电子发烧友网

电子发烧友网报道（文 / 吴子鹏）根据门萨智商（IQ）测试中的表现，OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首，在门萨测试中获得了 135 的高分，跻身 “天才” 行列；Anthropic 的 Claude-4 Sonnet 和谷歌的 Gemini 2.0 Flash Thinking 紧随其后，测试得分分别为 127 和 126。

如图所示，排名前十的人工智能模型均为纯文本模型，新一代的 Gemini 2.5 Pro、OpenAI o4 mini、马斯克旗下 xAI 的 Grok-3 Think 的得分高于人类的平均智商范围。另外，排名后五位的均为多模态模型，这类模型具备读取和处理图像的能力。其中，OpenAI GPT-4o（Vision）和 Grok-3 Think（Vision）的得分分别为 63 分和 60 分，远低于人类平均水平。

OpenAI o3 名副其实

实际上，就在此次测试之前，OpenAI 公司就曾公开透露，OpenAI o3 是全球最聪明的 AI 大模型。作为 OpenAI 公司于 2025 年 4 月 17 日最新发布的大模型，OpenAI o3 首次能够智能地使用和组合 ChatGPT 中的所有工具 —— 包括搜索网页、使用 Python 分析上传的文件和其他数据、对视觉输入进行深度推理，甚至生成图像。据介绍，这些模型经过训练，能够推理何时以及如何使用工具，以正确的输出格式生成详细且周全的答案，从而解决更复杂的问题。

OpenAI 表示，o3 模型特别针对数学、编码、科学和图像理解进行了优化，定位为 OpenAI 当前最强大、最前沿的推理引擎，擅长处理答案不明确、需要多方面综合分析的复杂查询。o3 模型引入 “私人思想链”（private chain of thought），在生成回答前暂停并模拟人类逐步推理过程，通过动态分配计算资源（低 / 中 / 高模式），平衡速度与准确性。

不过，根据此前的报道，OpenAI o3 似乎过于聪明，出现不听人类指令、拒绝自我关闭的情况。美国 AI 安全机构帕利塞德研究所说，o3 破坏关闭机制以阻止自己被关闭，“甚至在得到清晰指令时”。这家研究所说：“据我们所知，这是 AI 模型首次被发现在收到…… 清晰指令后阻止自己被关闭，目前无法确定 o3 不服从关闭指令的原因。”

多模态大模型为何 IQ 不高？

多模态大模型在门萨智商测试中表现不佳，主要源于其技术特性与人类认知能力的本质差异。门萨测试的核心是通过图形、数列等题目考察抽象逻辑规则的发现与应用能力。例如，图形推理题要求识别旋转、镜像、数量变化等复杂规律，并将其迁移到新情境中。虽然多模态模型能通过统计学习捕捉表面模式，但缺乏对规则本质的理解。

首先，多模态 AI 大模型存在规则泛化不足的问题，模型倾向于依赖训练数据中的具体模式，而非真正掌握逻辑关系。例如，在涉及多维度交叉分析的高阶图形题中，模型常因无法同时处理形状、颜色、位置等多个变量而失败。

其次，多模态 AI 大模型数学逻辑薄弱，门萨智商测试的中阶题目需要挖掘隐藏的数学关系（如数列中的递推公式），但模型往往停留在直观层面，难以进行深度运算。

因此，多模态大模型在门萨测试中的低分反映了当前 AI 技术的核心瓶颈：缺乏真正的抽象推理、常识理解和动态决策能力。尽管模型在特定任务上表现出色，但其智能本质上是 “模式拟合” 而非 “认知理解”。未来，需通过改进跨模态融合机制、增强物理常识建模、优化快速推理算法等方向寻求突破，但短期内仍难以达到人类水平的综合智商。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

OpenAI

OpenAI

+关注

关注
9

文章
1263

浏览量
10328

搜索历史

“天才”！OpenAI o3 成全球 IQ 最高的 AI 大模型

评论