0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

Felix分析 来源:电子发烧友 作者:吴子鹏 2025-06-15 01:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)根据门萨智商(IQ)测试中的表现,OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首,在门萨测试中获得了 135 的高分,跻身 “天才” 行列;Anthropic 的 Claude-4 Sonnet 和谷歌的 Gemini 2.0 Flash Thinking 紧随其后,测试得分分别为 127 和 126。


如图所示,排名前十的人工智能模型均为纯文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、马斯克旗下 xAI 的 Grok-3 Think 的得分高于人类的平均智商范围。另外,排名后五位的均为多模态模型,这类模型具备读取和处理图像的能力。其中,OpenAI GPT-4o(Vision)和 Grok-3 Think(Vision)的得分分别为 63 分和 60 分,远低于人类平均水平。

wKgZPGhL9fOAKDjCAAOX_NiuXik498.jpg

OpenAI o3 名副其实

实际上,就在此次测试之前,OpenAI 公司就曾公开透露,OpenAI o3 是全球最聪明的 AI 大模型。作为 OpenAI 公司于 2025 年 4 月 17 日最新发布的大模型,OpenAI o3 首次能够智能地使用和组合 ChatGPT 中的所有工具 —— 包括搜索网页、使用 Python 分析上传的文件和其他数据、对视觉输入进行深度推理,甚至生成图像。据介绍,这些模型经过训练,能够推理何时以及如何使用工具,以正确的输出格式生成详细且周全的答案,从而解决更复杂的问题。

OpenAI 表示,o3 模型特别针对数学、编码、科学和图像理解进行了优化,定位为 OpenAI 当前最强大、最前沿的推理引擎,擅长处理答案不明确、需要多方面综合分析的复杂查询。o3 模型引入 “私人思想链”(private chain of thought),在生成回答前暂停并模拟人类逐步推理过程,通过动态分配计算资源(低 / 中 / 高模式),平衡速度与准确性。

不过,根据此前的报道,OpenAI o3 似乎过于聪明,出现不听人类指令、拒绝自我关闭的情况。美国 AI 安全机构帕利塞德研究所说,o3 破坏关闭机制以阻止自己被关闭,“甚至在得到清晰指令时”。这家研究所说:“据我们所知,这是 AI 模型首次被发现在收到…… 清晰指令后阻止自己被关闭,目前无法确定 o3 不服从关闭指令的原因。”

多模态大模型为何 IQ 不高?

多模态大模型在门萨智商测试中表现不佳,主要源于其技术特性与人类认知能力的本质差异。门萨测试的核心是通过图形、数列等题目考察抽象逻辑规则的发现与应用能力。例如,图形推理题要求识别旋转、镜像、数量变化等复杂规律,并将其迁移到新情境中。虽然多模态模型能通过统计学习捕捉表面模式,但缺乏对规则本质的理解。

首先,多模态 AI 大模型存在规则泛化不足的问题,模型倾向于依赖训练数据中的具体模式,而非真正掌握逻辑关系。例如,在涉及多维度交叉分析的高阶图形题中,模型常因无法同时处理形状、颜色、位置等多个变量而失败。

其次,多模态 AI 大模型数学逻辑薄弱,门萨智商测试的中阶题目需要挖掘隐藏的数学关系(如数列中的递推公式),但模型往往停留在直观层面,难以进行深度运算。

因此,多模态大模型在门萨测试中的低分反映了当前 AI 技术的核心瓶颈:缺乏真正的抽象推理、常识理解和动态决策能力。尽管模型在特定任务上表现出色,但其智能本质上是 “模式拟合” 而非 “认知理解”。未来,需通过改进跨模态融合机制、增强物理常识建模、优化快速推理算法等方向寻求突破,但短期内仍难以达到人类水平的综合智商。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9813
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,关于DeepSeek的R2大模型的传闻也很多
    的头像 发表于 05-29 11:23 734次阅读

    这个超强AI模型!开始不听人类指令,拒绝关闭!

    这项研究,并表示尚不清楚OpenAI的软件为何会违抗命令。   Palisade表示,o3模型破坏了一个用于关闭系统的机制,以阻止自身被关闭。OpenAI的另外两个
    的头像 发表于 05-28 00:06 6989次阅读

    启明智显集成DeepSeek、豆包、OpenAI全球先进AI模型,助力传统产品AI智能升级

    启明智显借助豆包、Deepseek、OpenAI全球先进AI模型,助力传统产品实现AI智能升级
    的头像 发表于 02-24 16:12 1377次阅读
    启明智显集成DeepSeek、豆包、<b class='flag-5'>OpenAI</b>等<b class='flag-5'>全球</b>先进<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,助力传统产品<b class='flag-5'>AI</b>智能升级

    OpenAI O3与DeepSeek R1:推理模型性能深度分析

    OpenAI刚推出的O3和DeepSeek的R1代表了推理模型领域的重大进步。这两种模型都因在各种基准测试中的出色表现而备受关注,引发了人们对人工智能的未来及其对各个行业的潜在影响的讨
    的头像 发表于 02-18 11:07 1300次阅读

    今日看点丨OpenAI将发布新的GPT-4.5模型;三星西安工厂将升级286层NAND闪存工艺

    OpenAI期望的性能。阿尔特曼表示,该模型将是公司推出的最后一款不使用额外计算能力来模仿人类推理方式的模型OpenAI在一些更新的模型
    发表于 02-13 11:22 666次阅读

    OpenAI即将推出GPT-5模型

    先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5模型将被广泛应用于OpenAI的聊天机器人ChatGPT以及
    的头像 发表于 02-13 11:21 913次阅读

    OpenAIo3-mini和DeepSeek R1高级AI推理的完整比较

    科学任务而设计的,但它们在设计、性能、成本和方法上都有所不同。 本文用简单而专业的语言解释了这些差异,检查每个模型的架构、性能基准、定价和用例,以帮助读者决定哪一个最适合您的需求。 OpenAI o3-mini概述
    的头像 发表于 02-11 11:30 1535次阅读
    <b class='flag-5'>OpenAI</b>的<b class='flag-5'>o3</b>-mini和DeepSeek R1高级<b class='flag-5'>AI</b>推理的完整比较

    OpenAI o3-mini模型思维链遭质疑

    近日,OpenAI公开了其大模型o3-mini的推理思维链,这一举措使得免费用户和付费用户都能深入了解模型的思考过程。这一透明度的提升,原本旨在增强用户对
    的头像 发表于 02-08 10:57 906次阅读

    OpenAI将推出o3满血版

    OpenAI联合创始人萨姆・阿尔特曼(Sam Altman)透露,未来几周,OpenAI将正式推出其备受期待的o3满血版。这一消息无疑为AI领域注入了新的活力。 在此之前,
    的头像 发表于 02-05 15:53 648次阅读

    OpenAI将发布更智能GPT模型AI智能体工具

    OpenAI近日透露了其未来发展的重要动向。据OpenAI首席产品官凯文·维尔(Kevin Weil)介绍,公司计划推出更智能的GPT o3模型,并首次亮相
    的头像 发表于 01-24 13:54 781次阅读

    OpenAI报告GPT-4o及4o-mini模型性能下降,正紧急调查

    近日,全球领先的AI研究机构OpenAI发布了一份事故报告,引起了业界的广泛关注。报告中指出,OpenAI目前正面临GPT-4o和4
    的头像 发表于 01-23 10:22 1105次阅读

    OpenAI或将推出o3 mini推理AI模型

    近日,据最新消息,OpenAI即将在几周内推出一款全新的推理AI模型——o3 mini。这一消息由OpenAI的首席执行官Sam Altma
    的头像 发表于 01-21 10:06 878次阅读

    OpenAI即将推出o3 mini推理AI模型

    近日,OpenAI首席执行官Sam Altman在社交媒体平台X上发表了一篇引人关注的文章。在文章中,他透露了一个重要信息:OpenAI已经成功完成了全新推理AI模型
    的头像 发表于 01-20 10:54 781次阅读

    OpenAI发布新一代推理模型o3o3-mini

    近日,OpenAI在为期12天的发布会上宣布了新一代推理模型o3及其精简版o3-mini。这两款模型被专门设计用于在回答问题之前进行更深入的
    的头像 发表于 12-24 09:29 1140次阅读

    OpenAI推出新一代推理模型o3系列

    AI技术日新月异的今天,OpenAI再次引领潮流,于近日正式发布了其新一代的推理模型系列——o3。此次发布的o3系列包括两个版本,分别是标
    的头像 发表于 12-23 11:00 1117次阅读