0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

训练量暴增100倍!Grok 4推理碾压,马斯克预言两年内发现新物理定律

Monika观察 来源:电子发烧友 作者:莫婷婷 2025-07-13 06:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群




电子发烧友网报道(文/莫婷婷)7月10日,马斯克的AI公司xAI正式发布旗舰大模型Grok 4、Grok 4 API,同时推出AI订阅计划Super Grok Heavy,每月300美元(约合2153元人民币)。

马斯克对Grok 4的能力给予了高度评价,他表示,Grok 4的推理能力已超越人类水平,甚至比几乎所有学科的研究生具备更强的综合理解与分析能力。

在被称为“人类的最后考试”(Humanity's Last Exam)的综合性测试中,Grok 4取得了25.4%的准确率,且完全不依赖任何外部“工具”辅助。相比之下,谷歌Gemini 2.5 Pro的得分为21.6%,而OpenAI的o3(高版本)仅为21%。在这场全球顶尖模型的较量中,Grok 4一举超越了多位此前公认的领先选手,成为新一代大模型中的佼佼者。



除了Humanity's Last Exam的测试,Grok 4还在GPQA、AIME25、LCB(Jan-May)、HMMT25等测试中,超过了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等大模型。

马斯克介绍,Grok 4未来将达到以下目标:它能在所有考试中答对所有题目;如果答错,它会指出问题出在哪里;如果题目存在歧义,它会将问题拆解为答案A、B和C,并消除歧义后的问题下,对选项A、B、C分别对应的解答。


马斯克表示,Grok 4每个学科都达到超博士水平,目前Grok 4还没有发明新技术或发现新物理定律的能力,但他认为在下半年、最迟也会在明年就能看到Grok 4发现具有实用价值的新技术,两年之内就会发现新物理定律。

Grok 4是如何实现如此高水平的推理能力。根据介绍,在训练层,每一代模型的训练规模都实现了数量级提升,Grok 4的训练量是Grok 2的100倍。马斯克明确表示,这个训练量还会持续增长。



训练算力有两种类型:一是Grok 2到Grok 3阶段的训练预算力,二是在Grok 3到Grok 4阶段,团队在强化学习的推理环节投入了大量算力。xAI团队通过训练Grok 2,首次实现了预训练规模的突破,团队发现如果真正精细地进行数据消融实验,以及基础设备、算法,就可以通过1.0倍的量大幅推进预训练,打造最佳的预训练基础模型。xAI将动用了有20万块H100 GPU的超级算力中心

与Grok 3不同,Grok 4将工具直接融入训练过程,使其成为模型的原生能力。在单智能体情况下,团队能解决40%的问题;随着测试与计算规模的扩大,团队已经能解决HRE问题中纯文本子集超过50%的内容。这是一个极其困难的任务,xAI表示。

在发布会上,xAI也正式推出了多智能体版本Grok 4 Heavy。在人类的最后考试测试中,Grok 4 Heavy取得44.4%的准确率。

马斯克指出Grok最大的弱点在图像理解、图像生成,xAI正在进行相关的训练。Grok 4基于第六代基础模型,第七代基础模型将在几周后完成,届时将改善图像领域的不足。

在开通AI订阅计划Super Grok后,用户就可以访问Grok 4,订阅费为每月30美金。如果成为Super Grok Heavy用户,就可以同时访问Grok 4和Grok 4 Heavy,订阅费为每月300美金。xAI表示,届时你将成为“一群Grok研究智能体的任务主管”,让你变得更聪明。

Grok 4以其超人类推理能力与跨学科统治力引发关注。此次发布不仅让Grok 4成为大模型性能天花板,也意味着xAI正以算力筑壁垒。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    马斯克出手!特斯拉联合谷歌组建“电力联盟”,解决AI电力需求

    电子发烧友网报道(文/梁浩斌)马斯克最近在社交媒体上频繁谈论电力的问题,过去半年,美国本土供电问题已经对AI数据中心造成了不小的冲击,包括微软、Meta等巨头都因为电力问题而导致部分数据中心被迫推迟
    的头像 发表于 03-16 13:47 7103次阅读
    <b class='flag-5'>马斯克</b>出手!特斯拉联合谷歌组建“电力联盟”,解决AI电力需求

    解决AI电荒难题!马斯克:SpaceX并购xAI,把AI送上太空

    电子发烧友网报道(文/李弯弯)当地时间2月2日,马斯克旗下SpaceX宣布收购同属其旗下的人工智能企业xAI,xAI也证实“加入SpaceX”。马斯克在SpaceX官网发布的备忘录显示,合并后公司
    的头像 发表于 02-04 09:15 6731次阅读

    马斯克拟建全球最大芯片厂,进军2nm芯片制造!

    3月22日,马斯克宣布SpaceX、特斯拉携手人工智能公司xAI,正在建设史上规模最大的芯片制造工厂“Terafab”,这是私营公司计划的最大半导体制造业务之一。
    的头像 发表于 03-25 16:14 508次阅读

    马斯克预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前,人类终将走向边缘化。以下是对这一预言的相关分析: 预言
    发表于 03-14 05:27

    马斯克要发100万颗卫星,是太空狂想还是未来蓝图?

    2026年初,埃隆·马斯克再次引爆全球科技圈:SpaceX向美国联邦通信委员会(FCC)提交申请,计划部署多达100万颗卫星,构建名为“轨道数据中心”(Orbital Data Centers)的天
    的头像 发表于 02-09 10:30 460次阅读

    销量首度被比亚迪超越,马斯克却要带特斯拉“去造机器人”?

    在全球电动汽车市场从蓝海转向红海的激烈竞争中,昔日的领跑者特斯拉正面临前所未有的压力。 2025年,特斯拉全球交付同比下降约8.6%,首次被中国制造商比亚迪超越。与此同时,埃隆·马斯克却将公司
    的头像 发表于 01-20 11:00 420次阅读

    马斯克:AI5芯片设计进展顺利,特斯拉AI战略迈入新阶段

    电子发烧友网报道 1月19日,特斯拉首席执行官埃隆·马斯克在社交媒体平台X上宣布,下一代自动驾驶芯片AI5的设计已接近完成,并同步重启超级计算机项目Dojo 3的开发工作。   马斯克宣称,AI5
    的头像 发表于 01-19 14:05 5921次阅读

    当光伏飞向太空:霍尔电流传感器如何守护马斯克100GW“天基电网”?

    最近,“太空光伏”感念随着在马斯克宏大的AI算力卫星计划被炒得火爆,马斯克在社交平台上公开提出,计划未来每年向太空部署高达100吉瓦(GW)的太阳能AI卫星能源网络。这个部署相当于每
    的头像 发表于 01-12 15:14 3256次阅读
    当光伏飞向太空:霍尔电流传感器如何守护<b class='flag-5'>马斯克</b>的<b class='flag-5'>100</b>GW“天基电网”?

    2026年,人类文明重构的元年 | 马斯克预言

    2026年元旦的钟声尚未消散,埃隆·马斯克在社交平台X的一篇跨年博文已引爆全球科技圈:"HappyNewYear!2026willbeabanger.""2026将会
    的头像 发表于 01-04 07:42 5003次阅读
    2026年,人类文明重构的元年 | <b class='flag-5'>马斯克</b>的<b class='flag-5'>预言</b>

    马斯克点赞晶科能源最新电池转换效率世界纪录

    近日,全球科技领袖、特斯拉与SpaceX首席执行官埃隆·马斯克(Elon Musk)在社交媒体上公开点赞晶科能源最新电池转换效率世界纪录,让世界见证中国光伏技术持续引领全球、不断刷新效率极限。
    的头像 发表于 12-31 10:49 1188次阅读

    看点:马斯克:将深度参与特斯拉芯片设计 华为首款透明天线路由器开售

    给大家带来一些业界资讯: 马斯克:将深度参与特斯拉芯片设计  马斯克在社交平台发文宣布本人将深度参与特斯拉AI芯片的设计,每周二和周六与工程团队开会。目标是每年量产一款新芯片,相关芯片将用于自动驾驶
    的头像 发表于 11-25 14:52 988次阅读

    特斯拉要自建超大型晶圆厂,马斯克:与英特尔合作 “有必要”

    特斯拉CEO马斯克周四(6日) 盘后于股东大会上表示,随着自动驾驶与机器人应用快速扩张,特斯拉需要自行建造一座大型晶圆厂,以满足未来庞大的运算需求,并透露公司可能与芯片大厂英特尔展开合作。消息公布后,英特尔闻讯大涨近4%。
    的头像 发表于 11-07 18:07 2493次阅读

    NVIDIA黄仁勋向SpaceX马斯克交付DGX Spark

    革新于星舰基地开始。NVIDIA 创始人兼首席执行官黄仁勋亲手将全球迄今为止最小的 AI 超级计算机 NVIDIA DGX Spark 交付给埃隆·马斯克,拉开了该产品上市的序幕。
    的头像 发表于 10-21 11:12 1220次阅读

    马斯克的“星链”卫星,大批坠落

    电子发烧友网综合报道 据俄罗斯《共青团真理报》6月8日报道,埃隆·马斯克的太空探索技术公司发射的“星链”卫星接连坠落。由美国国家航空航天局(NASA)戈达德航天中心的物理学家丹尼·奥利维拉领导的研究
    的头像 发表于 06-11 00:07 1.1w次阅读

    马斯克回归“7×24硬核模式”,FSD与Optimus双线狂飙

    这场 "马斯克式狂飙" 能否冲破技术瓶颈与市场质疑?2025 年的得州街头,或许会给出第一个答案。
    的头像 发表于 05-27 16:18 853次阅读