0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

炸场!Grok 3击败Deepseek?马斯克20万显卡造AI

Monika观察 来源:电子发烧友 作者:莫婷婷 2025-02-19 09:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/莫婷婷)美国太平洋时间周一晚上8点(北京时间周二12点),马斯克旗下人工智能公司xAI正式发布新一代人工智能大模型Grok 3。在这款产品还未发布之前,马斯克就为它站台,表示“Grok 3将是地球上最聪明的人工智能”。那么,这款史上最聪明的AI大模型到底有哪些亮点?

Grok 3系列多项测试登顶,即将接入SpaceX火箭

此次直播有四人参与,分别是xAI工程师Igor Babuschkin,还有两位华人研究员:多伦多大学计算机科学助理教授Jimmy Ba,斯坦福大学博士后吴宇怀(Yuhuai "Tony" Wu),以及伊隆·马斯克。

wKgZO2e1LjOAIrb4AADrx6e4Gyo971.png
此次发布的Grok 3系列有两个版本,分别为Grok 3和轻量版Grok 3 mini。Grok 3 mini经过了更长时间的训练,在某些情况下能够更快地解答问题。xAI还发布了推理模型Grok-3 Reasoning和Grok-3 mini Reasoning,以及首个AI智能体DeepSearch。

在近期的世界政府峰会上,马斯克提到Grok 3时表示,“Grok 3有极强的推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。”

为了让Grok 3更加聪明,xAI团队在进行训练时用到了更多的计算资源。此前,Grok 2训练规模为2000 万GPU 小时。而Grok 3训练规模是Grok 2的10倍,约为2 亿GPU 小时。

wKgZPGe1Lj6AGjk2AADXEjAfgl0186.png

马斯克在现场展示了Grok 3进行AIME'24数学能力测试、GPQA科学知识评估、LCB Oct-Feb编程能力测试等多个测试的实际表现。马斯克将Grok 3与Grok 3 mini、Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-40进行对比。在上述多个测试中,Grok 3的表现都优于其他AI大模型,特别是在LCB Oct-Feb编程能力测试中,Grok 3的得分为57,GPT-40的得分为34,几乎是后者的两倍得分。

在与DeepSeek-V3的对比中,Grok 3也有优异的表现,AIME'24数学能力测试以52 分超 过DeepSeek-V3 的 39 分。GPQA 科学知识评估以75 分超过DeepSeek-V3 的65 分。LCB Oct-Feb 编程能力测试以57 分超过DeepSeek-V3 的 36 分。

wKgZO2e1LkeAfdqTAACGTdEMJHM363.jpg


在众包大模型评估平台Chatbot Arena(LMSYS)聊天机器人大模型竞技场的测试中,早期版 Grok 3拿到了1402分。xAI团队兴奋地表示,Grok 3是首个超过1400分的AI大模型,超过了 DeepSeek-R1、OpenAI o1、Gemini-thinking等推理模型。“它是在聊天室功能、编程等各方面的性能上,可以说是最强劲的。我们还在不断地更新。”

在推理能力方面,Grok 3的表现同样超出预期。在 AIME 2025 数学竞赛的测试中,两个推理模型Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning两个版本分别以93分、90分的成绩超过同比大模型。

wKgZPGe1Lk-ALB6_AAGsrH5WOyk142.png


Grok 3有DeepSearch模式、思考(Think)模式、Big Brain模式。思考(Think)模式时,Grok 3会展示出思考链路、思考时长,与DeepSeek类似。Big Brain模式则使用了更多的模式。

在发布会现场,xAI给出了不同的任务,包括发布让Grok 3生成“从地球发射、着陆火星,然后再次返回地球的3D 动图的代码”“使用 pygame 制作一款结合了俄罗斯方块和宝石方块的游戏,代码可以很长,效果要炫酷”等任务。Grok 3都顺利完成了上述任务。

针对游戏的任务,xAI团队选择让Grok 3结合俄罗斯方块和宝石方块两个游戏,这意味着需要把两个游戏的一些代码和要素去复制和融合在一起,这也展示出AI具备创造力的过程。

在进行火箭发射的任务时,工作人员一开始用Grok-3 mini进行测试,后面切换了满血版Grok-3。在经过114秒的等待后,Grok-3给出了答案。“发射时间窗口的计算过程中涉及了大量的数学和物理模型。那其实我们也能够在Grok 3的思维和推理的过程之中,去了解它到底引用了什么样的算式和推理,所以我们的模型能够为航空航天领域提供帮助。但大模型计算的发射窗口可能也会出现失误的问题,但是我相信它最终会给我们得出一个结论和结果。”xAI团队表示。

wKgZPGe1LliAI5dYAANXBngnrZ0031.png

马斯克兴奋地提到,我们希望能够用Grok 3解决特别重要的任务,比如说去打造一辆特斯拉,或者说是发射一个真正的火箭。“我相信下一次重大的突破会在明年 11 月份出现,我们会在明年让 space x 火箭登陆火星,接入Grok 这样的模型去计算整个的发射过程。”

在发布会之前,马斯克就提到,Grok 3引入了思维链(Chain Of Thought)推理机制可以让Grok 3像人类一样,逐步解决复杂的问题。从发布会的测试任务结果来看,Grok 3逻辑推理测试中能够提供创新的想法和解决方案。


“全球最强”之争:建立最大H100集群,消耗20万块 H100

回顾xAI大模型的发展历程:2023年11月,xAI发布第一款大模型Grok-1,拥有3140亿参数,用于训练AI聊天机器人。2024年3月,Grok宣布开源。2024年8月,Grok-2大模型发布。在Grok-1的基础上,训练时除了采用大规模合成数据,还加入真实世界数据。

从Grok 2大模型发布至今,已将近一年。在这一年中,AI大模型的发展速度超乎想象,例如中国DeepSeek大模型的横空出世,OpenAI 的推理模型o3等。此外,OpenAI还在加速推进AI大模型的研发进程,针对o4模型训练已经启动。xAI似乎也感受到紧迫感。

wKgZO2e1LmKAM3ihAACkNNWOyT0937.jpg

可以看到,AI行业似乎进入了一场AI大模型性能的竞赛,特别是关于“谁是全球最强”。

为了打造出全球最强的AI大模型,xAI投入了大量的资源。Grok 3优异的表现是取决于哪些方面?马斯克坦言,一是我们有世界上最优秀的 AI工程师团队,我们可以重塑推理,真正确保 AI训练达到相关的一个算力极限。其次我们也必须去计算到底有多少 GPU 可以同时运行,用来突破整个AI 和大语言模型的边界。

xAI团队坦言,我们在训练大模型的过程中也遇到了很多的困难,我们认为在模型训练中,能耗能效在 65% 到 80% 之间,可以说是浪费了很多能源。如果想要进一步推进语言模型、AI技术的发展,必须去解决数据中心的冷却问题、供能等问题。

因此为了训练Grok 3,xAI团队提升了数据中心的容量,用约四个月的时间建立新的数据中心,用10万个GPU启动并运行。随着技术的投入,又用92天的时间把数据中心的算力提升了一倍,扩大到20 万块显卡。xAI团队认为这将是同类中最大的全连接的H100集群。与此同时xAI团队已经开始研究下一个AI集群,将比现在的集群强大5倍。

目前AI大模型竞赛的核心驱动力包括计算能力与训练规模、多模态与推理能力、开源与商业化平衡等。

xAI团队表示,Grok 3测试版现已面向社交媒体平台X用户推出。Grok 3会在一周后获得最佳体验,将有语音模式。xAI还将在Grok 3成熟后,开源Grok 2。

进入2025年,AI领域新的竞争已然开启。从马斯克的Grok 3来看,随着技术的成熟与强大,未来AI大模型将不仅仅能解决人们日常中的问题,还能进入科研领域。


小结:

随着Grok 3的震撼发布,我们看到了通过20万张GPU训练出的大模型在性能上的巨大飞跃。与此同时,关于训练成本的话题也引起业内关注。消息显示,xAI公司投入巨大,特别是针对Grok 3的投入。消息显示,xAI公司进行新一轮的融资,此次计划筹集约100亿美元资金,融资后公司估值达到约750亿美元。另一边,DeepSeek R1以550万美元的成本进入人们的视野。这不禁让我们思考:在追求更高性能的AI大模型时,该如何找到成本与性能之间的平衡点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    马斯克出手!特斯拉联合谷歌组建“电力联盟”,解决AI电力需求

    电子发烧友网报道(文/梁浩斌)马斯克最近在社交媒体上频繁谈论电力的问题,过去半年,美国本土供电问题已经对AI数据中心造成了不小的冲击,包括微软、Meta等巨头都因为电力问题而导致部分数据中心被迫推迟
    的头像 发表于 03-16 13:47 6927次阅读
    <b class='flag-5'>马斯克</b>出手!特斯拉联合谷歌组建“电力联盟”,解决<b class='flag-5'>AI</b>电力需求

    解决AI电荒难题!马斯克:SpaceX并购xAI,把AI送上太空

    电子发烧友网报道(文/李弯弯)当地时间2月2日,马斯克旗下SpaceX宣布收购同属其旗下的人工智能企业xAI,xAI也证实“加入SpaceX”。马斯克在SpaceX官网发布的备忘录显示,合并后公司
    的头像 发表于 02-04 09:15 6575次阅读

    马斯克拟建全球最大芯片厂,进军2nm芯片制造!

    3月22日,马斯克宣布SpaceX、特斯拉携手人工智能公司xAI,正在建设史上规模最大的芯片制造工厂“Terafab”,这是私营公司计划的最大半导体制造业务之一。
    的头像 发表于 03-25 16:14 421次阅读

    马斯克的预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前
    发表于 03-14 05:27

    马斯克要发100颗卫星,是太空狂想还是未来蓝图?

    2026年初,埃隆·马斯克再次引爆全球科技圈:SpaceX向美国联邦通信委员会(FCC)提交申请,计划部署多达100颗卫星,构建名为“轨道数据中心”(Orbital Data Centers)的天
    的头像 发表于 02-09 10:30 363次阅读

    销量首度被比亚迪超越,马斯克却要带特斯拉“去机器人”?

    在全球电动汽车市场从蓝海转向红海的激烈竞争中,昔日的领跑者特斯拉正面临前所未有的压力。 2025年,特斯拉全球交付量同比下降约8.6%,首次被中国制造商比亚迪超越。与此同时,埃隆·马斯克却将公司
    的头像 发表于 01-20 11:00 347次阅读

    马斯克AI5芯片设计进展顺利,特斯拉AI战略迈入新阶段

    电子发烧友网报道 1月19日,特斯拉首席执行官埃隆·马斯克在社交媒体平台X上宣布,下一代自动驾驶芯片AI5的设计已接近完成,并同步重启超级计算机项目Dojo 3的开发工作。   马斯克
    的头像 发表于 01-19 14:05 5658次阅读

    马斯克宣布: A15完成设计,未来芯片迭代快过AMD和英伟达

    1 月 18 日,特斯拉首席执行长伊隆·马斯克(Elon Musk)宣布一项雄心勃勃的人工智能(AI)芯片路线图,计划每九个月推出新一代 AI 处理器,这个速度将超越竞争对手英伟达和 AMD 的年度
    的头像 发表于 01-19 10:21 1.8w次阅读
    <b class='flag-5'>马斯克</b>宣布: A15完成设计,未来芯片迭代快过AMD和英伟达

    当光伏飞向太空:霍尔电流传感器如何守护马斯克的100GW“天基电网”?

    最近,“太空光伏”感念随着在马斯克宏大的AI算力卫星计划被炒得火爆,马斯克在社交平台上公开提出,计划未来每年向太空部署高达100吉瓦(GW)的太阳能AI卫星能源网络。这个部署量相当于每
    的头像 发表于 01-12 15:14 2985次阅读
    当光伏飞向太空:霍尔电流传感器如何守护<b class='flag-5'>马斯克</b>的100GW“天基电网”?

    看点:马斯克:将深度参与特斯拉芯片设计 华为首款透明天线路由器开售

    给大家带来一些业界资讯: 马斯克:将深度参与特斯拉芯片设计  马斯克在社交平台发文宣布本人将深度参与特斯拉AI芯片的设计,每周二和周六与工程团队开会。目标是每年量产一款新芯片,相关芯片将用于自动驾驶
    的头像 发表于 11-25 14:52 892次阅读

    NVIDIA黄仁勋向SpaceX马斯克交付DGX Spark

    革新于星舰基地开始。NVIDIA 创始人兼首席执行官黄仁勋亲手将全球迄今为止最小的 AI 超级计算机 NVIDIA DGX Spark 交付给埃隆·马斯克,拉开了该产品上市的序幕。
    的头像 发表于 10-21 11:12 1149次阅读

    训练量暴增100倍!Grok 4推理碾压,马斯克预言两年内发现新物理定律

        电子发烧友网报道(文/莫婷婷)7月10日,马斯克AI公司xAI正式发布旗舰大模型Grok 4、Grok 4 API,同时推出AI
    的头像 发表于 07-13 06:15 6350次阅读
    训练量暴增100倍!<b class='flag-5'>Grok</b> 4推理碾压,<b class='flag-5'>马斯克</b>预言两年内发现新物理定律

    马斯克的“星链”卫星,大批坠落

    电子发烧友网综合报道 据俄罗斯《共青团真理报》6月8日报道,埃隆·马斯克的太空探索技术公司发射的“星链”卫星接连坠落。由美国国家航空航天局(NASA)戈达德航天中心的物理学家丹尼·奥利维拉领导的研究
    的头像 发表于 06-11 00:07 1.1w次阅读

    马斯克回归“7×24硬核模式”,FSD与Optimus双线狂飙

    这场 "马斯克式狂飙" 能否冲破技术瓶颈与市场质疑?2025 年的得州街头,或许会给出第一个答案。
    的头像 发表于 05-27 16:18 772次阅读

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    似乎国内外AI竞争日趋白热化,就在阿里巴巴发布Qwen3(通义千问3)之后,引发业界广泛关注;很多大厂在跟进,大模型不断上新: 阿里巴巴开源新一代通义千问模型Qwen3 4月29日凌晨
    的头像 发表于 04-30 16:08 1503次阅读