0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

炸场!Grok 3击败Deepseek?马斯克20万显卡造AI

Monika观察 来源:电子发烧友 作者:莫婷婷 2025-02-19 09:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/莫婷婷)美国太平洋时间周一晚上8点(北京时间周二12点),马斯克旗下人工智能公司xAI正式发布新一代人工智能大模型Grok 3。在这款产品还未发布之前,马斯克就为它站台,表示“Grok 3将是地球上最聪明的人工智能”。那么,这款史上最聪明的AI大模型到底有哪些亮点?

Grok 3系列多项测试登顶,即将接入SpaceX火箭

此次直播有四人参与,分别是xAI工程师Igor Babuschkin,还有两位华人研究员:多伦多大学计算机科学助理教授Jimmy Ba,斯坦福大学博士后吴宇怀(Yuhuai "Tony" Wu),以及伊隆·马斯克。

wKgZO2e1LjOAIrb4AADrx6e4Gyo971.png
此次发布的Grok 3系列有两个版本,分别为Grok 3和轻量版Grok 3 mini。Grok 3 mini经过了更长时间的训练,在某些情况下能够更快地解答问题。xAI还发布了推理模型Grok-3 Reasoning和Grok-3 mini Reasoning,以及首个AI智能体DeepSearch。

在近期的世界政府峰会上,马斯克提到Grok 3时表示,“Grok 3有极强的推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。”

为了让Grok 3更加聪明,xAI团队在进行训练时用到了更多的计算资源。此前,Grok 2训练规模为2000 万GPU 小时。而Grok 3训练规模是Grok 2的10倍,约为2 亿GPU 小时。

wKgZPGe1Lj6AGjk2AADXEjAfgl0186.png

马斯克在现场展示了Grok 3进行AIME'24数学能力测试、GPQA科学知识评估、LCB Oct-Feb编程能力测试等多个测试的实际表现。马斯克将Grok 3与Grok 3 mini、Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-40进行对比。在上述多个测试中,Grok 3的表现都优于其他AI大模型,特别是在LCB Oct-Feb编程能力测试中,Grok 3的得分为57,GPT-40的得分为34,几乎是后者的两倍得分。

在与DeepSeek-V3的对比中,Grok 3也有优异的表现,AIME'24数学能力测试以52 分超 过DeepSeek-V3 的 39 分。GPQA 科学知识评估以75 分超过DeepSeek-V3 的65 分。LCB Oct-Feb 编程能力测试以57 分超过DeepSeek-V3 的 36 分。

wKgZO2e1LkeAfdqTAACGTdEMJHM363.jpg


在众包大模型评估平台Chatbot Arena(LMSYS)聊天机器人大模型竞技场的测试中,早期版 Grok 3拿到了1402分。xAI团队兴奋地表示,Grok 3是首个超过1400分的AI大模型,超过了 DeepSeek-R1、OpenAI o1、Gemini-thinking等推理模型。“它是在聊天室功能、编程等各方面的性能上,可以说是最强劲的。我们还在不断地更新。”

在推理能力方面,Grok 3的表现同样超出预期。在 AIME 2025 数学竞赛的测试中,两个推理模型Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning两个版本分别以93分、90分的成绩超过同比大模型。

wKgZPGe1Lk-ALB6_AAGsrH5WOyk142.png


Grok 3有DeepSearch模式、思考(Think)模式、Big Brain模式。思考(Think)模式时,Grok 3会展示出思考链路、思考时长,与DeepSeek类似。Big Brain模式则使用了更多的模式。

在发布会现场,xAI给出了不同的任务,包括发布让Grok 3生成“从地球发射、着陆火星,然后再次返回地球的3D 动图的代码”“使用 pygame 制作一款结合了俄罗斯方块和宝石方块的游戏,代码可以很长,效果要炫酷”等任务。Grok 3都顺利完成了上述任务。

针对游戏的任务,xAI团队选择让Grok 3结合俄罗斯方块和宝石方块两个游戏,这意味着需要把两个游戏的一些代码和要素去复制和融合在一起,这也展示出AI具备创造力的过程。

在进行火箭发射的任务时,工作人员一开始用Grok-3 mini进行测试,后面切换了满血版Grok-3。在经过114秒的等待后,Grok-3给出了答案。“发射时间窗口的计算过程中涉及了大量的数学和物理模型。那其实我们也能够在Grok 3的思维和推理的过程之中,去了解它到底引用了什么样的算式和推理,所以我们的模型能够为航空航天领域提供帮助。但大模型计算的发射窗口可能也会出现失误的问题,但是我相信它最终会给我们得出一个结论和结果。”xAI团队表示。

wKgZPGe1LliAI5dYAANXBngnrZ0031.png

马斯克兴奋地提到,我们希望能够用Grok 3解决特别重要的任务,比如说去打造一辆特斯拉,或者说是发射一个真正的火箭。“我相信下一次重大的突破会在明年 11 月份出现,我们会在明年让 space x 火箭登陆火星,接入Grok 这样的模型去计算整个的发射过程。”

在发布会之前,马斯克就提到,Grok 3引入了思维链(Chain Of Thought)推理机制可以让Grok 3像人类一样,逐步解决复杂的问题。从发布会的测试任务结果来看,Grok 3逻辑推理测试中能够提供创新的想法和解决方案。


“全球最强”之争:建立最大H100集群,消耗20万块 H100

回顾xAI大模型的发展历程:2023年11月,xAI发布第一款大模型Grok-1,拥有3140亿参数,用于训练AI聊天机器人。2024年3月,Grok宣布开源。2024年8月,Grok-2大模型发布。在Grok-1的基础上,训练时除了采用大规模合成数据,还加入真实世界数据。

从Grok 2大模型发布至今,已将近一年。在这一年中,AI大模型的发展速度超乎想象,例如中国DeepSeek大模型的横空出世,OpenAI 的推理模型o3等。此外,OpenAI还在加速推进AI大模型的研发进程,针对o4模型训练已经启动。xAI似乎也感受到紧迫感。

wKgZO2e1LmKAM3ihAACkNNWOyT0937.jpg

可以看到,AI行业似乎进入了一场AI大模型性能的竞赛,特别是关于“谁是全球最强”。

为了打造出全球最强的AI大模型,xAI投入了大量的资源。Grok 3优异的表现是取决于哪些方面?马斯克坦言,一是我们有世界上最优秀的 AI工程师团队,我们可以重塑推理,真正确保 AI训练达到相关的一个算力极限。其次我们也必须去计算到底有多少 GPU 可以同时运行,用来突破整个AI 和大语言模型的边界。

xAI团队坦言,我们在训练大模型的过程中也遇到了很多的困难,我们认为在模型训练中,能耗能效在 65% 到 80% 之间,可以说是浪费了很多能源。如果想要进一步推进语言模型、AI技术的发展,必须去解决数据中心的冷却问题、供能等问题。

因此为了训练Grok 3,xAI团队提升了数据中心的容量,用约四个月的时间建立新的数据中心,用10万个GPU启动并运行。随着技术的投入,又用92天的时间把数据中心的算力提升了一倍,扩大到20 万块显卡。xAI团队认为这将是同类中最大的全连接的H100集群。与此同时xAI团队已经开始研究下一个AI集群,将比现在的集群强大5倍。

目前AI大模型竞赛的核心驱动力包括计算能力与训练规模、多模态与推理能力、开源与商业化平衡等。

xAI团队表示,Grok 3测试版现已面向社交媒体平台X用户推出。Grok 3会在一周后获得最佳体验,将有语音模式。xAI还将在Grok 3成熟后,开源Grok 2。

进入2025年,AI领域新的竞争已然开启。从马斯克的Grok 3来看,随着技术的成熟与强大,未来AI大模型将不仅仅能解决人们日常中的问题,还能进入科研领域。


小结:

随着Grok 3的震撼发布,我们看到了通过20万张GPU训练出的大模型在性能上的巨大飞跃。与此同时,关于训练成本的话题也引起业内关注。消息显示,xAI公司投入巨大,特别是针对Grok 3的投入。消息显示,xAI公司进行新一轮的融资,此次计划筹集约100亿美元资金,融资后公司估值达到约750亿美元。另一边,DeepSeek R1以550万美元的成本进入人们的视野。这不禁让我们思考:在追求更高性能的AI大模型时,该如何找到成本与性能之间的平衡点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    训练量暴增100倍!Grok 4推理碾压,马斯克预言两年内发现新物理定律

        电子发烧友网报道(文/莫婷婷)7月10日,马斯克AI公司xAI正式发布旗舰大模型Grok 4、Grok 4 API,同时推出AI
    的头像 发表于 07-13 06:15 5936次阅读
    训练量暴增100倍!<b class='flag-5'>Grok</b> 4推理碾压,<b class='flag-5'>马斯克</b>预言两年内发现新物理定律

    从性能到商业,Grok3、GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型大放异彩的
    的头像 发表于 02-19 18:14 1568次阅读
    从性能到商业,<b class='flag-5'>Grok3</b>、GPT-4o、<b class='flag-5'>DeepSeek</b>如何重塑<b class='flag-5'>AI</b>版图?

    马斯克的“秘密武器”:Grok 3真的能轻松碾压DeepSeek和ChatGPT?

    作者:算力魔方创始人/英特尔创新大使刘力 2月17日,埃隆·马斯克旗下的xAI公司正式推出最新版聊天机器人Grok 3马斯克称其为“地球上最聪明的人工智能”,这款备受瞩目的
    的头像 发表于 02-19 16:41 7025次阅读
    <b class='flag-5'>马斯克</b>的“秘密武器”:<b class='flag-5'>Grok</b> <b class='flag-5'>3</b>真的能轻松碾压<b class='flag-5'>DeepSeek</b>和ChatGPT?

    马斯克发布Grok 3大模型,超越GPT-4o

    多项benchmark测试中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰显了Grok
    的头像 发表于 02-19 13:50 724次阅读

    马斯克发布Grok-3,X平台用户可优先订阅

    近日,马斯克正式发布了备受期待的新一代人工智能模型Grok-3。据马斯克介绍,Grok-3及其迷你版Grok-3 mini在多方面的测试中均
    的头像 发表于 02-19 09:57 763次阅读

    马斯克揭秘Grok 3训练成本:20块英伟达GPU

    的训练过程极为庞大且复杂,累计消耗了高达20块的英伟达GPU。这一数字不仅彰显了Grok 3在算力方面的巨大需求,也反映了xAI公司在技术研发和数据中心建设方面的雄厚实力。
    的头像 发表于 02-19 09:39 1190次阅读

    马斯克即将发布Grok 3大模型,自诩“最聪明”AI

    近日,科技界迎来一则重大消息。特斯拉及SpaceX创始人马斯克在社交平台X上亲自宣布,其旗下人工智能公司倾力打造的大模型Grok 3将于北京时间18日中午12点震撼发布。马斯克对这款大
    的头像 发表于 02-18 15:02 912次阅读

    马斯克盛赞:xAI发布Grok 3推理模型,被誉为地球上最聪明的AI

    的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。 马斯克及其团队表示,Grok 3 也将具有类似 DeepSeek R1 和 OpenAI o
    的头像 发表于 02-18 14:44 1019次阅读
    <b class='flag-5'>马斯克</b>盛赞:xAI发布<b class='flag-5'>Grok</b> <b class='flag-5'>3</b>推理模型,被誉为地球上最聪明的<b class='flag-5'>AI</b>

    特斯拉内部担忧马斯克影响

    近日,一份内部录音揭示了特斯拉某部门员工会议上的紧张氛围。会上,特斯拉员工与高级管理人员纷纷表达了对公司CEO马斯克的担忧,认为他的行为正在对公司及其可持续发展使命造成损害。 据两名特斯拉员工透露
    的头像 发表于 02-18 11:12 883次阅读

    马斯克即将发布Grok 3大模型,誉为最聪明AI

    近日,科技巨头马斯克在社交平台X上宣布了一项重要消息。据他透露,其旗下的人工智能公司即将于北京时间18日中午12点正式发布大模型Grok 3马斯克对这款新产品充满信心,甚至称其为“地
    的头像 发表于 02-17 14:27 1056次阅读

    奥尔特曼:马斯克竞购OpenAI意在拖延发展

    在巴黎AI峰会上,OpenAI公司的首席执行官奥尔特曼(Sam Altman)透露了一个令人意外的观点。他指出,特斯拉和SpaceX的创始人马斯克正试图通过主动竞购OpenAI来拖延该公司的发展进程
    的头像 发表于 02-12 09:30 788次阅读

    马斯克明确表态:对收购TikTok不感兴趣

    近日,马斯克在德国一技术峰会的线上视频中,首次公开表达了他对收购TikTok的立场——“不感兴趣”。这一表态迅速引发了业界的广泛关注和讨论。 在峰会视频连线环节,马斯克明确表示:“我没有参与
    的头像 发表于 02-10 09:53 835次阅读

    马斯克宣布Grok 3预训练完成,计算量大幅提升

    近日,特斯拉和SpaceX的创始人埃隆·马斯克在社交平台上发布了一条令人瞩目的消息。他宣布,公司研发的最新人工智能模型Grok 3已经完成了预训练阶段,并且其计算量相较于上一代产品Grok
    的头像 发表于 01-06 10:42 1497次阅读

    马斯克预言:AI将全面超越人类智力

    近日,科技巨头马斯克作出了一个关于人工智能(AI)的大胆预测。他断言,AI的发展速度将超乎人类的想象,并将在不久的将来全面超越人类的智力。 马斯克在X平台上明确表示,
    的头像 发表于 12-28 14:23 1173次阅读

    马斯克净资产突破4470亿美元

    近日,据彭博亿万富翁指数最新数据显示,特斯拉公司首席执行官埃隆·马斯克的个人财富已经成功突破4470亿美元大关,这一数字使他成为历史上首位净资产超过4000亿美元的富豪。 马斯克的财富增长主要
    的头像 发表于 12-12 10:22 1865次阅读