0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

新火种 来源:新火种 作者:新火种 2024-04-02 18:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:文子

编辑:小迪

马斯克又一大招,直逼OpenAI

wKgaomYGwn6AWq_fAAFlRYUDpxk772.jpg

Grok-1.5突然发布,挑战“劲敌”GPT-4

继一周前开源GroK-1后,马斯克又有了新动作,再一次剑指OpenAI。

3月29日,马斯克旗下xAI团队突然对外发布Grok-1.5大模型,主打就是一个“字少事大”。而这一次的动作,明摆着也是冲着GPT-4去的。

wKgZomYGwn6AJzc_AADNTwtMznk719.jpg

从Grok-1.5的基准测试结果来看,各项能力都有巨大的飞跃。其中最明显的改进之一就是在代码和数学相关方面的性能,尤其是涵盖了从小学到高中的各种竞赛问题。

比如在MATH基准测试中,Grok-1.5就取得50.6%的得分;在GSM8K基准测试中,Grok-1.5更获得90%的得分。

而在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5更是超越了GPT-4,得分高达74.1%,同时碾压了一众热门的开源模型 Mistral Large、Claude 2等等。

wKgaomYGwn-ACFdaAACJcF_ryjA170.jpg

另一个重要升级之一就是Grok-1.5改进了推理能力,从原先的24 %提升至50%。该模型现在能够在上下文窗口中处理高达128K token的长文本,这相当于一部中篇小说的篇幅。这一改进使得Grok的处理能力达到了之前上下文长度的16倍,进而能够充分利用长文档中的信息。

此外,Grok-1.5模型还具备处理更长且更复杂的指令的能力,即便在上下文窗口扩大时,也能保持良好的指令遵循性。

无独有偶,在Needle In A Haystack(NIAH)评估中,Grok-1.5还展现出了强大的信息检索技能,能够在一个包含128K字节的上下文中准确检索到嵌入的文本,并实现了完美的检索结果。

wKgZomYGwn-ALkNUAACFRCoIHMo462.jpg

根据xAI官方的介绍,Grok-1.5是基于JAX、Rust和Kubernetes构建的定制分布式训练框架之上。在大型计算集群中,维持大规模语言模型(LLMs)训练作业的稳定性和持续性是关键的挑战之一。xAI团队开发的专属训练协调器,具备自动识别并隔离训练过程中出现的故障节点的先进能力。

此外,xAI团队还对检查点的创建、数据加载以及训练作业的重启流程进行了优化,以降低故障带来的停机时间。

在未来几日内,Grok-1.5将向早期测试者和平台用户开放。随着Grok-1.5逐渐普及至更广泛的用户群体,预计还将推出多项新功能。

全面对战OpenAI,Grok-1.5开源成谜

要知道,这次Grok-1.5发布前,马斯克因为起诉了OpenAI不开源,所以选择开源了3140 亿参数的模型Grok-1,也是截至目前参数量最大的开源大语言模型,规模相当于 Meta LlaMA 2 70B的4.4倍。

其实抛开马斯克本身与OpenAI的恩怨情仇不讲,Grok的开源决策并非仓促决定,而是经过深思熟虑。

表面上看Grok占据着X平台资源优势和马斯克的影响力加持,但在大模型大爆发的当下,却并没有在大模型的“军备竞赛”中有太多竞争优势。

wKgaomYGwn-Abeq1AAA-fnNEOCY033.jpg

特别是自2024年以来,Gemini、Claude 3等模型的发布,它们的能力已经接近甚至超越了GPT-4,这三个模型基本上确立了行业的第一梯队。再加上Mistral AI和Inflection AI也在积极追赶,大模型的“虹吸效应”愈发显著,留给马斯克和Grok的时间已经不多了。

在这种形势下,如果Grok坚持闭源开发的路线,它很可能会像之前诺基亚的Symbian系统一样,被淘汰只是时间问题。这样的结果不仅无法帮助马斯克将X平台商业化,还会成为一种昂贵的沉没成本。

wKgZomYGwoCADAwbAAC09B24yig697.jpg

因此,摆在马斯克面前的只剩下一条路,就是破釜沉舟用“开源”为Grok杀出一条血路。

月之暗面CEO杨植麟就曾表示,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

wKgaomYGwoCALJ9cAAKuz_LseiE904.jpg

而Grok-1自开源5天后,在开源社区GitHub就获得了高达4.2万人的收藏,可见马斯克这一步棋下的赢了民心。

所以哪怕目前Grok 团队并未表示Grok-1.5是否开源,但有Grok-1打了头阵,再加上马斯克和OpenAI的官司,Grok-1.5大概率是要开源的,也就是时间长短的问题。

“all in”和混战,AI反击战打响

如果用一句话来形容现在的AI领域,就是一群疯子在“ALL IN”和混战。全球主流大模型间的比拼,仍没有减慢的迹象。大家你出你的牌,我出我的牌。

在这场混战之中,从马斯克批判GPT背后的大模型滥用会引发人类危机,到亲自下场参与大模型的开发,再到开源Grok-1,这种反差的背后更多不是技术和理念差异,而是商业利益和政治风向的变化。

马斯克的目的也非常明确,就是和OpenAI硬刚到底,推出能够匹敌ChatGPT的产品。

毕竟一旦GPT-4成功跃进到GPT-5,其他AIGC工具也会跟着实现爆发式增长,而这一切都将会大幅抹去X计划中的AI部分,到时马斯克整个商业帝国的基石就会受到严重侵蚀。这种结果对马斯克而言无论是商业考量还是个人心理层面都无法接受,也促使他立马发布了现在的Grok-1.5。

在xAI的官网里也可以看到马斯克的初创团队拥有12名核心成员,其中4名是华人。团队成员曾在人工智能领域的其他知名公司工作过,包括OpenAI、谷歌研究院、微软研究院和最近并入谷歌的DeepMind,也有来自多伦多大学的AI领域顶级学者。

目前xAI也同步开启了招人计划,招揽AI相关的技术人才加入。

wKgaomYGwoGATjfzAABgMfC_nzA606.jpg

其实不止马斯克在加紧脚步,被马斯克视作“宿敌”的OpenAI也在紧锣密鼓的研发大模型。就在最近,有微软工程师爆料,10万个H100基建正在紧锣密鼓地建设中,目的就是为了训练GPT-6。

同时,一张名为“OpenAI内部时间线”的图片也在网上疯传,里面清晰地标注出,OpenAI早在2022年8月-10月之间就开始了GPT-5的训练,在2023年4月就已经开始训练了GPT-4.5,而在去年9月就开始了GPT-6的测试。

wKgZomYGwoKAbTGgAAEXzy5ssFE480.jpg

所以无论消息是真是假,但有一点不可否认,马斯克和OpenAI这场战争似乎看不到终点。

而马斯克的2024年,还有好几场硬仗要打。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42436

    浏览量

    303404
  • GPT
    GPT
    +关注

    关注

    0

    文章

    378

    浏览量

    17051
  • 马斯克
    +关注

    关注

    1

    文章

    862

    浏览量

    22740
  • OpenAI
    +关注

    关注

    9

    文章

    1263

    浏览量

    10389
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    马斯克出手!特斯拉联合谷歌组建“电力联盟”,解决AI电力需求

    电子发烧友网报道(文/梁浩斌)马斯克最近在社交媒体上频繁谈论电力的问题,过去半年,美国本土供电问题已经对AI数据中心造成了不小的冲击,包括微软、Meta等巨头都因为电力问题而导致部分数据中心被迫推迟
    的头像 发表于 03-16 13:47 7163次阅读
    <b class='flag-5'>马斯克</b>出手!特斯拉联合谷歌组建“电力联盟”,解决<b class='flag-5'>AI</b>电力需求

    解决AI电荒难题!马斯克:SpaceX并购xAI,把AI送上太空

    电子发烧友网报道(文/李弯弯)当地时间2月2日,马斯克旗下SpaceX宣布收购同属其旗下的人工智能企业xAI,xAI也证实“加入SpaceX”。马斯克在SpaceX官网发布的备忘录显示,合并后公司
    的头像 发表于 02-04 09:15 6766次阅读

    从18A良率失意到牵手马斯克!英特尔拿回了AI时代的入场券

    代工服务。与此同时,马斯克与英特尔合作的消息也同传来。   可以看到,在AI大模型训练对带宽与功耗提出极致要求,封装技术已经成为决定算力上限的“命门”。英特尔凭借其独特的EMIB技术与IDM 2.0
    的头像 发表于 04-09 09:40 1.1w次阅读
    从18A良率失意到牵手<b class='flag-5'>马斯克</b>!英特尔拿回了<b class='flag-5'>AI</b>时代的入场券

    震惊全球AI界被马斯克点赞的贝赛思学生:“感谢学校鼓励我大胆试错”

    )深耕核心技术研究,取得突破性成果。2026年3月16日,陈广宇作为共同第作者参与的技术论文《Attention Residuals》正式发表,迅速引爆全球AI界。特斯拉CEO埃隆•马斯克公开转发并
    的头像 发表于 04-07 14:58 207次阅读
    震惊全球<b class='flag-5'>AI</b>界被<b class='flag-5'>马斯克</b>点赞的贝赛思学生:“感谢学校鼓励我大胆试错”

    马斯克的预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前,人类终将走向边缘化。以下是对这
    发表于 03-14 05:27

    销量首度被比亚迪超越马斯克却要带特斯拉“去造机器人”?

    在全球电动汽车市场从蓝海转向红海的激烈竞争中,昔日的领跑者特斯拉正面临前所未有的压力。 2025年,特斯拉全球交付量同比下降约8.6%,首次被中国制造商比亚迪超越。与此同时,埃隆·马斯克却将公司
    的头像 发表于 01-20 11:00 434次阅读

    马斯克AI5芯片设计进展顺利,特斯拉AI战略迈入新阶段

    电子发烧友网报道 1月19日,特斯拉首席执行官埃隆·马斯克在社交媒体平台X上宣布,下代自动驾驶芯片AI5的设计已接近完成,并同步重启超级计算机项目Dojo 3的开发工作。   马斯克
    的头像 发表于 01-19 14:05 5981次阅读

    马斯克宣布: A15完成设计,未来芯片迭代快过AMD和英伟达

    1 月 18 日,特斯拉首席执行长伊隆·马斯克(Elon Musk)宣布项雄心勃勃的人工智能(AI)芯片路线图,计划每九个月推出新AI
    的头像 发表于 01-19 10:21 1.8w次阅读
    <b class='flag-5'>马斯克</b>宣布: A15完成设计,未来芯片迭代快过AMD和英伟达

    当光伏飞向太空:霍尔电流传感器如何守护马斯克的100GW“天基电网”?

    最近,“太空光伏”感念随着在马斯克宏大的AI算力卫星计划被炒得火爆,马斯克在社交平台上公开提出,计划未来每年向太空部署高达100吉瓦(GW)的太阳能AI卫星能源网络。这个部署量相当于每
    的头像 发表于 01-12 15:14 3339次阅读
    当光伏飞向太空:霍尔电流传感器如何守护<b class='flag-5'>马斯克</b>的100GW“天基电网”?

    马斯克杀疯了!xAI官宣200亿美元融资,AI赛道再掀狂澜

    电子发烧友网报道 200亿美元!当地时间1月6日,埃隆·马斯克旗下的人工智能公司xAI正式宣布完成E轮融资,远超此前设定的150亿美元目标,估值飙升至2300亿美元。这笔融资不仅刷新了AI初创企业
    的头像 发表于 01-07 17:50 7407次阅读

    看点:马斯克:将深度参与特斯拉芯片设计 华为首款透明天线路由器开售

    给大家带来些业界资讯: 马斯克:将深度参与特斯拉芯片设计  马斯克在社交平台发文宣布本人将深度参与特斯拉AI芯片的设计,每周二和周六与工程团队开会。目标是每年量产
    的头像 发表于 11-25 14:52 1015次阅读

    特斯拉要自建超大型晶圆厂,马斯克:与英特尔合作 “有必要”

    特斯拉CEO马斯克周四(6日) 盘后于股东大会上表示,随着自动驾驶与机器人应用快速扩张,特斯拉需要自行建造座大型晶圆厂,以满足未来庞大的运算需求,并透露公司可能与芯片大厂英特尔展开合作。消息公布后,英特尔闻讯大涨近4%。
    的头像 发表于 11-07 18:07 2524次阅读

    NVIDIA黄仁勋向SpaceX马斯克交付DGX Spark

    革新于星舰基地开始。NVIDIA 创始人兼首席执行官黄仁勋亲手将全球迄今为止最小的 AI 超级计算机 NVIDIA DGX Spark 交付给埃隆·马斯克,拉开了该产品上市的序幕。
    的头像 发表于 10-21 11:12 1240次阅读

    训练量暴增100倍!Grok 4推理碾压,马斯克预言两年内发现新物理定律

        电子发烧友网报道(文/莫婷婷)7月10日,马斯克AI公司xAI正式发布旗舰大模型Grok 4Grok
    的头像 发表于 07-13 06:15 6454次阅读
    训练量暴增100倍!<b class='flag-5'>Grok</b> <b class='flag-5'>4</b>推理碾压,<b class='flag-5'>马斯克</b>预言两年内发现新物理定律

    马斯克的“星链”卫星,大批坠落

    电子发烧友网综合报道 据俄罗斯《共青团真理报》6月8日报道,埃隆·马斯克的太空探索技术公司发射的“星链”卫星接连坠落。由美国国家航空航天局(NASA)戈达德航天中心的物理学家丹尼·奥利维拉领导的研究
    的头像 发表于 06-11 00:07 1.1w次阅读