0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

新火种 来源:新火种 作者:新火种 2024-03-06 22:22 次阅读

2024年第一季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。

3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,Claude 3的出现意味着打开了一个全新的世界,其系列模型在推理,数学,编码,多语言理解和视觉方面,都树立了全新的行业新基准。

wKgZomXofCqAHVbgAALexcwIK9w322.jpg

也正是因为Claude 3的出现,全球最强AI模型一夜易主,曾经被认为不可一世的GPT-4被拉下神坛,Claude 3很可能对GPT-4实现全方位的碾压

Anthropic发布3个模型,全方位实现Claude 3的超强性能。

据悉,本次Anthropic共发布了三个模型,按照性能从低到高,分别是Claude 3 Haiku,Claude 3 Sonnet,以及Claude 3 Opus,并发布了一份长达42页的技术报告。

值得一提的是,此次3个模型的命名是很有讲究的。依照功能的从低到高,它名字的翻译分别是绯句(Haiku),代表性价比之王;十四行诗(Sonnet),代表响应较快,是性能加强版;以及巨作(Opus),堪称性能顶配。

wKgaomXofCuALSXhAAF0xRrhdfU322.jpg

由此可见,Claude 3 Opus在本系列中性能最强大。该模型已在多项AI系统常用评估标准中领先业界LLM,如本科级别专业知识(MMLU),研究生级别专家推理(GPQA),基础数学(GSM8K)等。特别需要说明的是,Claude 3 Opus在处理复杂任务时,其理解和表达能力几乎接近于人类,这意味着人类在AI领域又迈进了一大步。

通过将Claude 3系列模型与同类产品进行对比,我们可以看到,Claude 3 Opus模型性能完全能够碾压GPT-4,以及Gemini 1.0 Ultra;Claude 3 Sonnet在部分基准上,诸如GSM8K,MATH等方面超越了GPT-4;Claude 3 Haiku也可以与Gemini 1.0 Pro相抗衡。

拥有三大核心优势傍身,Claude 3前途无量。

总结Claude 3所具有的优势,主要有以下三点:

性能无短板,擅长长文本优化,显著降低拒绝率。

先来说说性能方面。Claude 3的大语言模型全面赶超了GPT-4,多模态视觉任务处理性能力优秀,在回答复杂开放性问题时的准确率也翻倍提升。特别是当用户直接上传数学,物理这一类考验逻辑和准确度的理科题照片,或者细节丰富的图表时,Claude 3所回复的解题水平和准确率相较于先前版本提高了很多,甚至在一些细节描述上比GPT- 4更胜一筹。在多模态能力方面,Claude 3模型可以从视觉上识别物体,能用复杂的方式思考,既能理解物体的外观,也能理解它与数学等概念的联系。

Anthropic AI研究工程师Emmanuel Ameisen就晒出了一个测试示例:向Opus输入2小时13分钟视频原始文本,每隔5秒截取的屏幕截图等图文素材,它就能成功将其转换成一篇图文并茂的HTML格式博客文章。

wKgZomXofCuATa-PAALtPHU_KA8907.jpg

在文本优化方面,Claude 3也交出了一份令人满意的答卷。要知道,先前的Claude 2.1版本常被吐槽长文本理解效果差,Claude 3便在这个方面做了重点改进,顶配Opus在200K tokens NIAH测试中准确率超过99%,展现了强大的召回能力(1K tokens相当于750个单词)。

此外,Claude 3还显著减少了拒绝回答问题的频率。很多大语言模型会频繁拒绝回答询问,Claude 3则显著改进了这一点,它能够更明确的辨别真正的风险问题,减少无故拒绝回答安全询问的情况。

“OpenAI叛军”完美制衡住了GPT-4,未来的AI王者将鹿死谁手?

Anthropic用一记绝杀将GPT-4拉下了神坛,很多人觉得这是AI新秀的一次胜利。但如果你了解过Anthropic与OpenAI之间潜藏的错综复杂关系的话,就会发现此次Claude 3的胜利,并非偶然。

wKgaomXofCyAObZIAAflRfJQi8E594.jpg

Anthropic究竟是谁?有消息来源表示,Anthropic其实就是原OpenAI员工组建的公司,这些员工因为某些发展理念不合直接出走,并选择“反叛”,最终成为了OpenAI的最强劲敌。

2021年,多名OpenAI员工不满OpenAI在获得微软投资后走向封闭,愤而出走并联合创立了Anthropic。他们对OpenAI在安全问题尚未解决的情况下就直接发布GPT-3的行为感到不满,认为OpenAI已经为追逐利益而“遗忘了初心”。

这一干出走的员工之中就包括打造出GPT-2和GPT-3的研究部门副总裁Dario Amodei。他在2016年进入OpenAI,离开前担任研究副总裁,这绝对是OpenAI的核心位置。离开时,Dario还带走了GPT-3首席工程师Tom Brown,以及担任安全与策略部门副总监的妹妹Daniela Amodei以及10多名心腹,可谓人才多多。这些人才,也最终成为了Anthropic的中流砥柱。

wKgZomXofC2AYiS6AAC9Gw0I32U363.jpg

2023年1月,Claude开启内测,彼时很多网友在第一时间体验了Claude,并表示它比当时的GPT-3强太多。

除了拥有诸多人才,Anthropic如今也获得了强大的资本为其背书,截至目前,它已经获得了包括谷歌,亚马逊科技在内的26个机构或个人的融资,总计融资金额达到了76亿美元。

毫无疑问的是,如今Anthropic的飞速发展和进步令更令业界十分振奋。这个仅诞生3年的大模型初创公司,不是手握顶级人才,更拥有了钞能力和雄厚的计算资源。这说明OpenAI在大模型技术上的领先身位并非遥不可及。坐拥Top级创始成员和精兵强将的创业团队,完全有能力做出与OpenAI风庭抗礼的产品,所消耗的人力,财力,算力资源却只会更少。

Claude 3的横空出世和巨大成功或许会给我们带来一些启发:或许,我们也是有机会和能力来做出超越GPT-4的产品的。

如果单论规模,Anthropic显然不及OpenAI,但它依旧取得了巨大的成功。每每提起AI赛道,我们总会认为这个赛道就是要无止尽的烧钱,卷人才,卷技术。不过,相较于耗费了多大的成本去卷,怎么卷,朝哪个方向卷显然是更重要的事情。毕竟,在AI领域,选择永远大于努力。

或许在不久的未来,OpenAI还会推出令人惊艳的GPT-5,但至少就目前而言,GPT不可战胜的神话已经破灭了。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26458

    浏览量

    264072
  • 人工智能
    +关注

    关注

    1776

    文章

    43871

    浏览量

    230621
  • OpenAI
    +关注

    关注

    8

    文章

    761

    浏览量

    5915
收藏 人收藏

    评论

    相关推荐

    塑料卡片电池横空出世(传统电池被颠覆)

    塑料卡片电池横空出世(传统电池被颠覆) 曾经为几代人的生活提供能量的传统电池,很快将被扔进历史的垃圾箱。英国科学家宣布,
    发表于 02-08 08:44 650次阅读

    OPPO A5青春版横空出世

    集微网消息,前不久OPPO悄悄给专攻线下的A系列手机升级硬件配置,于是A5横空出世
    的头像 发表于 07-11 15:30 6015次阅读

    华为云电脑横空出世

    前不久,华为扔出一颗重磅炸弹:华为云电脑,横空出世!何为“云电脑”?就是不需要你再买硬件,掏出华为手机就能顺畅运行,和电脑一模一样的Windows系统。
    的头像 发表于 01-02 13:37 6997次阅读

    华为云手机横空出世,云手机的运用领域和优势

    9月1日,华为突然扔出一颗重磅炸弹:华为云手机,横空出世
    的头像 发表于 09-13 10:40 5388次阅读

    ChatGPT升级 OpenAI史上最强大模型GPT-4发布

    ChatGPT升级 史上最强大模型GPT-4发布 OpenAI正式推出了ChatGPT升级版本,号称史上最强大模型GPT-4发布。OpenAI期待GPT-4成为一个更有价值的AI工具。
    的头像 发表于 03-15 18:15 2420次阅读

    Open AI团队发推正式宣布:GPT-4来了!

    对于 GPT-4 的实际能力,团队也给大家提前打了一针强心剂,即便 GPT-4 在许多现实世界场景中能力不如人类,但在各种专业和学术基准上的表现,还是超过了人类的平均水平。
    的头像 发表于 03-16 11:10 1697次阅读

    关于GPT-4的产品化狂想

    GPT-4是条件,而不是结果
    的头像 发表于 03-26 10:48 2595次阅读
    关于<b class='flag-5'>GPT-4</b>的产品化狂想

    GPT-4是这样搞电机的

    GPT-4写电机基础程序没问题
    的头像 发表于 04-17 09:41 674次阅读
    <b class='flag-5'>GPT-4</b>是这样搞电机的

    Auto GPT横空出世,力推算力设施

    Auto GPT 区别于传统 GPT,可在没有任何用户指导的情况下搜索互联网和执行保存文件等操作的能力: 如下图所示,Auto GTP 在 GitHub 上的展示任务为为即将到来的复活节等活动发现和生成独特的原始食谱,Auto GPT
    的头像 发表于 04-18 10:07 731次阅读

    OpenAI已为GPT-5申请商标,GPT-5要来了?

    OpenAI 此前曾在前几代模型(例如 GPT-4GPT-3.5)的商标申请中,使用过同样的“用于使用语言模型的可下载计算机软件”这一描述。但很遗憾,最新申请文件中透露的唯一关键细节就只有“GPT-5”字样,并不代表 Op
    的头像 发表于 08-02 15:51 474次阅读
    OpenAI已为<b class='flag-5'>GPT-5</b>申请商标,<b class='flag-5'>GPT-5</b>要来了?

    OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!

    目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4“正在增强”。
    的头像 发表于 09-20 17:34 859次阅读
    OpenAI最新大模型曝光!剑指多模态,<b class='flag-5'>GPT-4</b>之后最大升级!

    火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 769次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|谷歌深夜发布复仇神器Gemini,原生多模态碾压<b class='flag-5'>GPT-4</b>?

    火种AI|GPT-5前瞻!GPT-5将具备哪些新能力?

    被《时代》杂志评为“2023年度CEO”。 也正因此, Sam Altman的一条推文,瞬间就可以成为轰动整个AI行业的信号,特别是当这条推文还与万众期待的“GPT-5”有关的时候。 2023年平安夜
    的头像 发表于 01-16 21:02 149次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|<b class='flag-5'>GPT-5</b>前瞻!<b class='flag-5'>GPT-5</b>将具备哪些新能力?

    全球最强大模型易主,GPT-4被超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude 3系列在推理、数学、编码、多语言理
    的头像 发表于 03-05 09:58 272次阅读

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GPT-4 Turbo模型,这无疑将使得
    的头像 发表于 03-13 13:42 251次阅读