0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPT-4多模态模型发布,对ChatGPT的升级和断崖式领先

智能计算芯世界 来源:量子位、网络整理 2023-03-17 10:31 次阅读

3 月14日晚,OpenAI 宣布发布 GPT-4。

此次的 GPT4.0 产品具备多模态, 相比于 GPT-3.5,GPT4.0 新增视频功能,并且能够适用于所有语言。GPT-4.0 有 望加速 AIGC 的应用普及,并且在视频内容生成方面大放异彩,AIGC 有望步入快 速发展阶段,背后大幅增长的训练参数量有望加速 AI 算力的建设以及高速光通信 的需求。OpenAI 发布了一项新服务,允许开发人员直接使用 ChatGPT,并且将使 用价格削减了 90%,此次大规模降价意味着底层技术平台的优化,这也将进一步 加速此项技术的大规模商业化进程。

而且 GPT-4 是多模态的,同时支持文本和图像输入功能。此外,GPT-4 比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这也使得它的运行成本更高。

ceb6641e-c430-11ed-bfe3-dac502259ad0.png

GPT-4 在一系列基准测试中的表现优于 GPT-3.5

OpenAI 称它使用了微软 Azure 来训练模型,但没有公布有关具体模型大小或用于训练它的硬件的详细信息

据悉,GPT-4 参加了多种基准考试测试,包括美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、“美国高考”SAT 数学部分和证据性阅读与写作部分的考试,在这些测试中,它的得分高于 88% 的应试者。

OpenAI 表示,已经与多家公司合作,要将 GPT-4 结合到他们的产品中,包括 Duolingo、Stripe 和 Khan Academy。GPT-4 模型也将以 API 的形式,提供给付费版 ChatGPT Plus 的订阅用户,允许开发者付费将 AI 集成到他们的应用程序中。微软表示,新款的必应(Bing)搜索引擎将运行于 GPT-4 系统之上。

一觉醒来,万众期待的GPT-4,它来了!

OpenAI老板Sam Altman直接开门见山地介绍说:

这是我们迄今为止功能最强大的模型!

cece9bb0-c430-11ed-bfe3-dac502259ad0.png

有多强?

根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,也就是说,它的输入可以是文字(上限2.5万字),还可以是图像。

(看图)手套掉下去会怎样? 它会掉到木板上,并且球会被弹飞。

cedfd0ec-c430-11ed-bfe3-dac502259ad0.gif

甚至只需要简单在纸上画一个网站的草稿图:

cfd57dee-c430-11ed-bfe3-dac502259ad0.gif

拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!

d6415298-c430-11ed-bfe3-dac502259ad0.gif

在性能表现上,OpenAI直接甩出一句话:

在各种专业和学术基准上和人类相当!

而且不只是发布GPT-4这么简单,OpenAI这次“啪的一下”把相关“大动作”一步到位了:

ChatGPT Plus:集成GPT-4的ChatGPT升级版

发布GPT-4的API

公布技术论文 * 公开System Card

不仅如此,传闻的“必应早就用上了GPT-4”在今天也得到了微软方面的证实:

没错,确实是这样的!

d6bd6fd6-c430-11ed-bfe3-dac502259ad0.png

不得不说,自打ChatGPT问世以来,微软和谷歌之间打响的数轮科技战役,微软这次又双叒叕赢麻了。

甚至这一次,不少网友都发出了“见证历史”的感慨:

d6e2ba5c-c430-11ed-bfe3-dac502259ad0.png

史上最强大模型

正如之前传言,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容。

并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。

升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当。

比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。

做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。

d6f09014-c430-11ed-bfe3-dac502259ad0.png

那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示。

首先,看图能力可以用来解释表情包、梗图。

提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:

用巨大的过时VGA接口给小巧的现代智能手机充电。

d6fd08da-c430-11ed-bfe3-dac502259ad0.png

更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。

d72a0600-c430-11ed-bfe3-dac502259ad0.png

甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。

d7549f96-c430-11ed-bfe3-dac502259ad0.png

文字输入长度限制的增加,也大大扩展了GPT-4的实用性。

发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。

出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。

d79a3df8-c430-11ed-bfe3-dac502259ad0.gif

再最后附上出现的问题,在几秒钟内瞬间得到解决办法。

d7b24f42-c430-11ed-bfe3-dac502259ad0.png

在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。

之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。

现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底。

d87a0ece-c430-11ed-bfe3-dac502259ad0.png

也可以指定之后所有回答的形式,比如全用json格式。

d92c23ca-c430-11ed-bfe3-dac502259ad0.png

虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。

从前面的官方示例也可以看出,要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt)。

操作起来也非常简单,只需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。

谷歌依旧在跟

就在GPT-4发布前,谷歌方面为了迎战微软,宣布将一系列即将推出的AIGC功能,应用到自家产品中。

包括谷歌 Docs(文档)、Gmail、Sheets(表格)和 Slides(幻灯片)。

d9572318-c430-11ed-bfe3-dac502259ad0.png

但不同于微软和OpenAI的“发布即可用”,谷歌只会先将Docs和Gmail中的AI工具,在月底提供给一些“值得信赖的开发人员”。

而其它功能则将是在今年晚些时候向公众开放。

至于具体时间,谷歌方面并没有具体说明。

而外界对此评价是谷歌希望抢先微软原定于本周四的发布。

但从今天的结果上来看,微软依旧提前“抢滩登陆”。

d9f0f72c-c430-11ed-bfe3-dac502259ad0.png

在GPT-4发布之前,便有网友做出了GPT-3和GPT-4参数量的对比图,并猜测GPT-4的参数量将达到100万亿。

这一次亦是如此。

有网友预言,未来GPT-5的参数量,会是这样的:

da038ce8-c430-11ed-bfe3-dac502259ad0.png

但无论如何,这一次,我们离真·人工智能,更近了一步。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1775

    文章

    43704

    浏览量

    230486
  • ChatGPT
    +关注

    关注

    27

    文章

    1403

    浏览量

    4529

原文标题:GPT-4多模态模型发布,对ChatGPT的升级和断崖式领先

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级GPT-4取得显著进步,如今再次更新至性能卓越的GP
    的头像 发表于 03-13 13:42 231次阅读

    OpenAI推出ChatGPT新功能:朗读,支持37种语言,兼容GPT-4GPT-3

    据悉,“朗读”功能支持37种语言,且能够自主识别文本类型并对应相应的发音。值得关注的是,该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“多模态
    的头像 发表于 03-05 15:48 255次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能分析解答 在最近的OpenAI DevDay上,该组织发布了一项备受期待的公告:推出GPT-4 Turbo,这是对其突破
    的头像 发表于 12-13 09:19 574次阅读
    <b class='flag-5'>ChatGPT</b> plus有什么功能?OpenAI <b class='flag-5'>发布</b> <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能

    新火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 755次阅读
    新火种AI|谷歌深夜<b class='flag-5'>发布</b>复仇神器Gemini,原生多<b class='flag-5'>模态</b>碾压<b class='flag-5'>GPT-4</b>?

    OpenAI发布GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAI的GPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在人工智能领域的一次里程碑式活动中,OpenAI开发者大会上发布GPT-4 Turbo,这是突破性人工智能模型
    的头像 发表于 12-05 17:57 1400次阅读
    OpenAI<b class='flag-5'>发布</b>的<b class='flag-5'>GPT-4</b> Turbo版本<b class='flag-5'>ChatGPT</b> plus有什么功能?

    OpenAI发生严重故障 GPT-4 Turbo模型太火爆 ChatGPT停服两小时

    OpenAI发生严重故障 ChatGPT停服两小时 就在前两天OpenAI首届开发者大会广受关注,OpenAI才发布了超级重磅的更新,发布GPT-4 Turbo
    的头像 发表于 11-09 15:35 796次阅读

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI算是全球大模型的引领者,一举一动都牵动着大
    的头像 发表于 11-07 18:20 2146次阅读
    <b class='flag-5'>ChatGPT</b>重磅更新 OpenAI<b class='flag-5'>发布</b><b class='flag-5'>GPT-4</b> Turbo<b class='flag-5'>模型</b>价格大降2/3

    ChatGPT Plus怎么支付 GPT4得订阅吗?

    自去年年底 OpenAI 转型发布 ChatGPT 以来,生成式 AI 成为许多硅谷投资者关注的焦点。该聊天机器人使用从互联网和其他地方抓取的大量数据来对人类提示产生预测响应。GPT-4 的许多方面
    的头像 发表于 10-10 12:16 1384次阅读
    <b class='flag-5'>ChatGPT</b> Plus怎么支付 <b class='flag-5'>GPT</b>4得订阅吗?

    OpenAI最新大模型曝光!剑指多模态GPT-4之后最大升级

    目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。CEO奥特曼在回应有关GPT-5的传闻时,也暗示过GPT-4
    的头像 发表于 09-20 17:34 844次阅读
    OpenAI最新大<b class='flag-5'>模型</b>曝光!剑指多<b class='flag-5'>模态</b>,<b class='flag-5'>GPT-4</b>之后最大<b class='flag-5'>升级</b>!

    GPT-4没有推理能力吗?

    今年三月,OpenAI 重磅发布GPT-4模型,带来了比 ChatGPT 背后 GPT-3.5 更强的推理、计算、逻辑能力,也引发了
    的头像 发表于 08-11 14:20 661次阅读
    <b class='flag-5'>GPT-4</b>没有推理能力吗?

    chatGPTGPT4有什么区别

    。它的前身是GPT-1,随后的版本有GPT-2、GPT-3和最新的GPT-4GPT-4与之前的版本相比,预计将会有很多改进和变化。尽管该
    的头像 发表于 08-09 15:18 1754次阅读

    GPT-3.5 vs GPT-4ChatGPT Plus 值得订阅费吗 国内怎么付费?

    每月20美元)更智能、更准确。 OpenAI将GPT-4描述为“比其前身GPT-3.5先进10倍”。 自从OpenAI的大语言模型(LLM)GPT-4
    的头像 发表于 08-02 12:09 2923次阅读
    <b class='flag-5'>GPT</b>-3.5 vs <b class='flag-5'>GPT-4</b>:<b class='flag-5'>ChatGPT</b> Plus 值得订阅费吗 国内怎么付费?

    GPT-4处于一个什么样的编码地位

      面试环节第一步——回答问题,写软件需求 面试环节第二步——上手写代码 测试用例   比 ChatGPT 背后 GPT-3.5 更为强大的模型 GPT-4,已正式对外
    的头像 发表于 06-16 10:42 423次阅读
    <b class='flag-5'>GPT-4</b>处于一个什么样的编码地位

    GPT-4模型结构和训练方法

    GPT-4发布报道上,GPT-4 的多模态能力让人印象深刻,它可以理解图片内容给出图片描述,甚至能在图片内容的基础上理解其中的隐喻或推断下一时刻的发展。
    的头像 发表于 05-22 15:21 1957次阅读
    <b class='flag-5'>GPT-4</b> 的<b class='flag-5'>模型</b>结构和训练方法

    深度:构建GPT-4模型,如何商业落地?

    GPT-4引发海量算力需求,把握算力产业链机会。根据测算,我们认为,在中性假设下,ChatGPT一年产生的API调用费用约为6.2亿美元,与此同时,ChatGPT将在训练和推理层面对GPU产生巨大需求。
    的头像 发表于 05-06 11:24 972次阅读
    深度:构建<b class='flag-5'>GPT-4</b><b class='flag-5'>模型</b>,如何商业落地?