0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPT-4发布!多领域超越“人类水平”,专家:国内落后2-3年

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-03-16 01:58 次阅读

电子发烧友网报道(文/吴子鹏)北京时间3月15日凌晨,人工智能研究公司OpenAI正式发布了其下一代大型语言模型GPT-4。目前,ChatGPT的Plus订阅用户已经可以使用GPT-4,其他用户需要排队申请内测。

对于GPT-4的性能,很多国外网友的描述都是“GPT-4,起飞!”

多模态大型语言模型GPT-4

GPT-4被定义为OpenAI发展的另一里程碑,其相较于上一代产品GPT-3.5所带来的提升是巨大的。OpenAI工作人员表示,“我们还在为机器学习模型设计的传统基准上对GPT-4进行了评估。GPT-4大大超过现有的大语言模型,与多数最先进的(SOTA)模型并驾齐驱。”

官方介绍称,GPT-4作为一个多模态大模型(接受图像和文本输入,生成文本),主要在四个方面做了增强。

首先是可以更准确地解决难题,具有更广泛的常识和解决问题的能力。在GPT-3.5时代,ChatGPT的精准度时常被吐槽。GPT-3.5根据从互联网上搜罗的大量文章、网站和社交媒体帖子以及用户与OpenAI雇用的人工雇员的实时英文对话进行训练的,因此在输出结果时,一些错误的源数据,也导致ChatGPT给出的答案看似合理,实际上有很大的漏洞。就以考试来衡量,上一代GPT-3.5在很多专业考试中的成绩都是倒数10%,而GPT-4在已测试的考试中,基本都是高分通过,超越了“人类的水平”。

pYYBAGQRmH2AYkEYAAEG3t1SYV4745.jpg
GPT-4在多项考试中优于GPT-3.5



其次是更具创造性和协作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多问题给出的回答都是很简短的,虽然具备一定的逻辑性,不过在专业人士看来还略显“幼稚”。到了GPT-4,该模型能够处理超过25000个(GPT-3.5是3000个)单词的文本,允许长文内容创建、扩展对话以及文档搜索和分析等用例。在显示过程中,GPT-4可以完成总结文章、写诗这样的创造性任务。

pYYBAGQRmIuAFCE2AABzQOdkOT4460.png

第三点是GPT-4的高级推理能力更强。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定义为“一本正经的胡说八道”,在计算方面的能力更是弱于十四五岁的孩子,约等于八九岁孩子。因此,很多人说如果将ChatGPT比作是一个学生,他在数理化方面是严重偏科的。在GPT-4中,这方面的能力得到了显著的增强。在专业测试和学术基准测试中,GPT-4都表现出了不俗的实力。在官网上,OpenAI用会议预约展示了GPT-4的推理能力,GPT-4明显更“擅长”做这个。

poYBAGQRmJiAeoc9AALPt67zUvE470.png

最后一点是安全性。针对基于GPT-3.5打造的ChatGPT,曾有内测人员通过引导的方式让其表现出攻击性。同时,有很多报道都指出,上一代ChatGPT曾出现辱骂用户、表白用户、诱导用户离婚、监视开发人员等行为。有业内人士在推特上表示,微软需要关闭必应中的类ChatGPT功能,因为系统有时表现得像精神病一样,会给用户错误答案。特斯拉马斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中,与GPT-3.5相比,GPT-4对不允许内容做出回应的可能性降低82%,给出事实性回应的可能性高40% 。

当然,GPT-4也还存在自己的局限性,尤其是在事实性、社会偏见、幻觉和对抗性等方面,需要得到持续的优化。在内部的对抗性事实性评估中,GPT-4的得分比GPT-3.5高40%,很显然这还是不够的。

在发布会当晚,微软表示GPT-4已在新必应搜索引擎上运行。

全行业追赶GPT-4

ChatGPT的火热是有目共睹的,在去年11月30日发布后的5天时间里,收获了100万用户;推出仅仅2个月,月活跃用户就成功过亿,成为历史上增长最快的消费者应用程序。如今,GPT-4的发布进一步延续了这股热潮,甚至是让火烧的更旺了。

为了不让微软或者是OpenAI在该领域一骑绝尘,也为了自己能够在AIGC方面得到更大份额的蛋糕。目前,全球科技巨头都在抓紧时间追赶GPT-4。

为了提升旗下类ChatGPT模型的优化速度,谷歌在博文中宣布正式开放其PaLM大型语言模型API。谷歌表示,“我们看到新一轮的生成性人工智能应用正在改变人们与技术互动的方式。在谷歌,我们希望通过提供易于使用的API和工具,使所有开发人员能够开始用生成性人工智能构建下一代应用程序,从而继续使人工智能变得容易使用。”谷歌于2022年4月宣布PaLM,随后一直在优化。北京时间2月8日晚,谷歌正式发布类ChatGPT应用Bard,不过由于演示中出现事实错误,谷歌因此股价大跌,一天市值蒸发近千亿美元。

目前,谷歌正在全力优化PaLM。北京时间3月7日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿,是GPT-3(参数量为1750亿)参数规模的数倍。

除了谷歌,目前国内科技行业都在关注百度文心一言的发布。百度将于北京时间3月16日下午两点发布自己的类ChatGPT应用文心一言。根据此前的爆料消息,文心一言是百度基于文心大模型技术推出的生成式对话产品,被外界誉为“中国版ChatGPT”。2021年12月,百度与鹏城实验室联合发布共同研发的全球首个知识增强千亿大模型——文心,当时百度首席技术官(CTO)王海峰表示,该模型参数规模达到2600亿,是目前全球最大中文单体模型。这段时间,百度在加班加点地调教文心一言,可能综合实力会比更新的ChatGPT有差距,不过在中文能力上估计会是全球独一档的存在。

针对国内类ChatGPT应用的发展,360周鸿祎表示,ChatGPT比造芯更容易,在国家鼓励性政策的支持下,中国用两三年就能追上美国的水平。不过,在ChatGPT训练必需的通用算力GPU方面,国内和英伟达的总体差距预计在10年左右。

总结

比尔盖茨曾表示,以ChatGPT为代表的人工智能的进步是目前“最重要的”创新,重要性不亚于互联网的发明。目前,全球科技迷对GPT-4趋之若鹜,国内马上也要有自己的“中国版ChatGPT”——文心一言,AIGC掀起的颠覆浪潮已经一浪高过一浪了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    全球最强大模型易主,GPT-4超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所
    的头像 发表于 03-05 09:58 266次阅读

    全球最强大模型易主:GPT-4超越,Claude 3系列崭露头角

    近日,人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键指标上展现出卓越性能,成功超越了此前被广泛认为是全球最强AI模型的
    的头像 发表于 03-05 09:42 243次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能分析解答 在最近的OpenAI DevDay上,该组织发布了一项备受期待的公告:推出GPT-4 Turbo,这是对其突破
    的头像 发表于 12-13 09:19 589次阅读
    ChatGPT plus有什么功能?OpenAI <b class='flag-5'>发布</b> <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能

    新火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 766次阅读
    新火种AI|谷歌深夜<b class='flag-5'>发布</b>复仇神器Gemini,原生多模态碾压<b class='flag-5'>GPT-4</b>?

    OpenAI发布GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAI的GPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在人工智能领域的一次里程碑式活动中,OpenAI开发者大会上发布GPT-4 Turbo,这是突破性人工智
    的头像 发表于 12-05 17:57 1438次阅读
    OpenAI<b class='flag-5'>发布</b>的<b class='flag-5'>GPT-4</b> Turbo版本ChatGPT plus有什么功能?

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI算是全球大模型的引领者,一举一动都牵动着大家的关注,现在ChatGPT迎来重磅更新。 OpenAI
    的头像 发表于 11-07 18:20 2155次阅读
    ChatGPT重磅更新 OpenAI<b class='flag-5'>发布</b><b class='flag-5'>GPT-4</b> Turbo模型价格大降2/3

    GPT-4没有推理能力吗?

    今年三月,OpenAI 重磅发布GPT-4 大模型,带来了比 ChatGPT 背后 GPT-3.5 更强的推理、计算、逻辑能力,也引发了全民使用的热潮。在各行各领域研究人员、开发者
    的头像 发表于 08-11 14:20 666次阅读
    <b class='flag-5'>GPT-4</b>没有推理能力吗?

    GPT-3.5 vs GPT-4:ChatGPT Plus 值得订阅费吗 国内怎么付费?

    GPT-3.5 vs GPT-4:ChatGPT Plus值得订阅费吗?ChatGPT Plus国内如何付费?  ChatGPT-3.5一切都很好,但ChatGPT-4(通过ChatGPT Plus
    的头像 发表于 08-02 12:09 2979次阅读
    <b class='flag-5'>GPT</b>-3.5 vs <b class='flag-5'>GPT-4</b>:ChatGPT Plus 值得订阅费吗 <b class='flag-5'>国内</b>怎么付费?

    gpt-4怎么用 英特尔Gaudi2加速卡GPT-4详细参数

    介绍GPT-4 详细参数及英特尔发布 Gaudi2 加速器相关内容,对大模型及 GPU 生态进行探讨和展望。英特尔发布高性价比Gaudi2加速卡GPT4详细参数分析。
    发表于 07-21 10:50 620次阅读
    <b class='flag-5'>gpt-4</b>怎么用 英特尔Gaudi2加速卡<b class='flag-5'>GPT-4</b>详细参数

    直播倒计时 | 《GPT 时代人类再腾飞》新书共读

    GPT 时代人类再腾飞》是全球首部由 ChatGPT 与人类合著的创新力作,全书以领英创始人、OpenAI 早期投资人里德·霍夫曼与 GPT-4 的对话为主线,展现了
    的头像 发表于 07-19 00:15 375次阅读
    直播倒计时 | 《<b class='flag-5'>GPT</b> 时代<b class='flag-5'>人类</b>再腾飞》新书共读

    OpenAI宣布GPT-4 API全面开放使用!

    OpenAI 在博客文章中写道:“自 3 月份以来,数百万开发者请求访问 GPT-4 API,并且利用 GPT-4 的创新产品范围每天都在增长。” “我们设想基于对话的模型未来可以支持任何用例。”
    的头像 发表于 07-12 14:55 873次阅读

    GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%

    来源:新智元 最近,一项有关GPT-4的创造力思维测试火了。 来自蒙大拿大学和UM Western大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在
    的头像 发表于 06-25 10:35 265次阅读
    <b class='flag-5'>GPT-4</b>创造力竟全面碾压<b class='flag-5'>人类</b>!最新创造力测试<b class='flag-5'>GPT</b>4排名前1%

    GPT-4已经会自己设计芯片了吗?

      GPT-4已经会自己设计芯片了!芯片设计行业的一个老大难问题HDL,已经被GPT-4顺利解决。并且,它设计的130nm芯片,已经成功流片。 GPT-4,已经可以帮人类造芯片了! 只
    的头像 发表于 06-20 11:51 599次阅读
    <b class='flag-5'>GPT-4</b>已经会自己设计芯片了吗?

    GPT-4处于一个什么样的编码地位

      面试环节第一步——回答问题,写软件需求 面试环节第二步——上手写代码 测试用例   比 ChatGPT 背后 GPT-3.5 更为强大的模型 GPT-4,已正式对外发布。在 OpenAI 官方
    的头像 发表于 06-16 10:42 431次阅读
    <b class='flag-5'>GPT-4</b>处于一个什么样的编码地位

    GPT-4 的模型结构和训练方法

    GPT-4发布报道上,GPT-4 的多模态能力让人印象深刻,它可以理解图片内容给出图片描述,甚至能在图片内容的基础上理解其中的隐喻或推断下一时刻的发展。
    的头像 发表于 05-22 15:21 1984次阅读
    <b class='flag-5'>GPT-4</b> 的模型结构和训练方法