0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPT-4发布!多领域超越“人类水平”,专家:国内落后2-3年

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-03-16 01:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)北京时间3月15日凌晨,人工智能研究公司OpenAI正式发布了其下一代大型语言模型GPT-4。目前,ChatGPT的Plus订阅用户已经可以使用GPT-4,其他用户需要排队申请内测。

对于GPT-4的性能,很多国外网友的描述都是“GPT-4,起飞!”

多模态大型语言模型GPT-4

GPT-4被定义为OpenAI发展的另一里程碑,其相较于上一代产品GPT-3.5所带来的提升是巨大的。OpenAI工作人员表示,“我们还在为机器学习模型设计的传统基准上对GPT-4进行了评估。GPT-4大大超过现有的大语言模型,与多数最先进的(SOTA)模型并驾齐驱。”

官方介绍称,GPT-4作为一个多模态大模型(接受图像和文本输入,生成文本),主要在四个方面做了增强。

首先是可以更准确地解决难题,具有更广泛的常识和解决问题的能力。在GPT-3.5时代,ChatGPT的精准度时常被吐槽。GPT-3.5根据从互联网上搜罗的大量文章、网站和社交媒体帖子以及用户与OpenAI雇用的人工雇员的实时英文对话进行训练的,因此在输出结果时,一些错误的源数据,也导致ChatGPT给出的答案看似合理,实际上有很大的漏洞。就以考试来衡量,上一代GPT-3.5在很多专业考试中的成绩都是倒数10%,而GPT-4在已测试的考试中,基本都是高分通过,超越了“人类的水平”。

pYYBAGQRmH2AYkEYAAEG3t1SYV4745.jpg
GPT-4在多项考试中优于GPT-3.5



其次是更具创造性和协作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多问题给出的回答都是很简短的,虽然具备一定的逻辑性,不过在专业人士看来还略显“幼稚”。到了GPT-4,该模型能够处理超过25000个(GPT-3.5是3000个)单词的文本,允许长文内容创建、扩展对话以及文档搜索和分析等用例。在显示过程中,GPT-4可以完成总结文章、写诗这样的创造性任务。

pYYBAGQRmIuAFCE2AABzQOdkOT4460.png

第三点是GPT-4的高级推理能力更强。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定义为“一本正经的胡说八道”,在计算方面的能力更是弱于十四五岁的孩子,约等于八九岁孩子。因此,很多人说如果将ChatGPT比作是一个学生,他在数理化方面是严重偏科的。在GPT-4中,这方面的能力得到了显著的增强。在专业测试和学术基准测试中,GPT-4都表现出了不俗的实力。在官网上,OpenAI用会议预约展示了GPT-4的推理能力,GPT-4明显更“擅长”做这个。

poYBAGQRmJiAeoc9AALPt67zUvE470.png

最后一点是安全性。针对基于GPT-3.5打造的ChatGPT,曾有内测人员通过引导的方式让其表现出攻击性。同时,有很多报道都指出,上一代ChatGPT曾出现辱骂用户、表白用户、诱导用户离婚、监视开发人员等行为。有业内人士在推特上表示,微软需要关闭必应中的类ChatGPT功能,因为系统有时表现得像精神病一样,会给用户错误答案。特斯拉马斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中,与GPT-3.5相比,GPT-4对不允许内容做出回应的可能性降低82%,给出事实性回应的可能性高40% 。

当然,GPT-4也还存在自己的局限性,尤其是在事实性、社会偏见、幻觉和对抗性等方面,需要得到持续的优化。在内部的对抗性事实性评估中,GPT-4的得分比GPT-3.5高40%,很显然这还是不够的。

在发布会当晚,微软表示GPT-4已在新必应搜索引擎上运行。

全行业追赶GPT-4

ChatGPT的火热是有目共睹的,在去年11月30日发布后的5天时间里,收获了100万用户;推出仅仅2个月,月活跃用户就成功过亿,成为历史上增长最快的消费者应用程序。如今,GPT-4的发布进一步延续了这股热潮,甚至是让火烧的更旺了。

为了不让微软或者是OpenAI在该领域一骑绝尘,也为了自己能够在AIGC方面得到更大份额的蛋糕。目前,全球科技巨头都在抓紧时间追赶GPT-4。

为了提升旗下类ChatGPT模型的优化速度,谷歌在博文中宣布正式开放其PaLM大型语言模型API。谷歌表示,“我们看到新一轮的生成性人工智能应用正在改变人们与技术互动的方式。在谷歌,我们希望通过提供易于使用的API和工具,使所有开发人员能够开始用生成性人工智能构建下一代应用程序,从而继续使人工智能变得容易使用。”谷歌于2022年4月宣布PaLM,随后一直在优化。北京时间2月8日晚,谷歌正式发布类ChatGPT应用Bard,不过由于演示中出现事实错误,谷歌因此股价大跌,一天市值蒸发近千亿美元。

目前,谷歌正在全力优化PaLM。北京时间3月7日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿,是GPT-3(参数量为1750亿)参数规模的数倍。

除了谷歌,目前国内科技行业都在关注百度文心一言的发布。百度将于北京时间3月16日下午两点发布自己的类ChatGPT应用文心一言。根据此前的爆料消息,文心一言是百度基于文心大模型技术推出的生成式对话产品,被外界誉为“中国版ChatGPT”。2021年12月,百度与鹏城实验室联合发布共同研发的全球首个知识增强千亿大模型——文心,当时百度首席技术官(CTO)王海峰表示,该模型参数规模达到2600亿,是目前全球最大中文单体模型。这段时间,百度在加班加点地调教文心一言,可能综合实力会比更新的ChatGPT有差距,不过在中文能力上估计会是全球独一档的存在。

针对国内类ChatGPT应用的发展,360周鸿祎表示,ChatGPT比造芯更容易,在国家鼓励性政策的支持下,中国用两三年就能追上美国的水平。不过,在ChatGPT训练必需的通用算力GPU方面,国内和英伟达的总体差距预计在10年左右。

总结

比尔盖茨曾表示,以ChatGPT为代表的人工智能的进步是目前“最重要的”创新,重要性不亚于互联网的发明。目前,全球科技迷对GPT-4趋之若鹜,国内马上也要有自己的“中国版ChatGPT”——文心一言,AIGC掀起的颠覆浪潮已经一浪高过一浪了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)20258月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两
    的头像 发表于 08-09 07:44 1w次阅读
    <b class='flag-5'>GPT</b>-5震撼<b class='flag-5'>发布</b>:AI<b class='flag-5'>领域</b>的重大飞跃

    论马斯克的预言:AI使人类边缘化

    依据 马斯克认为AI已进入“递归式自我改进”阶段,新一代的AI模型由上一代模型参与训练,人类监督的角色正在被边缘化。他预计完全自动化的AI自我改进可能在2026底或2027实现,届时AI的智能
    发表于 03-14 05:27

    一文回顾u-blox 2025新品发布时刻

    2025已经过去,感谢大家的陪伴,今天我们来一起回顾2025发布新品的时刻吧!
    的头像 发表于 03-02 15:50 534次阅读

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布
    的头像 发表于 12-26 08:33 1369次阅读
    重磅更新 | 先楫半导体HPM_APPS v1.10.1<b class='flag-5'>发布</b>

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI新发布GPT-5.1大模型的指令执行能力更强了,可以更
    的头像 发表于 11-13 15:49 820次阅读

    G2发布最新报告,Splashtop 荣膺区域领导者,IT 远程解决方案获全球认可

    近日,全球权威软件评测平台G2发布了2025秋季报告,Splashtop在端点管理、补丁管理、远程支持和远程桌面类别中表现亮眼,荣获多项荣誉。凭借在欧洲、中东和非洲(EMEA)、欧洲、英国和加
    的头像 发表于 10-20 17:02 1322次阅读
    G<b class='flag-5'>2</b><b class='flag-5'>发布</b>最新报告,Splashtop 荣膺<b class='flag-5'>多</b>区域领导者,IT 远程解决方案获全球认可

    【RA4E2开发板评测】PWM 驱动舵机

      本篇使用 RA4E2 的 PWM 输出,来驱动舵机转动,使用 RA4E2 驱动舵机非常方便,只要配置好 GPT PWM 模块,就能轻松实现角度控制。 硬件准备 1、RA4E2 开发
    发表于 09-09 15:13

    【RA4M2-SENSOR】3、使用GPT定时器-PWM输出

    项目01_I2C_OLED复制一份,重命名为02_PWM 查看原理图得知,P102引脚可用GPT功能。 点击configuration.xml文件,按下面几张图所示内容配置。 打开引脚配置界面(Pin
    发表于 09-01 15:20

    阿里通义千问发布小尺寸模型Qwen3-4B,手机也能跑

    、HuggingFace正式开源。在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。在推理领域
    的头像 发表于 08-12 17:15 7023次阅读
    阿里通义千问<b class='flag-5'>发布</b>小尺寸模型Qwen<b class='flag-5'>3-4</b>B,手机也能跑

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5或将发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是OpenAI在2023
    的头像 发表于 08-07 14:13 1.5w次阅读

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1 、Deepseek-V3
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    的推理能力和泛化能力。 在多项基准测试中,DeepSeek-V3的表现优于GPT-4等主流闭源模型,在长文本处理、 代码生成和数学推理等领域展现了顶尖性能。DeepSeek-V3
    发表于 07-17 11:59

    GPT-5即将面市 性能远超GPT-4

    行业芯事
    电子发烧友网官方
    发布于 :2025年06月04日 13:38:23

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布
    的头像 发表于 05-13 11:29 2026次阅读
    重磅更新 | 先楫半导体HPM_APPS v1.9.0<b class='flag-5'>发布</b>

    【RA-Eco-RA4M2开发板评测】RA-Eco-RA4M2 PWM输出

    模块的结构框图 RA4M2系列共有共 8 个GPT定时器(即8个通道), 其中包括 4 个32位GPT定时器(GPT32n (n=0~
    发表于 04-28 22:57