0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|GPT-5前瞻!GPT-5将具备哪些新能力?

新火种 来源:新火种 作者:新火种 2024-01-16 21:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:小岩

编辑:彩云

Sam Altman在整个AI领域,乃至整个科技领域都被看作是极具影响力的存在,而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感,他甚至被《时代》杂志评为“2023年度CEO”。

也正因此, Sam Altman的一条推文,瞬间就可以成为轰动整个AI行业的信号,特别是当这条推文还与万众期待的“GPT-5”有关的时候。

wKgZomWmfnGANHA7AAO4nPOGZYA830.jpg

2023年平安夜,Sam Altman在社交平台大胆公布了2024年的雄心壮志。他所发表的关键词不仅涵盖了2024年OpenAI的整体规划,更契合了用户的迫切需求。这其中包括:

AGI(请耐心等待)

GPT-5

更好的语音模式

更高的费率限制

更好的GPT

更好的推理

对工作/行为程度的控制

视频

个性化

更好的浏览

“使用OpenAi登录”

开放源代码

Sam Altman透露,OpenAI计划在接下来的一年内实现多个令人瞩目的里程碑。其中所涉及到的内容,不仅仅一次简单的技术更新,更是一场至关重要的AI变革。当然,最受关注的,还是GPT-5。

wKgaomWmfnGAdJutAAURv8P-WdQ839.jpg

AI领域的开源与闭源之争:类似于AndroidIOS之争。

对于AI界来说,大家除了关心 GPT-5能否在技术壁垒上有所突破,更关心一个重点:GPT-5能否实现开源?

大模型的开源和闭源之争一直是行业内争论的焦点,这种争论,与移动互联网时代的Android与IOS之争有异曲同工之妙。有意思的是,各个AI大厂对于开源还是闭源的选择也不尽相同。

目前拔得头筹的OpenAI的GPT-4和百度的文心一言都坚持闭源,Meta选择了开源的道路,相继面向“学术研究用途”开源了LLaMA和LLaMA-2模型。百川智能则兼具开源和闭源,在学术领域选择了开源,使用7B和13B两种尺寸的大模型;商业探索上将53B闭源,以保护商业利益和技术的竞争优势。

wKgZomWmfnKAYrgqAAjq9QaR8EQ770.jpg

GPT的闭源,为OpenAI带来了可观的收入。据The Information报道,OpenAI CEO Sam Altman对员工表示,公司正以每年13亿美元(约合人民币94.93亿元)的速度产生收入,平均每月收入超过1亿美元,相较于去年全年2800万美元增长超过450倍,达4542%。这个数据也比3个月前预期的年收入高30 %。这也让2023年成为OpenAI公司成立8年来,收入增长最快的一年。而这些,恰恰是GPT-4闭源所带来的。

关键词:GPT-5能实现开源吗?

那么,GPT-5能实现开源吗?未必。

对于商业模式,OpenAI曾在官网中明确指出“打算继续免费提供ChatGPT”,但也会选择从付费的高级服务的用户和企业中获得收入。而且,虽然OpenAI嘴上说着“不指望在近期内盈利”,但考虑到开发和提供大模型的高成本,生存问题仍然是其不得不面对的挑战。

此外,尽管OpenAI实现了快速增长,但背后的行业成本却不容忽略。根据公开信息显示,2022 年,OpenAI开发GPT-4,仅训练成本支出约5.4亿美元。2023年4月,OpenAI每天为ChatGPT支付的运营成本约694.4万美元(其中主要是电费) ,年化运营成本约为2.5亿美元,综合年化成本可能超过13亿美元。毫无疑问,OpenAI依旧处于亏损阶段。

所以,倘若没有商业化的维持,OpenAI恐怕很快会迎来破产。更重要的是,已经通过GPT-4闭源尝到甜头,获得大量收入的OpenAI,显然没有充足的理由将GPT-5完全开源,这无异于自毁壁垒,在大模型赛道的竞逐中丧失领先优势。从这个层面来说。GPT-5实现开源的概率不大。

即便Sam Altman在推文中将“开源”标注成了关键词,但更多的也只是在迎合行业的呼声,我们还不能将其解读为“企业2024年的发展目标”。

不过,“部分开源”的可能性并非没有。GPT-5完全开源的可能性虽然比较小,但是为了GPT相关生态建设,对与GPT相关的工具集提供开源的可能性却很高。或许,OpenAI会通过为较少部分提供开源的方式,为开发者的开发,调试,分享提供便利。

未来的GPT-5,究竟会具备哪些新能力?

近日,艾伦人工智能研究所发布了Unified-IO 2,它的发布极具意义,因为它可以帮助我们更好的预判GPT-5的能力。

为什么这么说呢?Unified与ChatGPT之间存在着怎样的关系?

事实上,早在2022年6月,艾伦人工智能研究所就推出了第一代Unified-IO,它是首批能够处理图像和语言的多模态模型之一。大约在同一时间,OpenAI正在内部测试GPT-4,并在2023年3月正式发布。所以,Unified-IO可以看作是对于未来大规模AI模型的前瞻。换句话说,因为Unified-IO 2的出现,我们可以大致预判一点:OpenAI可能正在内部测试GPT-5,并很有可能在几个月后发布。

wKgaomWmfnKAA1qsAAxSX32zbmo262.jpg

艾伦人工智能研究所推出的Unified-IO 2是第一个可以处理和生成文本,图像,音频,视频和动作序列的模型。这个新的高级人工智能模型使用几十亿个数据点进行训练,虽然模型大小只有7B,却展现出迄今为止最广泛的多模态能力。它的训练数据包括:10亿个图像-文本对,1 万亿个文本标记,1.8亿个视频剪辑,1.3亿张带文本的图像,300万个3D资产和100万个机器人代理运动序列。研究团队将总共120多个数据集组合成一个600 TB的包,涵盖220个视觉,语言,听觉和动作任务。Unified-IO 2采用编码器-解码器架构,并进行了一些更改,以稳定训练并有效利用多模态信号。

模型可以回答问题,根据指令撰写文本、以及分析文本内容;可以识别图像内容,提供图像描述,执行图像处理任务,并根据文本描述创建新图像;可以根据描述或说明生成音乐或声音,以及分析视频并回答有关视频的问题。此外,通过使用机器人数据进行训练,Unified-IO 2还可以为机器人系统生成动作,例如将指令转换为机器人的动作序列。由于多模态训练,它还可以处理不同的模态,例如,在图像上标记某个音轨使用的乐器等。

总体而言,Unified-IO 2在超过35个基准测试中表现良好,包括图像生成和理解,自然语言理解,视频和音频理解以及机器人操作。在大多数任务中,它能够比肩专用模型,甚至更胜一筹。在图像任务的GRIT基准测试中,Unified-IO 2获得了目前的最高分。通过这些,我们也可以更好的窥见未来GPT-5的模样。

对于AI发展而言,科技生态与商业化是缺一不可的核心要素。技术和应用的发展需要商业化提供必要的支持和保障;而商业化的成功也离不开生态环境的建设。两者之间必须相辅相成,有机结合。希望在未来发布的GPT-5中,OpenAI可以起到先导作用,率先实现生态与商业化之间的平衡。



审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296681
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16715
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    硬刚GPT-5!这款中国开源AI模型拿下全球第一,有何杀手锏?

    11月17日,阿里巴巴正式宣布“千问”项目全力进军AI to C市场。目前,千问App公测版已经在各大应用商店上架,并且同步提供网页版和PC版,与ChatGPT展开全面竞争,未来计划地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问APP,使其
    的头像 发表于 11-19 07:08 1.1w次阅读
    硬刚<b class='flag-5'>GPT-5</b>!这款中国开源<b class='flag-5'>AI</b>模型拿下全球第一,有何杀手锏?

    GPT-5震撼发布:AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,更以多维度性能
    的头像 发表于 08-09 07:44 9874次阅读
    <b class='flag-5'>GPT-5</b>震撼发布:<b class='flag-5'>AI</b>领域的重大飞跃

    正面对决GPT-5和Germini-3,DeepSeek-V3.2震撼发布

    达到了GPT-5的水平,DeepSeek-V3.2首次“思考模式(thinking mode)”与工具使用深度整合,成为其下一代 AI 助理(AI agent)策略的核心布局。
    的头像 发表于 12-02 14:10 8056次阅读
    正面对决<b class='flag-5'>GPT-5</b>和Germini-3,DeepSeek-V3.2震撼发布

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI新发布的GPT-5.1大模型的指令执行能力更强了,可以更
    的头像 发表于 11-13 15:49 544次阅读

    【RA4M2-SENSOR】3、使用GPT定时器-PWM输出

    递的平均功率, 根据面积等效法则,可以通过对改变脉冲的时间宽度,来等效地获得所需要合成的相应幅值和频率的波形。 PWM 有着非常广泛的应用,比如直流电机控制、开关电源、逆变器等等。 配置GPT-PWM
    发表于 09-01 15:20

    AI Agent如何重构互联范式

    近日,在OpenAI发布GPT-5模型14天后,深度求索的新模型版本DeepSeek-V3.1正式发布。
    的头像 发表于 08-28 09:58 717次阅读
    <b class='flag-5'>AI</b> Agent如何重构互联范式

    微软企业级应用AI能力全面升级

    微软宣布,已将 OpenAI 迄今为止最具突破性的的 AI 技术系统 GPT-5 全面集成至其产品生态中,全面增强平台的的推理、代码生成与对话体验。最新版 GPT-5 已在 Microsoft
    的头像 发表于 08-15 11:44 1100次阅读

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是OpenAI在2023年的3月份推出自然语言处理模型GPT-4之后,两
    的头像 发表于 08-07 14:13 8823次阅读

    GPT-5即将面市 性能远超GPT-4

    行业芯事
    电子发烧友网官方
    发布于 :2025年06月04日 13:38:23

    OpenAI即将发布GPT-4.5与GPT-5

    近日,OpenAI的首席执行官Sam Altman在社交平台上透露了公司即将推出的重大计划。据他透露,OpenAI计划在不久的将来连续发布两款重要的AI算法——GPT-4.5和GPT-5。 据悉
    的头像 发表于 02-13 13:43 1031次阅读

    今日看点丨OpenAI发布新的GPT-4.5模型;三星西安工厂升级286层NAND闪存工艺

    ,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型整合OpenAI的大量技术,包括o3,并应用于聊天机器人C
    发表于 02-13 11:22 666次阅读

    OpenAI即将推出GPT-5模型

    OpenAI首席执行官奥尔特曼近日宣布了一项重要消息:OpenAI将在今年未来几个月内推出全新的GPT-5模型。这一消息引起了业界的广泛关注和期待。 据了解,GPT-5模型整合OpenAI的大量
    的头像 发表于 02-13 11:21 914次阅读

    OpenAI CEO预告GPT-4.5及GPT-5未来规划

    全新的GPT-5模型。这一模型整合包括o3在内的多项OpenAI先进技术,旨在为用户带来更加智能、高效的使用体验。值得注意的是,免费版的ChatGPT也将在标准智能设置下无限制地使用GPT-5进行对话,这无疑
    的头像 发表于 02-13 10:02 748次阅读

    GPT-5研发进度滞后,成果与成本不匹配

    近日,OpenAI正在紧锣密鼓地研发的下一代大型语言模型GPT-5,其研发进度已落后于原计划。这一消息引起了业界的广泛关注。 报道指出,尽管OpenAI在GPT-5的研发上投入了大量的人力、物力
    的头像 发表于 12-23 14:16 800次阅读

    OpenAI GPT-5开发滞后:训练成本高昂

    近日,据最新消息,OpenAI在推进其备受期待的下一代旗舰模型GPT-5的开发进程上遇到了困难。由于计算成本高昂且高质量训练数据稀缺,GPT-5的开发已经落后于原定计划半年之久。 据悉,OpenAI
    的头像 发表于 12-23 11:04 1431次阅读