0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型,站在“向下竞底”和“向上定价”的分岔路口

脑极体 来源: 脑极体 作者: 脑极体 2024-05-21 17:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2024年以来,大模型的价格出现了显著的下降趋势,并且是全球性的。

海外AI巨头,OpenAI和谷歌都在五月的新品发布会上,下调了模型调用价格。

OpenAI的GPT-4o支持免费试用,调用API的价格也比GPT-4-turbo降低了一半,为5 美元/百万tokens。谷歌的当家王牌Gemini大模型系列,Gemini 1.5 Flash 的价格为0.35美元/百万tokens,比GPT-4o 便宜得多。

wKgaomZMY7iAD5qNAABN7OFT82M279.jpg

同样的“价格战”,也在国内开打。

5月13日智谱AI上线了新的价格体系,入门级产品GLM-3 Turbo模型,调用价格从5 元/百万tokens,降至1元/百万tokens。紧随其后的字节跳动,正式发布豆包大模型家族,其中的豆包通用模型Pro 32k模型,定价为0.0008元/千tokens。

当一串代表价格的数字,成为各家发布会上最显眼的一页、最广为传播的信息,其他厂商为了不失去曝光度,不流失现有用户,当然也要有所表示,被动跟进,加入“价格战”。

就在今天,5月21日,阿里云也抛出重磅炸弹,宣布通义千问主力模型Qwen-Long,API输入价格降至0.0005元/千tokens。

大模型价格正在竞底,但究其本质,向下竞底是不具备“向上定价”的条件。将“降价”而非“卖贵”作为核心竞争力的大模型,是走不长远的。

降价的本质,是无法“向上定价”

大模型百万tokens价格一再跳水,OpenAI说是为了“造福世界”,谷歌说是为了扩大AI用户,国产大模型厂商也纷纷表示要让利个人和企业开发者

那为什么ChatGPT、Gemini刚问世的时候,就敢于强势向开发者收钱呢?那时怎么不践行“造福世界”的初心呢?

我们越过那些官方的宣传辞藻,来看几组行业数据,就会发现:降价是一种必然。

第一,模型能力正在趋同,OpenAI/谷歌也没有护城河。

数据显示,自GPT-4发布以来,多个模型在GPT-4水平性能上的巨大收敛,然而并没有明显领先的模型。

就是大家都在向GPT-4看齐,但谁都没有突出优势。能力趋同的前提下,不得不放弃收费,靠降价/免费来争夺用户,保住地盘。

wKgZomZMY7iAb5cvAACWY1Bq360468.jpg

第二,大模型的边际收益正在持续走低。

Gary Marcus 博士在“Evidence that LLMs are reaching a point of diminishing returns — and what that might mean”《LLMs正达到收益递减的证据——及其可能意味着什么》一文中提到,从GPT-2到GPT-4甚至GPT-4 Turbo的性能变化,已经出现了性能递减的迹象。

在收益递减的背景下,意味着处理相同的任务,开发者的实际成本是在上升的。在AI创新商业化前景还不明朗的市场环境下,为了保住现有用户,大模型厂商必须给出有吸引力的对策。包括提供更小的模型,比如谷歌推出的Gemini 1.5 Flash,通过“蒸馏”实现了与Gemini 1.5 Pro性能接近、成本更低。另一个手段就是直接降价。

综上,大模型降价的本质,是因同质化竞争+投入产出比降低,而无法卖贵、不敢卖贵的必然选择。

向下竞底的前途,是没有前途

论迹不论心,只要大模型厂商的降价行动,能够切实惠及企业和开发者,当然是受市场欢迎的。

问题就在这里,企业和开发者能从中获得多大收益呢?

有人说,降低成本能推动大模型的“价值创造”,是错误的因果归因。大模型的“价值创造”,是以大模型本身为锚点,而非价格。

最直接的例子,ChatGPT问世即付费,当时很多从业者都很开心,认为市场终于重返工程师主导的文化,技术为王,代码竞争,“没有那些精心设计的流量游戏或者运营技巧,没人会动砍一刀送1000个token的心思”。说明明码标价、为好东西付费的模式,才是开发者心中的良性商业模式。

差的商业模式是什么?是模型能力不行,企业和个人开发者投入了大量时间、精力,结果无法建立竞争力,无法从应用创新中获得商业回报。

有一个SaaS开发者直言:“我们折腾了一年(做基于LLM的产品),也有不少用户提出了付费需求,但我们感觉做不到SLA,全部婉拒了。”所谓SLA,是指一定开销下,服务商与用户之间的一种协定,来保障服务的性能和可靠性。

开发者和ISV服务商,如果被低价吸引,但底座模型的能力却不行,不能解决用户的问题,赚不到钱,还投入了大量研发资金和工程团队,那最后实际的沉没成本,可比调用省下的仨瓜俩枣大多了。

正如微软所强调的那样,大模型“仍将是解决众多复杂任务的黄金标准”。所以,良性的商业模式,是大模型能力持续提升,商业化版本上同时兼顾普惠。

以下图来说,逐步进入到低价高质的绿色区域,也是“最具吸引力象限”。

wKgZomZMY7mAdwgGAABP_9NdIFo423.jpg

从图中不难看到,GPT-4o是目前质量最高、价格相对降低的位置。

而放眼国内的厂商,模型能力如果达不到OpenAI的水平,一味拼价格并不是一个好策略。

可以推演一下,打价格战,会发生三种情况:

最乐观、最好的结果,是大模型厂商靠低价吸引用户,用户数量和使用量的规模化增加,能够低效甚至超过降价的亏损,实现盈利。而即使是最好的情况,大模型企业也会在短期内,利润受到挤压,财务表现可能会受到来自资本市场或投资人的压力。

至少目前来看,可能性很小。降价或许能够吸引不少用户尝鲜、试用,但最终模型能力才是沉淀下来的主因,留存率并不一定理想。

用户增长不确定,大模型投资成本却在节节攀升,意味着大模型厂商的风险敞口不断扩大,由此带来打价格战的一种最坏情况:国内大模型厂商被迫跟进价格战,不断压缩本就不大的盈利空间。

Anthropic的CEO曾向媒体透露,目前正在训练的模型成本已接近10亿美元,到2025年和2026年,将飙升至50亿或100亿美元。

这意味着,一旦大模型企业为了“价格战”,现金流会持续承压,缺乏充足的资金投入到招募AI人才、升级基础设施、部署数据中心、升级网络等投资中去,模型进化与迭代也会受到影响,从而让国产基座模型进入发展瓶颈期,与世界一流水平的差距越拉越大。

需要注意的是,社会各界用户早已在各个模型厂商的宣传布道中,拔高了对大模型的期望值。一味推广低质低价的使用体验,让人们对AI失去信心,觉得大模型不够万能、啥都干不好,对这一轮大模型主导的AI热潮,将是极大的负面影响。

当然,也不必过于焦虑。最坏情况和最好情况一样,发生的概率不大。现实中最有可能的,是大模型行业在最佳和最坏情况之间震荡。

一部分模型性能领先、商业模式向好、客情关系良好、现金流相对充裕的厂商,能够在跟进降价的同时,保持对底层创新的持续投资,但长期可以摊薄研发成本,靠规模增长来实现收入上涨。而注定也有一部分企业会在价格战与现金流压力下,被震荡出局。

一个AI公司创始人就表示:其实挺期待AGI到来的,虽然能秒灭我们这种小团队,但至少大家都解脱了。

说到底,一味打价格战,AI巨头有没有前途,不一定,但创新型小公司,一定危险。

降价的前提,是有“向上定价”的实力

有必要叠个甲,我们不反对大模型降价,鼓励大模型厂商为个人和企业开发者减轻负担。

只不过,当舆论各方都关注“低价”的时候,当一场大模型发布会的亮点是百万token价格小数点后有几位,当大模型的商业模式从技术为王,变成“羊毛出在猪身上”、把用户当成流量商品……有必要再重申一下:新技术,是大模型产业的“震中”。

高科技领域,新技术层出不穷。企业要在一波又一波技术浪潮中,同时扮演“颠覆者”和“防御者”。拿大模型来说,厂商必须有至少两个梯队来参与竞争。

一个梯队负责进攻,孵化全新的模型和产品,追逐技术上的颠覆式创新;另一个梯队负责防御,通过低价、生态等守住现有业务和用户,抵御对手的袭击。

而当前,大模型厂商的更优先事务,不是“向下降价”,而是塑造“向上定价”的可能性。

将自家大模型矩阵中的某一些特定模型,做一个极致低价,是很容易操作和吸引眼球的。能把大模型卖出去,向上定价,向价格段的上游迁移,才是AI实力的体现,才能让企业保有更长的生命力。

举个例子,GPT-4o虽然免费,但免费版本只提供有限的次数,而天花板级别的语音交互能力又带来了极强的付费潜力。此外,GPT-5也早就被曝已经做出来了,只是OpenAI没决定好何时推向市场。谷歌也采用类似的策略,更低价格、更低成本的模型,与高性能的付费模型,以及庞大的软硬件生态来让AI落地,共同构成商业版图。

当前国产大模型亟待完成的,是能力突破的技术进击

从我们了解的大模型使用情况来看,企业和个人开发者最在意的商业化问题,仍然要靠模型本身的进化来解决,比如说:

目前阶段,很多任务场景,大模型连兜底的效果都还没有搞定,距离SLA级别的收费标准差距很大,无法达到商用;

精调虽然可以满足一部分场景,但难以泛化。有些场景的大模型精调效果,还不如用传统的小模型。这不是大模型“够不够便宜”的问题,是“为什么要用”的问题;

最终用户愿意付费的AI应用,必须真正做到降本增效,学习成本高一点都不会用。这就需要服务商和开发者详细地拆解任务流程,不忽视任何微小的业务细节,量身定制,降低整个开发过程的周期和难度,或许比降价更有吸引力。

其实,大模型质价比的“最具吸引力象限”,已经说明了,质量做高的前提下,实现价格更优,才是大模型商业化的可持续之路。

向下竞底只是权宜之计,能够“向上定价”的大模型才有未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8108
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296601
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9814
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10074
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Lora基站在物联网应用的重要性

    Lora基站在物联网应用中具有重要的地位。首先,Lora基站可以实现对物联网设备的远程监测和控制,为物联网应用提供了强大的功能支持。其次,Lora基站具有较强的抗干扰能力和较长的电池寿命,可以在恶劣
    发表于 12-03 07:09

    锂离子电池为何会起火?基于分岔理论的锂离子电池热失控临界参数研究

    与工程领域的重要课题。近日,一项发表于《ScientificReports》的研究提出了一种基于分岔理论的定性分析方法,能够在不依赖复杂数值模拟的情况下,快速判断
    的头像 发表于 11-13 18:03 774次阅读
    锂离子电池为何会起火?基于<b class='flag-5'>分岔</b>理论的锂离子电池热失控临界参数研究

    海康威视全新推出大模型高阶智控信号机

    红绿灯变“聪明”的关键之一就在于信号机的“自适应控制”,它通过雷达、摄像机等传感器,实时“记录”车流变化,通过交通供需模型,自动调节红绿灯的周期和各个方向的绿灯时长。例如哪个方向路口的车量多,就延长该方向绿灯时间,从而让路口交通
    的头像 发表于 09-29 17:11 834次阅读

    上海海思朱雀专业电显示解决方案推动行业快速发展

    这场电狂欢赛场上,各类顶尖电装备的身影随处可见,这是新一轮电市场快速增长的缩影,市场的快速增长则带动如显示器、鼠标、手柄、耳机等电装备升级。
    的头像 发表于 09-18 16:30 786次阅读

    向深扎根 向上生长——打造更高下限的系统

    向深扎根向上生长八载耕耘,砥砺前行;八载奋进,创新不止。回顾过往,展望未来,当下我们以“向深扎根,向上生长—打造更高下限的系统”为行动指南,既是对过往奋斗历程的总结,更是对未来发展路径的宣言。01向
    的头像 发表于 08-14 09:21 754次阅读
    向深扎根 <b class='flag-5'>向上</b>生长——打造更高下限的系统

    淘宝API实时品监控,市场策略快人一步!

    在当今激烈的电商竞争中,实时掌握品动态是企业制胜的关键。淘宝作为中国最大的电商平台,其开放API为商家提供了强大的工具,帮助实现实时品监控,从而优化市场策略,抢占先机。本文将一步步解析如何利用
    的头像 发表于 08-06 14:38 536次阅读

    拼多多API价格战预警:品监控不落人后!

    在电商行业白热化竞争的今天,价格战已成为平台争夺市场的核心武器。拼多多凭借其独特的社交裂变模式和低价策略异军突起,但这也意味着商家面临更复杂的定价挑战。如何通过API技术实现 实时价格预警 和
    的头像 发表于 07-31 14:31 738次阅读

    请问USB集线器可以支持角色反转吗?

    USB 集线器是否可以支持交换上行端口和下行端口的请求? 或者根据定义,集线器的一个面向上游的端口是否需要保持为面向上游的端口,而所有其他端口都面向下游? 或者,哪个物理端口作为集线器的上游端口的指定可以根据 USB 网络动态改
    发表于 05-07 06:34

    为何工程塑料不适合打印圆弧形模型

    的打印方式,那每一层之间必然会存在一定的衔接痕迹。 正因如此,在XY轴方向上遇到弧面或小角度平面时,其层纹会变得异常明显。从 JLC3D 小编实际打印的圆弧形模型(PLA材料)中可以清晰地看到,模型
    发表于 04-07 15:31

    LG UltraGear系列职业电显示器新品发布

    2025年初,LG电子隆重推出两款UltraGear系列电显示器新品——GX7炫系列27GX790A和G8极系列27G850A,再次刷新显示器性能标准,重新定义高端电显示器的技
    的头像 发表于 02-25 10:28 1168次阅读

    DLP500YX如何使得入射光和出射光在同一水平面,为什么旋转了45度后垂直入射,反射光却是斜向上或者向下出射?

    DLP500YX如何使得入射光和出射光在同一水平面,为什么旋转了45度后垂直入射,反射光却是斜向上或者向下出射?
    发表于 02-21 14:31

    人工智能的下一站在哪里

    DeepSeek的爆发进一步推动了AI行业的发展速度,这让人们不得不想象AI的下一站在哪里?维智科技所深耕的时空大模型与AI发展的逻辑轨迹又是如何联系的?
    的头像 发表于 02-14 10:27 803次阅读

    达尔优A75HE电磁轴键盘震撼发布:引领电新潮流

    近日,达尔优与欧希德强强联手,推出了其最新的电磁轴键盘——A75HE。这款键盘凭借其卓越的性能和独特的设计,迅速在电爱好者中引起了广泛关注。
    的头像 发表于 12-17 17:36 912次阅读

    使用SRC4192输出噪杂音太大的原因?

    请问TI专家,我使用SRC4192输出噪杂音太大。我使用的输入输出都是从模式,24bit I2S模式。参考时钟是24.576M,BCKI,LRCKI,BCKO,LRCKO都是输入,但是输出
    发表于 12-11 07:59

    TLV2553检测电压整体向上偏移的原因?

    采用TLV2553测量电压值,当采集电压大于2V时,整体向上偏移比较大。 后来更换REF+和REF-之间的电容,当电容C1设置为100nF时,采集到的电压值整体向上(比实际值偏大)偏移;当更换电容
    发表于 12-11 06:57