0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

豆包,大模型的磁力三重奏

脑极体 来源:脑极体 作者:脑极体 2024-08-01 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgaomaq7LqAPSwJAAli3ZlUWu0094.jpg

如今,很多媒体与AI从业者都在追问一个问题:大模型,究竟堵在哪了?

经历了2023年的百模大战,AI产业迎来了从“是否有大模型”到“如何用大模型”的转换期。各个大模型平台纷纷走向了公开应用阶段,面向C端与B端提供能力繁多的大模型应用。

然而问题也随之而来。在大模型平台百花齐放的同时,我们也能发现平台之间的同质化急速加剧。C端用户很难分清不同大模型应用之间的差异化,企业用户面临着复杂的大模型应用成本,进而导致真正能够实现规模化调用的大模型寥寥无几。

在技术相对成熟之后,大模型与用户之间,似乎还是缺少了一点磁力。

我们经常讨论,没有任何底层技术可以不经过产品化探索,不进行商业逻辑设计就获得用户认可。技术、产品、商业,三者之间一定是互为犄角的态势,缺一不可。而在百模大战的进程中,行业往往会更重视模型本身的技术发展,忽视产品化与商业设计的重要性。这种缺失与真空,也就是大模型缺乏用户磁力的来源。

好在随着时间推移,类似难题正在得到正视和解决。不久之前,在火山引擎2024“AI创新巡展”成都站期间,火山引擎宣布豆包大模型日均Tokens使用量已突破5000亿,平均每家企业用户日均Tokens使用量较5月15日模型发布时期增长了22倍。

豆包大模型的高增长,或许正是给大模型的用户磁力难题,写下了一张答卷。

wKgaomaq7L2AfZAdAAJpIAgDBVk419.jpg

被广泛讨论的大模型的商业难,落地难,究竟来源于何处?

从软件技术走向应用的时间逻辑上看。基础软件技术迭代之后,往往需要较长的产品化周期,进而其中优秀的产品最终走向商业化。但大模型风潮与以往不同,其技术特征中本身就有极强的应用色彩。这导致AIGC类平台与应用的爆发,基本没有经历任何的产品化周期,而是直接从算法革新走向了商用落地。

这种特殊的发展方式,让大模型短期内走到了“两多一快”的境地:市场上的大模型应用多,单一大模型应用提供的AIGC能力多,从技术走向商用的时间快。于是,用户还没来得及了解,眼前就被摆满了花样繁多的大模型应用;企业用户还没有准备好大模型的应用场景与商业逻辑,就被智能化热潮裹挟其中。

大模型带来的全新应用可能性,原本应该与用户形成极强的磁力,但大模型的同质化,与用户的没有准备好之间,反而形成了一种“消磁”效应。具体来看,我们可以将其拆解为三个问题:

1.C端消磁。产品体验感的缺失,以及技术的雷同化,让用户难以体会到大模型的魅力所在,进而在尝鲜期过后,快速出现了对大模型应用的搁置。

2.B端消磁。过高的尝试成本,让企业在还没有准备好实用大模型的时候,就需要付出较大的模型部署成本,从而导致大量企业倾向对大模型进行观望。

3.行业消磁。快速成型的大模型体系,更多提供的是通用性较强的能力。然而众多行业需要的是专业化、定制化的AI功能,不能充分了解行业需求,导致大模型能力浮于行业表面,无法深入其中。

wKgaomaq7L6ASzA6AAEGcTkF89g804.jpg

2023年8月,字节旗下的首款类GPT应用豆包正式发布,很快攻陷各大应用市场。目前豆包底层的大模型已经应用于字节内部各大业务,覆盖了协同办公、数据分析、文案创作、辅助编程、内容审核等场景。当这个大模型最终以“豆包大模型”的名称正式发布走向市场,所需面对的最大挑战就是如何建立AI与用户之间的磁力,打通大模型的商业化落地空间。

此后的近一年时间里,我们能看到豆包带来了关于大模型磁力的三重奏。

wKgZomaq7MCAddVeAAHy9-vK9PU112.jpg

经历了快速的技术迭代与产品梳理,如今“豆包”的定义更加明确和统一。它表面是一款类GPT的应用,背后实际是一整个豆包模型家族,而与底层大模型同名的豆包APP,则是字节通过模型升级产品体验,与C端用户重新建立磁力的通道。

为了破解大模型应用缺乏魅力,产品同质化太高的问题,豆包贯彻了一个核心产品设计原则,拟人化。

从AI命题被提出的那一刻,这种技术的核心就是让机器模仿人。而伴随着无数科幻作品的熏陶,大众对AI魅力的认知与期待也都在于拟人。但要注意的是,AI拟人的目标并不能仅仅依靠技术手段来实现。而是需要产品层面的更多雕琢。

为了实现豆包的拟人化,相关团队在多个层级进行了一系列产品设计。比如说,依靠豆包家族里的语音识别模型和声音复刻模型,进而实现与其对话贴近与真人对话的感觉。

在进入豆包聊天界面后,用户会感觉到与社交软件非常相似的产品设计。比如说,聊天框顶部有对话头像,这一点继承了用户与真人聊天的产品习惯。

wKgaomaq7MGAS-CEAAP0W8D32EI704.jpg

在豆包大模型家族中,还推出了角色扮演模型。这个模型当中,AI会模仿不同人设、不同性格的人来与用户进行对话,并且可以通过智能体来自行设定聊天角色。将拟人化作为核心功能之一,可以快速拉近与用户的距离,消弭掉用户对AI技术的陌生感。

具体到AIGC能力当中,豆包同样强调拟人化思路的贯彻。比如豆包在进行PPT制作功能时,在PPT生成之外还会提出制作PPT所需注意的问题。这就非常类似于朋友或同事进行合作时的情况,而不仅仅是简单的AI工具。

在拟人化核心特性的加持下,豆包很快得到了用户群,尤其是年轻用户的认可。随后,豆包的战略权重开始不断上升。形成了具有多模态能力的模型家族,包含了通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等十款模型。

wKgZomaq7MKAQPvXAAIsHMOqWW0229.jpg

豆包虽然是AI模型,但其差异化恰好在于对“人”的重视。通过精细的拟人化产品设计,其完成了对大模型同质化问题的摆脱。

而在产业端,豆包也将这种直面问题核心的思路贯彻了下去。

wKgaomaq7MKANSBqAAJYQZaYJxI661.jpg

面对大模型机遇,各行业以及无数AI开发者都跃跃欲试。但较高的模型使用成本,依旧会给企业进行大模型探索、试错造成一定的影响。尤其伴随业务的不断发展,大模型成本也会不断上升。在真正推动大模型落地前,成本账是企业用户必须先算清楚的。

与此同时,大模型的开发方面临着另一重困境。模型的调用量不足,开发者生态无法成型,直接导致大模型无法根据反馈进行优化调整,单位模型的推理成本也居高不下。因此,只有用起来才是大模型的唯一出路。对于大模型本身和企业用户而言,中间的成本门槛已经成为双方共同的困扰。

wKgZomaq7MOAB21UAABN6g-QSSA151.jpg

在这样的态势下,豆包率先进行了大模型低成本化的商业思路。豆包大模型目前通过字节跳动旗下云服务平台火山引擎面向企业开放,5月15日,豆包大模型正式发布之时,火山引擎宣布豆包主力模型在企业市场的定价已经达到了0.0008元/千Tokens,0.8厘就能处理1500多个汉字。这个价格已经降低到了此前行业通行方案的1%还低。

豆包率先推动大模型进入“厘时代”,为企业降低智能化成本带来了巨大的影响。整个行业开始跟随和效仿,企业以更低成本、更便捷方式接入大模型成为新的主流。

尤其值得注意的是,与行业内流行轻量化版本降价,吸引企业用户试用,然后主力模型保持较高价格的思路不同。豆包将主力模型与轻量化模型都进行了大幅价格优化,主力模型给出了低于行业价格99%的定价。为企业用户与大模型之间的深度结合,扫清了最后的障碍。

wKgaomaq7MSAThEPAAIdAA_Pb2E951.jpg

除了大众用户与企业用户之外,大模型落地的很大一部分动力,来自全行业模式的驱动。大模型可以伴随着行业头部用户的使用,快速在行业轨道中进行复制和推广,从而深度加强行业智能化水平。

在这个过程中,大模型了解行业,深入行业成为最主要的挑战。而想要解决它,也只有真正走进行业,与行业达成生态合作这一条通道。

不久之前,火山引擎联合中国电动汽车百人会,与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商,宣布成立汽车大模型生态联盟,致力于为消费者带来汽车全场景AI新体验。

通过生态合作,火山引擎可以获得更加清晰的汽车行业智能化诉求,从而让豆包给出更有针对性与专业性的落地方案。比如说,当前车企愈发重视用户反馈,但伴随网络信息量的爆炸,人工收集网络反馈的方式低效且不够全面。豆包大模型可以帮助车企进行反馈信息收集,并且进行初步分析总结,从而实现智能化的信息筛选与分类,提取出车主的主要关注点与情感倾向。

此外,豆包可以在汽车行业的多个角度、多个场景实现落地。比如搭载了豆包lite大模型后,车企可以在低延迟情况下为用户提供清晰、智能的AI对话能力,支持闲聊、搜索、娱乐、导航、车控等多个座舱智能助手场景,效果要比传统语音处理高达50%以上。在智能座舱、智能驾驶场景中,AI对话将成为十分重要的交互手段。豆包与汽车行业的深度融合,解决了车内语音交互的系列痛点。

wKgaomaq7MWAGkmUAASr3YIwKyY600.jpg

类似豆包与汽车的结合,火山引擎还与OPPO、vivo、荣耀、小米、三星、华硕成立了智能终端大模型联盟。OPPO小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮AI助手等应用,均已接入火山引擎的大模型服务。

可以看到,拟人化、低成本、重生态,已经成为豆包大模型的三个支点。它们在技术之上,为豆包大模型提供了产品、商业与产业合作层面的竞争力,消解了大模型同质化带来的落地难题。

用对用户的尊重,对问题的正视,来重构大模型的磁力。这或许才是日均Tokens使用量破5000亿背后,豆包身上值得被提取出来的“营养物质”。

wKgaomaq7MiASXS6AAHr8PFBy3E175.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38188

    浏览量

    296983
  • 大模型
    +关注

    关注

    2

    文章

    3455

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    静音、小型、无感,AI玩具电机技术三重奏

    电子发烧友网综合报道 AI玩具的智能化升级核心依赖电机及驱动系统的性能突破,其电机产品已从传统单一动力单元向电机+智能控制集成模块演进,成为支撑玩具从被动娱乐走向主动交互的关键核心。   从市场规模来看,2025年中国AI玩具市场规模预计突破80亿元人民币,带动电机驱动芯片市场规模达到4-8亿元区间。这一测算基于电机驱动芯片占硬件成本5%-10%的行业规律。   全球范围来看,AI玩具行业正处于高速发展期,2025年上半年中国赛道已完成5起亿
    的头像 发表于 12-03 10:31 1653次阅读

    核心需求三重奏:论航空器对涵道风扇推重比、效率与集成性的极致追求

    涵道风扇电推进系统作为一种新兴的航空推进技术,在绿色航空和低空经济双重驱动下,近年来受到全球航空航天界的广泛关注。该系统基本构成包括可旋转桨叶、环形涵道、驱动电机及控制器等核心部件,通过输入电能驱动桨叶高速旋转产生连续可控推力。
    的头像 发表于 11-14 13:59 854次阅读
    核心需求<b class='flag-5'>三重奏</b>:论航空器对涵道风扇推重比、效率与集成性的极致追求

    基站散热器CNC加工——精度、效率与可靠性的三重奏

    在5G基站向高密度、低功耗方向演进的进程中,散热器的CNC加工技术已成为保障通信设备稳定运行的核心环节。从热设计到精密制造,从单机加工到系统集成,CNC工艺正通过精度控制、效率提升与可靠性保障的三重
    的头像 发表于 11-06 16:34 365次阅读

    智能驾驶的“感官系统”:超声波雷达、毫米波雷达与激光雷达的协同之道

    一套复杂的传感器系统——其中,超声波雷达、毫米波雷达和激光雷达构成了智能驾驶的“感官三重奏”,各司其职、协同工作,共同构建车辆对环境的全面认知。 超声波雷达:最“接地气”的近距离守护者 工作原理: 超声波雷达
    的头像 发表于 11-04 17:43 545次阅读
    智能驾驶的“感官系统”:超声波雷达、毫米波雷达与激光雷达的协同之道

    车载音响EMC整改:“滤波-屏蔽-接地”的三重奏

    车载音响EMC整改:“滤波-屏蔽-接地”的三重奏|南柯电子
    的头像 发表于 10-15 10:34 249次阅读

    技术攻坚视角《武汉特高压:用中国精度重新定义变频谐振标准》

    在2025年中国电力科学院发布的《特高压设备技术白皮书》中,武汉特高压的变频串联谐振装置以99.2%的精准度刷新行业纪录。这家企业如何用十年时间打破外资品牌垄断? 技术突破三重奏 算法革命 :自主
    发表于 09-17 10:41

    ICT测试:SMT产品质量的“三重防线”​

    一站式PCBA加工厂家今天为大家讲讲ICT测试如何保障SMT产品质量?ICT测试为SMT加工品质构筑三重防线。在SMT(表面贴装技术)加工中,ICT(在线测试)通过电气性能验证、焊接质量监控、装配
    的头像 发表于 08-05 09:47 955次阅读

    用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带三重 WCDMA TRx 开关 skyworksinc

    电子发烧友网为你提供()用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带三重 WCDMA TRx
    发表于 06-24 18:32
    用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带<b class='flag-5'>三重</b> WCDMA TRx 开关 skyworksinc

    透明显示三重奏:解码LED贴膜屏、晶膜屏与全息屏的技术疆界

    在数字化显示技术飞速发展的今天,LED贴膜屏、LED晶膜屏与LED全息透明屏如同颗璀璨的明珠,各自闪耀着独特的技术光芒。这种透明显示技术虽同源共生,却在物理特性、显示效果与应用场景上展现出截然不同的技术维度,共同构建起现代显示技术的多元宇宙。
    的头像 发表于 06-21 15:27 4026次阅读
    透明显示<b class='flag-5'>三重奏</b>:解码LED贴膜屏、晶膜屏与全息屏的技术疆界

    字节豆包模型团队提出稀疏模型架构

    字节跳动豆包模型Foundation团队近期研发出UltraMem,一种创新的稀疏模型架构,旨在解决推理过程中的访存问题,同时确保模型效果不受影响。
    的头像 发表于 02-13 15:25 1028次阅读

    74LVC3G16三重缓冲器规格书

    电子发烧友网站提供《74LVC3G16三重缓冲器规格书.pdf》资料免费下载
    发表于 02-12 14:33 0次下载
    74LVC3G16<b class='flag-5'>三重</b>缓冲器规格书

    74LV4053三重单刀双掷模拟开关规格书

    电子发烧友网站提供《74LV4053三重单刀双掷模拟开关规格书.pdf》资料免费下载
    发表于 02-09 11:46 0次下载
    74LV4053<b class='flag-5'>三重</b>单刀双掷模拟开关规格书

    字节跳动豆包模型1.5 Pro发布

    近日,字节跳动旗下的豆包模型迎来了全新的升级——豆包模型1.5 Pro正式发布。这款全新模型在知识、代码、推理、中文等多个测评基准上表现
    的头像 发表于 01-23 15:24 1114次阅读

    豆包模型降价后毛利率仍达50%

    近日,据多个知情人士透露,尽管豆包模型在去年经历了大幅降价,但其毛利率依然保持为正,展现出强大的市场竞争力。 字节跳动最新推出的豆包模型1.5版本,在推理成本优化方面取得了显著的突
    的头像 发表于 01-23 10:54 1161次阅读

    字节跳动发布豆包模型1.5 Pro

    字节跳动正式发布了豆包模型1.5 Pro。 全新的Doubao -1.5 - pro模型综合能力显著增强,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT - 4o、Claude
    的头像 发表于 01-23 10:24 1133次阅读