0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型的“第一性原理”:技术创新与社会价值的接轨

脑极体 来源:脑极体 作者:脑极体 2023-07-14 09:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着时间来到2023年第三季度,国产大模型已经达到100多个,“百模大战”正式开启。

大模型,我们有了很多选择,也开始呈现出某种同质化。除了拼参数、比背景、看榜单,有没有其他方法,让我们更好地判断一个大模型的价值呢?

亚里士多德认为,任何一个系统都有自己的第一性原理,它是一个根基性命题或假设,不能缺省,也不能被违背。

透过表象,追寻本质,会发现各家大模型的 “第一性原理”,有很大的不同。而这个核心的不同,也会带动大模型走向不同的发展模式。

比如OpenAI的内核是AGI,大语言模型以“通用人工智能”的目标,作为出发点,最近才开始走向行业。

一些通用大模型,内核是“科研”,在榜单上有不俗的成绩,而行业应用所需要的配套工具、算力基础设施等,则不在研发者的考量中,逐渐淡出主流视野。

一些产业大模型,内核是“应用”,要快速胜任某一些具体的任务场景,加入了行业知识和专有数据“特训”,可基础模型能力一般,遇到“常识性问题”就掉链子。

wKgZomSwLR-ATn9BAATOSvQ0k2s877.jpg

工具可以开发,算力可以买,一个大模型的内在价值核心,却不会轻易替换。

我们一层层剥开京东大模型,看到了一个核心,就是——“产业”。

最近恰逢WAIC和JDD大会,我们跟京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬博士,进行了多次交流,他深入分享了很多京东对于大模型的思考。

将“产业价值”作为大模型的“第一性原理”,会让大模型走出怎样一条差异化的发展之路呢?我们不妨以京东为例,来展望一下产业大模型的未来。

大模型的价值起点

巴菲特曾说过,投资是滚雪球,找到“长长的坡”和“很湿的雪”,雪球一旦启动,坚持下去,就能越滚越大。

从产业的视角出发,会发现大模型这颗“雪球”的核心价值自证,确实还存在着很多问题,比如:

1.技术的可用性存疑。

产业化最后一公里的问题,看起来好像不大,却是决定大模型能用不能用的边界。

京东从2017年开始关注大模型,就很注重行业落地,也碰到了一些经验教训。

何博士直言,“拿着刷榜的技术给业务部门去秀,用起来碰到各种各样的小问题,对使用者来说不可用,后来人家就不信你了,你再怎么说也觉得你技术不行”。

2.行业的连接不够充沛。

大模型落地,需要解决一个一个具体问题。这些问题不可能在实验室里“涌现”,行业到底需求什么,有哪些限制条件,都要从产业实践和应用中找到答案。

何晓冬博士认为,大模型是不能自己坐在办公室拍脑袋想出来的,一定是行业凝练出来的。

但向上触碰学术、向下扎根行业,这样的AI研究机构本身就很稀缺。

3.价值回报还很朦胧。

引入大模型,意味着企业要增加各种成本,消耗大量的资源。企业引入大模型,也希望得到经过反复尝试被证明没有问题的产品。目前很多大模型的价值自证,还不够有力。

何博士就提到,一般的生成式语言模型,内容正确率是83%、85%左右,to C用户觉得还可以,但严肃商用的时候,模型正确率要达到95%以上,才能达到企业的要求。“明明这个活动打的是八折,大模型生成的营销文案说是五折,这个事情商业上是不可接受的”。

事非躬行不知难,大模型急需一场产业价值的自证与他证。

破解方式其实也很简单,就是一步一个脚印,把该踩的坑都踩了,把遇到的问题都一一解决。

所以年初,大语言模型高歌猛进的时候,京东没有跟风,它在忙什么?忙着解决问题。

京东的长坡

以“产业价值”作为 “第一性原理”,京东做大模型最先关注的,不是签了多少单,什么时候开发布会,而是夯实基础设施。

AI三要素:数据、算力、算法,都需要升级,才能撑住大模型时代,如同一个“长坡”,让大模型的“价值雪球”可以向前滚动。

先说数据。产业大模型,一般是先用公域数据训练基础模型,再用行业专有数据进行“特训”,相当于先在中学上通识课,再到大学里去学专业技能。京东的思路很不一样,言犀大模型训练时融合70%的通用数据与30%数智供应链原生数据,把零售、金融、健康、物流的know-how和数据,也放到基座模型中,相当于既做了通识教育,又上了很多门专业课,有更多的行业理解。

所以京东的大模型一推出来,面向知识密集型、任务型产业场景,已经可以解决真实产业问题。

再说算法。算法是大模型的核心能力,也是拉开产品体验差距的关键。目前,单点算法已经不足以撑起大模型了,大语言模型就包含了强化学习、提示学习、预训练等一系列优化。成体系的技术体系和算法创新,也更容易形成护城河。

然后是算力。很多大模型推出后不久便停止开放、限制互动次数,就是因为算力不足或成本昂贵,企业想用也用不起。所以,大模型后续能否持续为产业所用,算力不能成为短板。

京东在2021年就建立了最先进的DGX集群,在重庆落地了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,推理提速6.2倍,推理成本节省90%,为基础大模型的训练和迭代提供保障,保持竞争力。

wKgaomSwLSCAYn6jAAW4duCVfPo957.jpg

一路深耕AI三要素,京东为大模型从技术走向产业,构筑了一条“长坡”。至此,大模型的价值底座,已经非常坚实。

产业的厚雪

回顾上一阶段的产业智能化,很多技术能力都停留在表面,难以深入行业或规模化复制。大模型的价值变得饱满,要卷起产业的“厚雪”,将雪球越滚越大。

在何晓冬博士分享的一系列京东大模型技术和实践里,我们可以看到,大模型黏住产业“厚雪”的多种姿势:

一是技术黏着。

产业AI落地难的很多问题,其实都源于技术瓶颈,比如深度学习的不可解释性、泛化能力不足、模型精度不够等。京东通过基础技术的体系化突破,让大模型变得高可用,形成端到端的产品价值。

比如数字人,基于10余年智能对话经验与多模态交互技术积淀,京东云多模态数字人只需要极少量样本素材,5分钟简易拍摄,就可以自动生成声情并茂的数字人,让中小商家与个人能够用得起、用得上数字人服务,算力、开发周期、人才等高门槛不再成为问题。

二是工具黏着。

目前,很多大模型厂商都开放了API调用的MaaS服务,但一个容易忽略的问题是,调API也是需要一定能力和开发工作的,很多传统行业的用户,连AI基础调用API的能力都不一定有。

丰富、极简、开箱即用的工具,是产业落地必不可少的条件。京东的目标是,让对AI完全没有认知的用户,也可以直接使用大模型,提供从数据模型到应用服务的全周期管理,从基础层、模型层、MaaS,延伸到了应用层的SaaS服务。

言犀大模型开放计算平台的行业知识库,就沉淀了100多种训练和推理优化工具,不到一周时间,即可完成从数据准备、模型训练、到模型部署的全流程。

三是实践黏着。

比起某个榜单上的书面效果,企业应用大模型,更希望看到实际应用中的真实效果,对技术能力和价值收益有一个更清晰的感知。京东已经进行了大量的产业实践,优势格外明显。

目前,大模型在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,并融合行业解决方案对外输出,可以减少大模型落地的顾虑和成本。

比如文本生成,零售领域的文案,每个品类的敏感信息审核门槛都不一样,基于京东全品类丰富的商品数据积累和大模型,京东云AIGC内容营销平台,已经可以通过一张商品图片,生成电商运营需要的商品主图,营销海报图和商详图等,每套图成本降低90%,周期从7天缩短到半天,而且不用担心内容有风险,因为大模型的安全可信,在京东零售内部已经锤炼过了。

再比如健康诊疗,是一个对内容专业性和可靠性要求非常高的场景,京东健康应用大模型,进行健康助手及辅助诊疗,已涵盖超千种疾病专业性服务,目前累计超3千万高质量医患对话,百万级规模医学知识图谱。这些积累。

wKgZomSwLSCAFSC-AAU6go9cq0M069.jpg

黏住产业的“厚雪”,做实大模型的技术红利,是这一轮AI热潮,带给科技企业的真正机遇。

在京东,产业大模型已经从一种技术设想,逐渐变为清晰的发展方向,以及可执行的行动方案,正在撬动产业AI的下一个可能。

抱一而为天下式,大模型的价值探索

在年初的热闹中保持冷静,在“百模大战”来临之际,京东却率先给出了大模型的价值公式:大模型的价值=算法×算力×数据×产业厚度的平方。

当下阶段,大模型的野蛮生长,已经告一段落,走向新的应用纪元。推动大模型“从参数为中心”向“以应用为中心”转变,是目前的核心问题。京东凭什么后发先至?或许是很多读者心中的“未解之谜”。

但透过 “第一性原理”,我们却可以看到,京东大模型差异化,是一种“必然”。

京东技术的“第一性原理”,就是“产业价值”。

如京东CEO许冉所说,京东研发每一项技术,都将产业属性作为出发点、产业价值作为目标:技术源于产业需求,历练于产业场景,创造产业价值。

这个“第一性原理”,造就了京东大模型的路线分野——产学研用的高度结合。

不同的出发点:不同于科研类大模型的“两耳不闻窗外事”,也不同于行业大模型的“一心只扫门前雪”,京东从产业端切入大模型,既需要锤炼基座模型的先进技术,又需要考虑为整个产业和社会创造价值,这条路如同“从北坡等珠峰”,更难也更有价值。

不同的行路人:看到了路,就需要有攀登的人。以何晓冬博士为代表的京东技术人,眼中有人间烟火,聚焦产业场景,服务京东自己的业务需要,技术在真实场景中被实践打磨,被验证,再解耦赋能其他合作伙伴;眼中也有星辰大海,京东探索研究院当技术刚刚在地平线上露出来的时候,就看到五年后可能会发生一些革命性的改变,开始前瞻性的布局,大模型就是其中之一,具身智能、多模态大模型、AGI等,都是京东正在关注的方向。

不同的路线图:京东做大模型,不是“无的放矢”,对于大模型的应用实践,已经有了明确的“三步走”规划,第一步,基于内部实践构建通用大模型;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,融合行业解决方案对外输出;第三步,针对严肃商业场景将大模型能力对外开放。目前,京东云已经基于内部实践构建了通用大模型。到今年年底,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务,预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。

以“产业价值”作为大模型的“第一性原理”,驱动着京东在大模型领域,走上了差异化的发展模式,率先完成了产业价值的创生和积累,更早进入应用纪元。

京东大模型的“价值雪球”,正以“马太效应”越滚越大,加速驶向千行百业、人间烟火。抱一而为天下式,大模型的产业价值,最终会凝结在万千众生的微笑里。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4816

    浏览量

    98798
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303074
  • 京东
    +关注

    关注

    2

    文章

    1133

    浏览量

    50158
  • OpenAI
    +关注

    关注

    9

    文章

    1262

    浏览量

    10325
  • 大模型
    +关注

    关注

    2

    文章

    3863

    浏览量

    5296
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海康威视亮相2026边坡与滑坡工程技术创新大会

    近日,2026年边坡与滑坡工程技术创新大会在成都举行,海康威视携多款边坡监测产品亮相,以数智技术为边坡安全打造系统解决方案。
    的头像 发表于 04-20 17:38 1291次阅读

    ZEISS ScanPort蓝光扫描仪荣膺2026荣格技术创新

    近日,全球工业质量解决方案领军者蔡司(ZEISS)自主研发的 ZEISS ScanPort三轴自动化三维扫描仪 凭借突破的自动化测量技术与高效性能,成功斩获 2026塑料行业 ——荣格技术创新
    的头像 发表于 04-17 14:18 234次阅读
    ZEISS ScanPort蓝光扫描仪荣膺2026荣格<b class='flag-5'>技术创新</b>奖

    海光主板,3450G强算力加快数智技术创新

    数字经济浪潮席卷全球,数智技术创新已成为驱动产业升级、推动社会进步的核心引擎,而算力作为数智时代的“核心生产力”,直接决定了数智创新的速度、深度与广度。
    的头像 发表于 03-31 14:08 415次阅读
    海光主板,3450G强算力加快数智<b class='flag-5'>技术创新</b>

    芯驰科技荣获航盛集团2026技术创新

    3月20日,以“聚力航行·智链新程”为主题的航盛集团2026合作伙伴大会在深圳隆重举行。凭借领先的车规芯片产品、持续的技术创新能力以及紧密的交付配合,芯驰科技再度荣获航盛集团颁发的“技术创新
    的头像 发表于 03-24 11:41 469次阅读

    航盛电子荣获2026全球汽车供应链技术创新生态伙伴奖

    近日,由中国能源汽车传播集团指导、《中国汽车报》社主办的2026汽车供应链生态伙伴大会在北京圆满落幕。航盛电子凭借在舱驾跨域融合平台的突破技术创新与量产落地成果,荣获“技术创新生态伙伴奖”。
    的头像 发表于 03-19 14:36 1295次阅读

    意法半导体斩获2025年度微控制器技术创新

    ‍‍‍‍‍‍近日,意法半导体(ST)凭借在微控制器(MCU)领域的技术突破与生态构建成果,荣获21ic电子网颁发的2025年度电子产业卓越奖——微控制器(MCU)技术创新奖。这荣誉是行业对意法
    的头像 发表于 03-13 11:20 641次阅读
    意法半导体斩获2025年度微控制器<b class='flag-5'>技术创新</b>奖

    技术创新|日晟万欣再获发明专利!

    技术创新|日晟万欣再获发明专利!
    的头像 发表于 01-30 09:58 275次阅读
    <b class='flag-5'>技术创新</b>|日晟万欣再获发明专利!

    Neway微波产品:技术领航,创造卓越价值

    ,助客户快速推出产品,提升竞争力。l 技术创新,满足市场变化经验丰富团队具备全流程能力,持续创新推出新产品。正在研发更高频、低损耗产品,巩固市场领先地位。Neway以技术优势紧跟趋势,为客户创造
    发表于 12-04 09:17

    上海交通大学与华为联合项目入选CEIC 2025技术创新案例

    近日,CEIC2025消费电子创新大会组织的“CEIC创新案例”评选结果正式揭晓,上海交通大学联合华为打造的“基于网络大模型的AI‘大运维’实践”案例成功入选“网络应用与技术创新领域
    的头像 发表于 12-01 10:25 1005次阅读
    上海交通大学与华为联合项目入选CEIC 2025<b class='flag-5'>技术创新</b>案例

    兆易创新荣获2025“中国芯”优秀技术创新产品奖

    11月14日,兆易创新(GigaDevice)新代GD5F1GM9 SPI NAND Flash产品在2025年“中国芯”集成电路产业促进大会暨第二十届“中国芯”优秀产品征集活动发布仪式上,荣获“优秀技术创新产品”奖。这
    的头像 发表于 11-19 11:00 991次阅读
    兆易<b class='flag-5'>创新</b>荣获2025“中国芯”优秀<b class='flag-5'>技术创新</b>产品奖

    恭贺!同星智能TSMaster项目荣获2025全国颠覆技术创新大赛优胜奖

    ,再次获得的又重要荣誉。2025全国颠覆技术创新大赛是由京津冀国家技术创新中心主办,上海颠覆技术创
    的头像 发表于 11-07 20:05 821次阅读
    恭贺!同星智能TSMaster项目荣获2025全国颠覆<b class='flag-5'>性</b><b class='flag-5'>技术创新</b>大赛优胜奖

    奥拓电子亮相CITS 2025影视拍摄技术创新与趋势论坛

    与会,论坛以 “虚实共生・智造视界” 为主题,聚焦影视拍摄技术创新与趋势,展现了场兼具深度与前瞻的思想盛宴。
    的头像 发表于 07-30 09:07 1181次阅读

    OpenTenBase技术创新与演进分论坛成功举办

    近日,2025开放原子开源生态大会——OpenTenBase技术创新与演进分论坛在北京成功举办。本次论坛汇聚生态伙伴企业、技术专家、社区成员及高校代表,围绕OpenTenBase和TXSQL的版本更新、技术创新、社区建设、应用实
    的头像 发表于 07-28 17:32 1430次阅读

    研华科技荣膺2025智能制造行业荣格技术创新

    在工业AI浪潮持续席卷的时代风口下,研华再传捷报!在被誉为“工业技术奥斯卡”的2025荣格技术创新奖评选中,研华自主研发的Agent Builder智能体平台凭借在智能制造场景的颠覆突破与落地成效,成功斩获“智能制造行业
    的头像 发表于 07-28 15:23 1188次阅读

    柠檬光子荣膺2025激光加工行业荣格技术创新

    近日,由荣格工业传媒主办的“2025激光加工行业—荣格技术创新奖”颁奖典礼在苏州举行。柠檬光子QuantaHeat激光器I07凭借高功率复合激光技术的突破技术创新与行业应用
    的头像 发表于 05-26 17:31 1543次阅读