0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国大模型的落地DNA,写在这个双螺旋结构里

脑极体 来源: 脑极体 作者: 脑极体 2023-07-07 09:43 次阅读

随着大模型的飞速发展,行业各界对大模型的核心疑问,已经从“有没有大模型”,转变为积极投入建设之后,中国AI产业如何实现大模型落地?巨大的建设投资应该如何获得确定性、可持续的回报?

事实上,中国AI最强的特征一直是落地。

技术落地的一个重要指标是技术密度,即一项技术在社会和经济中的普及程度和应用密度。过去几年里,AI技术已经在中国的农田、工厂、港口、矿山、校园、城市等遍地开花,是全球其他地区都极少见到的景象。

产业革命的发生不可能一蹴而就,拥有大量业务场景和AI落地经验的中国,也应该是大模型落地的前哨站。

果不其然,外界对中国AI和大模型落地的疑问与好奇,已经可以在文心的最新进展中,得到解答。

wKgZomSm7SyAYzk5AARPmzvvZWU103.jpg

7月6日,在2023世界人工智能大会(WAIC)上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰,解读文心大模型3.5版核心技术,同时发布了飞桨生态最新进展,首次披露了飞桨深度学习平台最新数据,阐述人工智能产业模式。

文心和飞桨的协同发展,组成了一个双螺旋结构,读懂这个DNA 片段,可以更清晰地理解中国AI技术持续走向落地的方法与路径。

一、产业AI的无形之墙

一个技术走向产业,有三个因素构成了影响其市场格局的制约点:一是技术领先性,二是市场需求度,三是产品可靠与可用程度。

大模型技术的领先性和市场需求度,自然毋庸置疑,那么产品能否经受得住产业用户的考验呢?中国AI场景多、落地早、实践多,所以已经可以清晰地看到一堵产业AI的无形之墙,各行各业普遍存在的“三高”要求,是大模型落地所必须跨越的挑战:

能力要求高。一些IT基础好的产业会率先应用AI、落地大模型,但这些领域往往有着复杂的业务场景,以及使用多年的传统算法,因此产业对AI大模型的基础能力,要求会比较苛刻,超出现有技术手段,才有升级替换的必要性。

专业性要求高。通用大模型进入垂直细分的业务场景,会面临非常复杂的业务状况,要注意哪些问题和细节,需要哪些数据,目标是什么,需要大模型能够像行业专家一样,掌握专有知识和行业Know-How。

开发成本高。行业场景的庞杂和差异化广泛,大模型落地需要有针对性的训练、精调,而很多行业和企业缺乏充足的IT人才、算力资源等来进行定制开发,延缓了大模型落地的速度。

“三高”要求制约着AI技术落地,这也使得大模型走向产业,还处于初级阶段。

二、中国大模型的强落地范本

凿穿产业AI 的围墙,需要筑重器。在世界人工智能大会上,王海峰分享了文心大模型3.5的核心技术创新。

与文心大模型3.0版本相比,文心大模型3.5版本在效果、功能、性能上全面提升,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等能力升级。

更值得关注的是,文心大模型在应用层面,展现出了挣脱制约、指向落地的一系列方法,可以成为产业示范。

文心大模型3.5的几大技术创新,就满足了产业各界对大模型的三种强期待:

一是对先进生产力的期待。

归根结底,大模型要可靠、可用,为行业提质增效。文心大模型3.5的两大升级点,就着眼于此:

首先,基础模型升级,基于飞桨加快模型迭代,提升模型效果和安全性,模同时,百度文心大模型研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步提升。

此外,文心大模型3.5的逻辑推理提升,在语义理解、数学计算、代码生成等领域表现更好,这些任务是实际业务中高频出现的。王海峰举了个例子,百度每天有大量工程师在写代码,文心一言发挥大模型的代码生成能力,可以更好地帮助工程师提升写代码的效率,切实提高生产力。

wKgZomSm7S2APkwNAAOrEOWd1aI226.jpg

二是对行业专家的期待。

大模型需要与行业场景适配,解决业务中更具专业性的实际问题,已经成为共识。此次3.5版本,就通过“精调”+“知识点增强”两大技术创新,让大模型具备行业专家一样的专精能力。

有监督的精调技术,可以针对性地适配业务场景,让结果更加可靠,从而更好地满足业务场景对模型效果和安全性的需求。知识点增强技术,则在此前的知识增强和检索增强的基础上,为大模型注入更具体、更详细、更专业的知识点,显著提升大模型对世界知识的掌握和运用,更好地完成专业任务。比如在生成报告时,文心大模型就能够对用户输入的查询、问题等进行分析理解,并解析生成答案所需要的相关知识点,生成更匹配业务特点的内容。

三是对丰富应用的期待。

智能手机中丰富多彩的应用,是移动互联网产业繁荣的前提。用户使用大模型也需要多样、丰富、易用的各种应用工具,这就需要插件机制来满足。

文心大模型3.5新增的插件机制,可以扩展大模型的能力边界,细致高效地应用于各类场景。比如文心一言的长文本摘要和问答插件ChatFile,支持超长文本输入,可以在办公场景下,形成会议议题、摘要及总结等关键信息,帮助提升工作效率。

王海峰也表示,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型,同时也将逐步开放插件生态,帮助开发者基于文心大模型打造自己的应用。

随着大量优秀的开发者和软件工程师,基于文心大模型来打造专属插件,不仅大模型的可用性和产业适配性会进一步提高,所带来的应用市场空间也是巨大的。

文心大模型3.5的升级曲线,紧密贴合产业期待。从中可以看到,文心大模型时刻准备着落地千行百业。

三、大模型落地需要可持续动力

仅有大模型还不够,王海峰提出,在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

文心大模型能够率先卡位在大模型落地的关键位置,离不开背后的另一条上升曲线:飞桨的联合优化。

wKgaomSm7S2AHAnTAABhLjVAsNk003.jpg

飞桨对文心的全面赋能,有四个层面:

首先,飞桨支撑大模型开发、训练和推理部署,全面提升大模型落地效率。大模型的训练、迭代要消耗大量训练成本、训练时间,经过飞桨与文心大模的协同优化,最新升级的文心大模型3.5的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

其次,文心大模型成为飞桨模型库的重要组成部分,通过飞桨平台进行精调、推理部署,就可以有效支持千行百业的应用,降低行业获取大模型门槛。

再次,飞桨提供了全流程产业化工具与平台,解决大模型开发中的卡点、堵点,比如模型体积大、训练难度高、算力消耗大等,更好地满足企业开发应用大模型的需求。

wKgZomSm7S6ASA_yAAGE9h01ptw240.jpg

此外,大模型落地产业离不开人才,飞桨已经凝聚了750万开发者,也支持了大量企业产生了大量的模型,为中国AI培养了大量新型人才,是大模型落地的有生力量。

可以看到,飞桨的技术和生态积累,正在为文心大模型走向产业,注入了源源不断的动力。

四、中国AI,凭借这样的DNA落地生根

在大会现场,王海峰也展现了文心一言在办公、会议、编码等场景的应用。可以说,文心一言已经有了丰富的新落地场景,这种强劲的落地表现,应该能够打消外界对中国大模型可持续发展的担忧。

从文心与飞桨组成了双螺旋结构的DNA,从中可以看出中国AI以实用为先,以产业为向的底色,中国大模型产业也开始呈现出这样的发展趋势:

1.低门槛。通过各个端口的技术创新,形成了AI技术全面低门槛化的特征,让模型的开发、获取和应用,都更加便捷、易得。

2.高效率。芯片、框架、模型、应用的全栈协同,带来了效率持续增长的乘法效应,大大加快了模型的落地速度。

3.通行业。AI开发、训练、部署、应用的全链路得到越来越饱满的支撑,“集约化生产,平台化应用”让大模型更适配产业和行业的现实需要,赋能产业智能化。

落地成为中国AI的DNA,大模型也不例外。以大模型为代表的AI技术和先进生产力在各行各业落地生根,这是为什么智能革命一定会发生在中国。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264052
  • DNA
    DNA
    +关注

    关注

    0

    文章

    240

    浏览量

    30918
  • 飞桨
    +关注

    关注

    0

    文章

    32

    浏览量

    2085
  • 文心一言
    +关注

    关注

    0

    文章

    112

    浏览量

    870
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1103
收藏 人收藏

    评论

    相关推荐

    pcb螺旋走线的优劣势对比

    PCB螺旋走线是一种在Pcb电路板上设计的螺旋型导线结构
    的头像 发表于 04-20 17:57 515次阅读

    美国苹果公司将增加在中国大陆的投资

    WitDisplay消息,美国苹果公司将增加在中国大陆的投资。苹果中国12日宣布,扩大在中国大陆的应用研究实验室,以支援产品的制造。
    的头像 发表于 03-12 18:23 1282次阅读

    索尼手机将退出中国大陆市场?

    据媒体报道,索尼最新的Xperia手机未来可能不会在中国大陆发布,索尼移动部门将会退出中国大陆市场。
    的头像 发表于 03-08 09:05 353次阅读

    汽车行业首个大模型GPT-BI应用在中国一汽落地

    近日,中国一汽与阿里云通义千问共同宣布,已成功落地汽车行业首个GPT-BI大模型应用。这一创新性的技术突破不仅标志着中国一汽在智能化转型道路上的重要里程碑,也代表着汽车行业在大数据分析
    的头像 发表于 02-06 16:38 2877次阅读

    格创东智荣获WIM世界创新者年会“2023中国大模型产业新锐企业TOP30”

    、数字化服务等产业榜单重磅发布,格创东智荣膺2023中国大模型产业新锐企业TOP30。 过去一年来,以ChatGPT为代表的大模型加速着产业变革,在全球范围内掀起一场人工智能浪潮,引发对于新一轮科技革命的遐想,一系列新兴信息技术
    的头像 发表于 01-19 11:50 144次阅读
    格创东智荣获WIM世界创新者年会“2023<b class='flag-5'>中国大</b><b class='flag-5'>模型</b>产业新锐企业TOP30”

    中国大模型落地应用案例集

    近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。
    的头像 发表于 01-19 08:27 552次阅读
    <b class='flag-5'>中国大</b><b class='flag-5'>模型</b><b class='flag-5'>落地</b>应用案例集

    螺旋板式换热器流动方式

    流动实现传热效果。本文将详细介绍螺旋板式换热器的流动方式、结构特点和传热性能。 螺旋板式换热器的流动方式是由流体在螺旋板间多次反复流动和穿越实现的。其流动方式可以分为两种情况:对流换热
    的头像 发表于 01-11 11:27 294次阅读

    特色应用:TriVista在生命科学领域的应用

      今天介绍的应用是基于来意大利的一组物理学家和化学家发表的一篇新论文。该论文使用CERIC‐ERIC合金用于研究DNA构象稳定性。该项目是关于离子液体作为新一代溶剂稳定DNA双螺旋结构
    的头像 发表于 01-09 06:32 123次阅读
    特色应用:TriVista在生命科学领域的应用

    软通动力“梧桐·招聘”入选中国首部大模型应用权威案例集

    在2024年中国信息通信研究院ICT+深度观察报告会上海分会场暨“虹桥之源”大模型驱动数字经济新生态峰会上,一部备受瞩目的权威成果《2023大模型落地应用案例集》正式发布。
    的头像 发表于 01-05 15:12 336次阅读

    读取Xilinx FPGA芯片设备标识符的方法-DNA

    每一片芯片内部存有一个设备标识符,xilinx把它叫做DNA这个DNA是不可更改的,永久存在芯片里面的。
    的头像 发表于 01-03 09:19 1134次阅读
    读取Xilinx FPGA芯片设备标识符的方法-<b class='flag-5'>DNA</b>

    中国大模型市场进展与趋势

    模型当前以生成类应用为主,多模态是未来重点发展方向 企业用户是从应用视角出发,分成生成类应用、决策类应用和多模态应用。 受限于模型能力、应用效果等因素,当前阶段以生成类应用为主。
    发表于 11-29 11:38 389次阅读
    <b class='flag-5'>中国大</b><b class='flag-5'>模型</b>市场进展与趋势

    探访云栖大会,竟然见到了中国大模型的半壁江山?

    人工智能模型
    脑极体
    发布于 :2023年11月06日 11:56:01

    网络模型的七层结构和五层结构

    七层模型 这个 ISO 层网络模型各层的名字、主要功能对应的典型设备和传输单位如下图: 这个七层网络模型在数据的传输过程中还会对数据进行封装
    的头像 发表于 10-08 16:39 817次阅读
    网络<b class='flag-5'>模型</b>的七层<b class='flag-5'>结构</b>和五层<b class='flag-5'>结构</b>

    解锁大模型落地之道,你最Pick哪一个?

    在技术创新赛道中,已经出现了成熟的大模型作品并实现了落地。该团队研发的是聚焦在法律领域的私域大模型,主要技术原理是通过具备向量能力的数据库 Hubble 支撑了证监会全部法规(不含更新数据)
    的头像 发表于 09-08 15:58 293次阅读

    白海科技与百川智能顺势而为、携手共进,助力领域大模型应用快速落地

    的解决方案。 作为国内领先的开源大模型提供商,百川智能的开源基础模型为国内企业落地模型应用、开发大模型的产业价值提供了高质量基石,进一步推
    的头像 发表于 08-08 14:23 755次阅读