0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

透过全球首个知识增强千亿大模型,看到中国AI差异化发展之路

脑极体 来源:脑极体 作者:脑极体 2021-12-10 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

几年来,预训练大模型逐渐从一个AI领域内的技术语言,变成了强势出圈的产业热点与社会关注话题。但如果大家关注这一话题,会很容易注意到越来越多的声音开始反思大模型的发展之路。比如,大模型是不是应该一味追求庞大的训练参数?在发展路径上我们是不是只能严格对标GPT-3等国际著名大模型产品?

当中国科技企业与研究机构纷纷投入大模型竞争时,是不是有可能探索出一条属于自己的道路?

在科技自立的需求愈发严峻与明确时,透过大模型竞赛,我们可以看到更多关于AI的产业启示与战略思考。

51fc1887022d4feeacc4008322e8de8e~tplv-tt-shrink:640:0.image

12月8日,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心。这一大模型参数规模达到2600亿,并且在全球60多项NLP任务中取得了最佳效果。同时,百度产业级知识增强大模型“文心”家族也首次亮相。

早在2019年,百度就开始布局文心预训练模型,如今它也率先走向了差异化拐点。当大众对知识增强这一概念的熟稔远不如大模型本身时,百度文心选择了这条听上去陌生,但却至关重要的产业新径。

大模型为什么重要?为什么我们应该在大模型上探索出新的方向?透过百度文心大模型,我们看到的是科技自立的远方,看到的是中国AI的飞翔之地。

大模型不是军备竞赛,而是教育竞赛

首先来看大模型本身的行业意义与发展背景。

如今,似乎每家AI企业和研究机构都在做大模型。这种火热局面经常被称为“大模型的军备竞赛”。但如果我们要理解的是,大模型本身是一种产业基础设施和辅助工具,并不是企业与机构的“不传之秘”。

AI产业发展大模型,就像是国家发展教育事业,本身是为了培养更多人才和创新能力,增强整个社会的能动性。

通过海量数据的预训练集成,大模型可以有效降低个体企业与具体行业的AI应用门槛,解决数据标注与行业差异化适配的问题。大模型就像一间间学校,培养了具有通识能力与高素质的人才,从而避免了企业需要从小学知识开始重新培养人才。

这也就将引出一个关键问题:既然大模型是一种“教育系统”,那么教育就应该贴合社会的实际需求。学校肯定不是以用掉了多少书本来评价质量,就像大模型不能仅以训练参数定优劣,更重要的是教育方法是不是与社会适配,能否培育出具有强大能力的人才。

从这个维度上思考,中国AI产业要一直跟随GPT-3等大模型的脚步,一味在训练参数上标榜自身吗?

中国的产业底座、应用需求、技术领导力,是否有可能培育出自己的差异化大模型之路?

此次百度发布的鹏城-百度·文心,以及亮相的百度文心大模型,或许就是答案的方向。

跳出藩篱:知识增强大模型的差异化之路

2019年3月,在全球大模型的刚刚开始起步的时候,百度就发布了ERNIE 1.0版本,提出了知识增强的语义表示模型。2019年7月,ERNIE 2.0 则构建了持续学习语义理解框架,在中英文 16 个任务上取得了业界最佳效果。

面向NLP领域AI的探索,文心大模型跳出了以往大模型的窠臼,采用了知识增强这一全新技术路径。知识增强将百度在知识图谱、跨模态学习等领域的技术能力,与模型训练学习方面的产业积累结合,实现了更高效率的学习,令模型的理解与生成能力显著增强。

7b33580e39f74bba9d19873f841a2a8e~tplv-tt-shrink:640:0.image

这也很像人类学习的过程,具体信息的学习固然重要,同时知识与逻辑的学习也必不可少。知识既构成了人的通识能力基础,也可以显著提升具体能力的学习与应用。在大模型领域,知识与深度学习的结合起到了事半功倍的效果。

与此同时,文心大模型还强化了跨语言、跨模态的学习能力。在技术的不断迭代之下,文心大模型的泛化能力更强,可以适应更具体真实的任务应用,尤其是处理小样本学习任务的能力。

c32450eeffae40568a2fa9f5ba6d2273~tplv-tt-shrink:640:0.image

(鹏城-百度·文心模型结构图)

这条差异化之路,让鹏城-百度·文心千亿大模型可以实现更高效率的学习,并在同等参数空间下实现效果更优,并且符合真实场景的应用需求。而能够实现知识增强这条新路的开拓,得益于百度在知识、深度学习、以及模型开发训练并行且长期的布局积累,也得益于鹏城云脑Ⅱ提供的强大算力。

中国AI的积累、实力与需求,共同构成了差异化之路的起点。从这个意义上来看,知识增强大模型的价值并不仅仅在大模型本身。

走向通用:百度文心的应用拓展空间

BERT、GPT-3等大模型确实取得了惊人的效果,但大模型也经常因为应用上的滞后性引发质疑。其原因主要来自两方面:一是大模型的算力需求过大,成本高昂;二是大模型的泛化能力欠佳,经常难以解决应用场景中复杂多变的实际问题。

面对这些问题,鹏城-百度·文心实现了更强的应用能力。在场景化应用方案中,鹏城-百度·文心可以实现多尺寸的模型蒸馏,甚至以极小尺寸适配具体需求,降低大模型使用门槛与成本。

在通用能力上,通过与知识的结合加上跨语言、跨模态能力的融入,文心大模型可以适配更加多样化、通用化的任务,在通信、金融、医疗等领域具备广泛的应用前景与想象空间。

鹏城-百度·文心在60多项国际著名任务上取得了领先优势,其中有30多项是小样本、零样本学习的任务,表明了鹏城-百度·文心的泛化应用能力更强,可以低门槛适配行业需求与行业能力。

551d99b2614241c68074a90a7ac9dc35~tplv-tt-shrink:640:0.image

(鹏城-百度·文心小样本学习效果)

2ddd236ce7f446fe8077bde7ba0b2d49~tplv-tt-shrink:640:0.image

(鹏城-百度·文心零样本学习效果)

在金融领域,文心大模型赋能可以结合百度全流程AI开发平台BML提供的模型再训练能力,基于定制的保险合同条款“智能解析模型”,完成一份合同内近40个类目条款的智能分类,让业务员处理单份合同文本的时长缩短到1分钟,速度提升几十倍。在智能客服领域,文心大模型可以有效提升服务的精准性。这一能力目前已经在浦发银行、中国联通等国内众多企业中得到应用。

整体而言,文心大模型在相对复杂、有考验性的应用场景具备更加强大的表现。比如媒体创作、医疗文本分析、金融信息研判、合同分析等等,这些应用空间非常广阔,并且能够适配的AI技术净值很高,具有明确的商业化动力。

AI正在走向工业大生产,其中核心就是让实验室中的强大AI能力,走入产业,拥抱真实需求。而这就需要大模型具备更强的通用化能力,鹏城-百度·文心正是踏出了这样的关键一步。

文心之路,自立之路:中国AI的飞翔之地

从技术差异和应用场景出发,我们其实可以从鹏城-百度·文心和百度文心大模型里看到更远。如今,科技自立成为了时代潮流与企业责任,而到底什么是真正的科技自立呢?从鹏城-百度·文心中,我们或许能找到一些新的经验与标准。

在全球瞩目的大模型领域中,知识增强大模型成功打破了固有边界,跳出了“质变没有就拼量变”的传统逻辑。科技自立不是你有什么我也要照猫画虎,你有千亿参数我有万亿参数,而是结合自己的特点与需求,走出能够引领潮流,有独特发展空间的差异化之路。

此次百度的大模型最新发布亮相,可以看到中国AI厚积薄发,学中能变的时代脚步。

在前沿探索上,百度文心大模型在知识增强这个关键点上打破了大模型的产业壁垒,探索全新的技术可能与应用特性,并且将跨语言、跨模态等前沿技术融入其中,构筑更具领导力的技术创新,让中国AI不再仅仅成为模仿者。

在产业协作,百度与鹏城云脑Ⅱ的合作,可以说是集合了中国AI的“最强实力组合”。“鹏城云脑Ⅱ”是自主研发的E级AI算力平台,曾在多个国际性能测试比赛中夺冠。鹏城-百度·文心将基础设施与前沿产业探索进行了有效适配。这种产学一体,软硬件协作,有效利用鹏城云脑Ⅱ作为创新底座的方式可以说是中国AI所独有,在未来很长一段时间将是中国AI产业的特殊优势。

在战略协同中,鹏城-百度·文心可以有效融入百度云智一体的战略架构,大模型通过飞桨的技术创新特性带来高效的训练结果,同时大模型也天然与百度智能云结合,构成了开发者和企业选择百度的动力。云智一体,指向泛化应用与产业需求的AI发展策略,也是中国AI的独特一面。

从源头技术创新,到大模型的知识增强之路;从飞桨核心技术的有效利用,到与鹏城云脑的软硬件合作,鹏城-百度·文心千亿大模型的每一步都根基于自主,每一个选择都趋向于自立。这种既能破壁求变,也能务实协同的发展方法,就是中国AI的飞翔之地。

最近有个话题频频登上热搜,叫做“中国有伟大的知识宝库”。在知识增强的创新之路中,鹏城-百度·文心指向的,就是中国AI这样一个伟大的知识宝库.

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41060

    浏览量

    302568
  • 百度
    +关注

    关注

    9

    文章

    2389

    浏览量

    95184
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    德州仪器音频业务的核心战略与差异化布局

    近日,德州仪器 (TI) 模拟音频业务副总裁 Vikas S V接受了多家行业媒体采访,围绕音频技术从“发声元件”向“环境感知传感器”的范式转变,系统阐述了TI音频业务的核心战略与差异化布局。
    的头像 发表于 04-23 09:59 191次阅读

    力钜新能源(中山)有限公司:专注差异化锂电池,以创新技术驱动定制未来

    在锂电池技术日新月异、市场竞争日趋激烈的今天,力钜新能源(中山)有限公司(以下简称“力钜新能源”)凭借其前瞻性的战略布局,并未选择同质化的“价格战”,而是坚定地走出了一条“差异化”与“定制化”的特色
    发表于 03-28 15:18

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识
    的头像 发表于 03-17 11:14 290次阅读
    NVIDIA 成立由<b class='flag-5'>全球</b>领先 <b class='flag-5'>AI</b> 实验室组成的 Nemotron Coalition,推动开放前沿<b class='flag-5'>模型</b><b class='flag-5'>发展</b>

    AI硬件全景解析:CPU、GPU、NPU、TPU的差异化之路,一文看懂!​

    CPU作为“通用基石”,支撑所有设备的基础运行;GPU凭借并行算力,成为AI训练与图形处理的“主力”;TPU在Google生态中深耕云端大模型训练;NPU则让AI从“云端”走向“身边”(手机、手表
    的头像 发表于 12-17 17:13 2222次阅读
    <b class='flag-5'>AI</b>硬件全景解析:CPU、GPU、NPU、TPU的<b class='flag-5'>差异化</b><b class='flag-5'>之路</b>,一文看懂!​

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

    ,国产 AI 产业正展现出从技术追赶到在特定领域实现差异化领先的强劲趋势 。 当前的技术迭代的重点集中在编程和 Agent 能力等方面 ,同时 ,国产模型更注重性价比和
    的头像 发表于 11-24 14:01 722次阅读

    英搏尔、汇川等差异化破局车载电源赛道

    ,汇川技术、英搏尔、英威腾等多家车载电源企业陆续披露三季报。在新能源汽车渗透率逼近50%的背景下,看似共享行业红利的头部企业,其业绩表现已呈现出“规模领跑、快速突围、稳健抗波动”的三重分化态势。 一、车载电源企业核心数据拆解:规模与盈利呈现差异化发展
    的头像 发表于 10-29 10:43 717次阅读
    英搏尔、汇川等<b class='flag-5'>差异化</b>破局车载电源赛道

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    PLM - 基础知识、优势和差异化

    变化的市场需求做出快速反应,尤其是在日益全球化和复杂化的世界中。 实施过程中的挑战 引入PLM系统会遇到各种挑战: 整合现有系统:ERP、MES或CAD系统等IT解决方案需要连接在一起 多学科
    发表于 07-30 14:26

    传音控股如何实现差异化发展

    近日,央视财经频道高端访谈节目《对话》以“如何破内卷”为主题,邀请了多位企业家、专家和媒体人代表共同探讨“内卷”的本质、根源与破局之道。传音控股创始人、董事长竺兆江受邀参与节目录制,围绕传音如何跳出“内卷”陷阱、实现差异化发展进行了深度分享。
    的头像 发表于 07-28 10:19 1184次阅读

    锂电池制造行业MES特色解决方案:差异化生产管控与智能工厂实践

    一、电池行业MES特色解决方案 不同规模的锂电池企业和不同应用场景的产品,对MES系统有着差异化的需求,这促使MES供应商开发了多种具有行业特色的解决方案。 1. 电芯与电池包(PACK)生产
    的头像 发表于 07-17 15:37 929次阅读
    锂电池制造行业MES特色解决方案:<b class='flag-5'>差异化</b>生产管控与智能工厂实践

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅
    的头像 发表于 06-30 14:37 3969次阅读

    华为出席5G-A网络赋能差异化体验产业圆桌

    近日,在2025 MWC上海期间,由IMT-2020(5G)推进组和中国移动主办、华为承办的5G-A网络赋能差异化体验产业圆桌成功举行。来自运营商、终端厂家、产业联盟和设备厂家的领导和专家共同探讨
    的头像 发表于 06-26 13:42 1226次阅读

    ArkUI-X平台差异化

    逻辑不同,或使用了不支持跨平台的API,就需要根据平台不同进行一定代码差异化适配。当前仅支持在代码运行态进行差异化,接下来详细介绍场景及如何差异化适配。 使用场景 平台差异化适用于以下
    发表于 06-10 23:08

    面向AI WAN的华为解决方案释放算网潜能 使能差异化服务

    凯受邀发表了“AI WAN释放算网潜能,使能差异化服务”的主题演讲。 刘凯指出,AI快速发展正催生多元化业务形态,这不仅深刻改变着人们的生活方式和工作模式,更对通信网络提出更高技术要求
    的头像 发表于 05-19 09:33 1009次阅读
    面向<b class='flag-5'>AI</b> WAN的华为解决方案释放算网潜能 使能<b class='flag-5'>差异化</b>服务

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进
    发表于 04-28 11:05