0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度CTO王海峰:知识增强大语言模型具备人工智能的四项基础能力

百度 来源:百度 2023-09-23 14:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月21日,由科学技术部、中国工程院、清华大学共同发起主办的长城工程科技会议“人工智能赋能高质量发展”主题大会在清华大学召开。科技部党组书记、部长王志刚、清华大学党委书记邱勇致辞,中国工程院潘云鹤院士、中国科学院张钹院士等多位学术界、产业界专家围绕人工智能技术前沿与产业发展分享了真知灼见。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以《人工智能技术生态与产业模式》为题作主旨报告。会上,王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为发展通用人工智能带来曙光。

早在2019年,王海峰就曾提出,深度学习具有很强的通用性,并具备标准化、自动化和模块化的工业大生产特征,推动人工智能进入工业大生产阶段。四年来,深度学习技术和应用的发展充分验证了这一观点。深度学习技术的通用性越来越强,深度学习平台的标准化、自动化和模块化特征越来越显著,而预训练大模型的兴起,使得人工智能应用的深度和广度进一步拓展,技术生态更加完善。人工智能已进入工业大生产阶段。

标准化方面,框架和模型联合优化,多硬件统一适配,应用模式简洁高效,大幅降低人工智能应用门槛;自动化方面,从训练、适配,到推理部署,提升人工智能研发全流程效率;模块化方面,丰富的产业级模型库,支撑人工智能在广泛场景的便捷应用。

据了解,得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进,贯通了深度学习全产业链,飞桨生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。伴随大模型的发展,百度推出了星河大模型社区,寓意“文心加飞桨,翩然赴星河”,与开发者共享共创大模型生态。

王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为发展通用人工智能带来曙光。

具体而言,人工智能的典型能力如创作、编程、解题、规划等都依赖于理解、生成、逻辑、记忆等核心基础能力,依赖程度有所不同。以解题为例,从读懂题目、解答题目到最后写出答案,需要理解、记忆、逻辑及生成能力的综合运用。

知识增强大语言模型文心一言充分验证了这一点。在训练数据规模和参数规模相同的情况下,纯中文模型比多语言模型生成能力强,理解和逻辑能力弱。文心一言首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。在检索增强和知识增强的基础上,通过知识点增强,提升对世界知识的掌握和运用;通过逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络,提升逻辑推理能力。进一步地,通过多种策略优化数据源及数据分布、基础模型长文建模、多类型多阶段有监督精调、多任务自适应有监督精调、多层次多粒度奖励模型等技术创新,全面提升基础通用能力。

效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。根据人民数据、新华网等多个公开测评,文心大模型3.5支持下的文心一言综合能力超过ChatGPT,遥遥领先于国内其他大模型。IDCAI大模型技术能力评估报告,2023》显示,文心大模型3.5拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

aa7c8058-59d9-11ee-939d-92fbcf53809c.png

IDC《AI大模型技术能力评估报告,2023》: 百度获算法模型、行业覆盖唯一满分

应用方面,通过数据驱动、提示构建,以及插件增强进行场景适配,协同优化。文心一言已上线百度搜索、览卷文档、E言易图、说图解画、一镜流影等原生插件,使模型具备生成实时准确信息、长文本摘要和问答、数据洞察和图表制作、基于图片的创作和问答、文生视频等能力。插件机制扩展了大模型能力边界,更适应场景需要。

数据显示,文心一言在8月31日率先面向全社会开放服务,首日回答了网友3342万个问题,细分应用场景丰富,包括文案创意、教育咨询、代码生成等,目前已有15万企业和2万多插件开发者申请接入。

面对大模型产业化的挑战,王海峰表示,类似芯片代工厂,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。这一产业化路径已在文心大模型产业实践中得到验证,百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型。以文心一言等大语言模型为代表的人工智能正在深入千行百业,加速产业升级和经济增长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50318

    浏览量

    266897
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11341
  • 深度学习
    +关注

    关注

    73

    文章

    5605

    浏览量

    124618

原文标题:百度CTO王海峰:知识增强大语言模型具备人工智能的四项基础能力

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉大模型开发实战 - 2026必会

    视觉大模型特训:从原理到部署一站式学会 在科技飞速发展的当下,视觉大模型已成为人工智能领域的一颗璀璨明星,广泛应用于安防监控、自动驾驶、医疗影像分析等众多领域,深刻改变着我们的生活与工作方式。如今
    发表于 04-15 16:06

    九天菜菜大模型agent智能体开发实战2026一月班

    架构层面来看,大模型 Agent 犹如一个精密协作的智能系统。其“大脑”由大模型担当,凭借强大语言理解和生成
    发表于 04-15 16:04

    百度文心大模型5.0正式版上线

    今天,在百度文心Moment大会现场,文心大模型5.0正式版上线。
    的头像 发表于 01-23 16:48 1481次阅读

    云知声荣膺量子位2025人工智能年度榜单四项大奖

    近日,以“共生无界,智启未来”为主题的MEET2026智能未来大会在北京举行。会上正式揭晓了「2025人工智能年度榜单」,云知声一举摘得2025人工智能年度焦点人物、2025人工智能
    的头像 发表于 01-06 16:43 745次阅读

    光庭信息成为百度智能云大模型行业合伙人

    论坛上,光庭信息作为受邀企业出席,正式成为百度智能云“大模型行业合伙人”,并荣获“行业卓越贡献伙伴奖”。这标志着双方合作进入了一个全新的阶段,将为AI+汽车产业智能化升级创造更大价值。
    的头像 发表于 09-02 16:17 971次阅读

    昆仑芯科技亮相2025百度云智大会

    近日,2025百度云智大会在北京国家会议中心二期隆重启幕。本届大会以“智能,生成无限可能”为主题,聚焦人工智能从技术到产业的全链条落地,深入探讨AI赋能千行业的实践路径与未来机遇。
    的头像 发表于 09-01 11:00 1482次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义 ML 模型本质上是一个手动过程,需要高度的数据科学
    发表于 08-31 20:54

    百度智能云亮相第二十二届ChinaJoy

    百度智能云亮相第二十二届ChinaJoy 8月1日,第二十二届中国国际数码互动娱乐展览会(ChinaJoy)在上海开幕。大会期间,百度全景展示了百度
    的头像 发表于 08-05 09:47 927次阅读

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能
    发表于 07-04 11:10

    65%央企大模型落地首选百度智能

    今天,很荣幸地分享一个好消息,百度智能云已牵手65%的央企,共同推进大模型产业落地。得益于全栈的AI能力百度联合众多央国企伙伴,针对各类不
    的头像 发表于 06-11 15:44 1019次阅读

    百度地图重磅发布地图AI开放平台

    近日,在WGDC25全球时空智能大会上,百度地图重磅发布地图AI开放平台。百度地图深耕20年的数据能力、引擎能力与AI技术全面开放,向开发者
    的头像 发表于 05-26 11:26 1998次阅读

    百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

    百度在520居然还领了个证?是它, 信通院当前大模型最高评级证书 ! 在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估
    的头像 发表于 05-21 18:19 1396次阅读
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo获得信通院当前大<b class='flag-5'>模型</b>最高评级证书

    百度智能云两大基础设施再升级

    近日,在Create2025百度AI开发者大会上,沈抖分享了百度智能云在智能基础设施建设方面的最新成果,并在算力、模型及应用等方面发布一系列
    的头像 发表于 04-30 10:20 1319次阅读

    百度发布文心4.5 Turbo、X1 Turbo和多款AI应用

    近日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型
    的头像 发表于 04-30 10:16 1320次阅读