0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度CTO王海峰:知识增强大语言模型具备人工智能的四项基础能力

百度 来源:百度 2023-09-23 14:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月21日,由科学技术部、中国工程院、清华大学共同发起主办的长城工程科技会议“人工智能赋能高质量发展”主题大会在清华大学召开。科技部党组书记、部长王志刚、清华大学党委书记邱勇致辞,中国工程院潘云鹤院士、中国科学院张钹院士等多位学术界、产业界专家围绕人工智能技术前沿与产业发展分享了真知灼见。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以《人工智能技术生态与产业模式》为题作主旨报告。会上,王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为发展通用人工智能带来曙光。

早在2019年,王海峰就曾提出,深度学习具有很强的通用性,并具备标准化、自动化和模块化的工业大生产特征,推动人工智能进入工业大生产阶段。四年来,深度学习技术和应用的发展充分验证了这一观点。深度学习技术的通用性越来越强,深度学习平台的标准化、自动化和模块化特征越来越显著,而预训练大模型的兴起,使得人工智能应用的深度和广度进一步拓展,技术生态更加完善。人工智能已进入工业大生产阶段。

标准化方面,框架和模型联合优化,多硬件统一适配,应用模式简洁高效,大幅降低人工智能应用门槛;自动化方面,从训练、适配,到推理部署,提升人工智能研发全流程效率;模块化方面,丰富的产业级模型库,支撑人工智能在广泛场景的便捷应用。

据了解,得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进,贯通了深度学习全产业链,飞桨生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。伴随大模型的发展,百度推出了星河大模型社区,寓意“文心加飞桨,翩然赴星河”,与开发者共享共创大模型生态。

王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为发展通用人工智能带来曙光。

具体而言,人工智能的典型能力如创作、编程、解题、规划等都依赖于理解、生成、逻辑、记忆等核心基础能力,依赖程度有所不同。以解题为例,从读懂题目、解答题目到最后写出答案,需要理解、记忆、逻辑及生成能力的综合运用。

知识增强大语言模型文心一言充分验证了这一点。在训练数据规模和参数规模相同的情况下,纯中文模型比多语言模型生成能力强,理解和逻辑能力弱。文心一言首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。在检索增强和知识增强的基础上,通过知识点增强,提升对世界知识的掌握和运用;通过逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络,提升逻辑推理能力。进一步地,通过多种策略优化数据源及数据分布、基础模型长文建模、多类型多阶段有监督精调、多任务自适应有监督精调、多层次多粒度奖励模型等技术创新,全面提升基础通用能力。

效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。根据人民数据、新华网等多个公开测评,文心大模型3.5支持下的文心一言综合能力超过ChatGPT,遥遥领先于国内其他大模型。IDCAI大模型技术能力评估报告,2023》显示,文心大模型3.5拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

aa7c8058-59d9-11ee-939d-92fbcf53809c.png

IDC《AI大模型技术能力评估报告,2023》: 百度获算法模型、行业覆盖唯一满分

应用方面,通过数据驱动、提示构建,以及插件增强进行场景适配,协同优化。文心一言已上线百度搜索、览卷文档、E言易图、说图解画、一镜流影等原生插件,使模型具备生成实时准确信息、长文本摘要和问答、数据洞察和图表制作、基于图片的创作和问答、文生视频等能力。插件机制扩展了大模型能力边界,更适应场景需要。

数据显示,文心一言在8月31日率先面向全社会开放服务,首日回答了网友3342万个问题,细分应用场景丰富,包括文案创意、教育咨询、代码生成等,目前已有15万企业和2万多插件开发者申请接入。

面对大模型产业化的挑战,王海峰表示,类似芯片代工厂,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。这一产业化路径已在文心大模型产业实践中得到验证,百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型。以文心一言等大语言模型为代表的人工智能正在深入千行百业,加速产业升级和经济增长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49756

    浏览量

    261669
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11256
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123921

原文标题:百度CTO王海峰:知识增强大语言模型具备人工智能的四项基础能力

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    光庭信息成为百度智能云大模型行业合伙人

    论坛上,光庭信息作为受邀企业出席,正式成为百度智能云“大模型行业合伙人”,并荣获“行业卓越贡献伙伴奖”。这标志着双方合作进入了一个全新的阶段,将为AI+汽车产业智能化升级创造更大价值。
    的头像 发表于 09-02 16:17 633次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能
    发表于 07-04 11:10

    65%央企大模型落地首选百度智能

    今天,很荣幸地分享一个好消息,百度智能云已牵手65%的央企,共同推进大模型产业落地。得益于全栈的AI能力百度联合众多央国企伙伴,针对各类不
    的头像 发表于 06-11 15:44 745次阅读

    百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

    百度在520居然还领了个证?是它, 信通院当前大模型最高评级证书 ! 在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估
    的头像 发表于 05-21 18:19 1114次阅读
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo获得信通院当前大<b class='flag-5'>模型</b>最高评级证书

    百度发布文心4.5 Turbo、X1 Turbo和多款AI应用

    近日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型
    的头像 发表于 04-30 10:16 930次阅读

    百度发布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的
    的头像 发表于 03-18 16:29 711次阅读

    百度文心大模型将升级并开源

    提供更加高效、智能的服务。与此同时,百度还明确了该系列模型的开源时间,定于6月30日正式对外开放源代码。这一举措将有助于推动AI技术的普及和发展,为更多开发者提供学习和创新的机会。 值得一提的是,
    的头像 发表于 02-14 14:25 750次阅读

    百度智能云千帆AppBuilder全面接入DeepSeek模型

    百度智能云千帆AppBuilder近日宣布,已成功实现对DeepSeek模型的全面接入,为模型落地应用打通了“最后一公里”。这一接入不仅赋予了AppBuilder联网搜索及其他关键组件
    的头像 发表于 02-14 09:35 842次阅读

    百度智能款大模型应用接入DeepSeek

    近日,百度智能云旗下款重量级大模型应用产品——客悦、曦灵、一见、甄知,正式迎来了全新升级,接入了先进的DeepSeek模型。这一重要更新,
    的头像 发表于 02-10 18:00 1133次阅读

    百度智能款大模型应用完成DeepSeek适配

    百度智能云在AI大模型应用方面取得了新的进展。近日,其旗下的客悦、曦灵、一见、甄知款大模型应用产品已正式上线接入DeepSeek
    的头像 发表于 02-10 10:47 744次阅读

    百度智能云点亮昆仑芯三代万卡集群

    近日,百度智能云宣布成功点亮昆仑芯三代万卡集群,这一成就不仅在国内尚属首次,也标志着百度人工智能算力领域取得了重大突破。据了解,百度
    的头像 发表于 02-05 14:58 997次阅读

    清华与百度合作共建生态环境预训练大模型

    训练大模型。这一合作基于清华大学在环境科学领域的深厚研究基础和知识积累,以及百度人工智能技术方面的显著优势。双方将强强联合,致力于将先进的人工智能
    的头像 发表于 01-17 10:04 750次阅读

    清华与百度携手共建生态环境预训练大模型

    近日,在“中国环境科学学会生态环境人工智能专委会成立大会暨学术论坛”上,清华大学环境学院的徐明教授宣布了一重要战略合作。清华大学将与百度携手,共同打造生态环境垂直领域的预训练大模型
    的头像 发表于 01-16 11:07 782次阅读

    百度科启动“繁星计划”

    百度搜索的强大流量,为百度科注入新的活力与动能。 据悉,“繁星计划”预计覆盖超过10万名权威专家,并将涵盖超过100万的知识内容,旨在通过
    的头像 发表于 12-31 10:26 1166次阅读

    启明云端携手文心大模型,共探人工智能新纪元

    人工智能的浪潮中,大模型技术以其强大的数据处理能力和深度学习能力,正成为推动产业升级和创新的核心引擎。12月19日,文心中国行走进广州,启
    的头像 发表于 12-20 15:58 1048次阅读
    启明云端携手文心大<b class='flag-5'>模型</b>,共探<b class='flag-5'>人工智能</b>新纪元