0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度首席技术官王海峰解读文心大模型的关键技术和最新进展

百度 来源:百度 2024-04-18 09:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能体、代码、多模型等多项文心大模型的关键技术和最新进展。

自去年3月16日发布知识增强大语言模型文心一言以来,百度不断迭代升级文心大模型,技术创新不断,从知识增强、检索增强,进一步发展出知识点增强;基于更大的算力、更多的数据和更强的算法,依托飞桨平台,从文心3.0、3.5,到4.0,文心大模型能力愈加强大,效果和性能全面提升。

14f1c60e-fcd3-11ee-a297-92fbcf53809c.jpg

王海峰表示,智能体是重要的发展方向,会带来更多的应用爆发。智能体是在基础模型上,进一步进行思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。智能体的思考模型像人一样,会阅读说明书,学习工具的使用方法,进而可以调用工具来完成任务。

王海峰解读了智能体的思考过程,演示了智能体如何经过思考调用工具。在文心大模型4.0工具版上,提问“我要到大湾区出差一周。想了解一下天气变化,好决定带什么衣服。请帮我查一下未来一周北京和深圳的温度,告诉我出差应该带什么衣服,并整理成表格。”智能体就像人一样,通过思考、规划,把用户需求拆解成多个子任务,首先调用“高级联网”工具来查询天气信息,然后调用“代码解释器”画温度趋势图,根据未来一周的天气情况,选择了合适的衣物,最后对结果进行思考、确认,并自动汇总成一个表格。

从万亿级训练数据中,文心大模型既学到了自然语言的能力,也学到了代码能力,打通从思考到执行的过程。基于文心大模型的这两种能力,百度开发了代码智能体和智能代码助手。王海峰表示:“代码智能体,让大家都能做之前只有程序员才能做的事,人人都可以成为程序员;智能代码助手,则帮助专业的程序员更高效地写出更好的代码,可以说是程序员的AI同侪。”

代码智能体是在“用模型写代码让复杂的任务变简单”,思考模型加上代码解释器,构成了代码智能体。首先,思考模型理解用户需求,经过思考,把完成任务的指令和相关信息整合成提示,输入给代码解释器;然后,代码解释器根据提示,把自然语言表达的用户需求翻译成代码并执行,得到执行结果或者调试信息;接着,思考模型对代码解释器的执行结果进行反思确认,如果正确,就把结果返回给用户,不正确就继续进行自主迭代更新。

王海峰演示了用代码智能体为本次Create大会嘉宾定制邀请函,代码智能体首先理解了邀请函模版内容,然后生成代码并执行,把嘉宾姓名填写到合适位置,新生成的邀请函文件以嘉宾的名字命名,最后输出打包好的多张邀请函。

大会现场,王海峰进一步透露,在模型效果不断提升的基础上,百度进一步构建了上下文增强、私域知识增强、流程无缝集成等能力。目前智能代码助手Comate整体采纳率达到了46%,新增代码中生成的比例已经达到了27%。Comate把代码理解、生成、优化等能力无缝集成到研发流程的各个环节,就像助理一样,帮助提升代码开发质量和效率。Comate展示了帮助工程师接手代码的过程,通过一条简单的指令,就可以快速了解整个代码的架构,甚至是每一个模块的具体实现逻辑,还可以根据当前的项目代码以及第三方代码自动生成满足要求的新代码。

王海峰现场还分享了多模型技术。他表示,在大模型应用落地过程中,效果,效率和成本都很重要。在实际应用中,需要从场景需求出发,选择最适合的模型。一方面,是高效低成本的模型生产;另一方面,是多模型推理。高效低成本模型生产方面,百度研制了大小模型协同的训练机制,可以有效进行知识继承,高效生产高质量小模型,也可以利用小模型实现对比增强,帮助大模型的训练。同时,建设了种子模型矩阵,数据提质与增强机制,以及从预训练、精调对齐、模型压缩到推理部署的配套工具链。高效低成本模型生产机制,助力应用速度更快、成本更低、效果更好。多模型推理方面,百度研制了基于反馈学习的端到端多模型推理技术,构建了智能路由模型,进行端到端反馈学习,充分发挥不同模型处理不同任务的能力,达到效果、效率和成本的最佳平衡。

15177a66-fcd3-11ee-a297-92fbcf53809c.jpg

除了智能体、代码和多模型技术,文心大模型在其他方面也持续创新,包括基于模型反馈闭环的数据体系、基于自反馈增强的大模型对齐技术,以及多模态技术等。王海峰现场公布,文心大模型4.0的效果持续提升,发布后的半年时间,又提升了52.5%。

15276ad4-fcd3-11ee-a297-92fbcf53809c.jpg

文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%,相比一年前文心一言发布时,训练效率提升到当时的5.1倍,推理105倍。截至目前,飞桨文心生态已凝聚1295万开发者,服务24.4万家企事业单位,基于飞桨和文心创建89.5万个模型。

王海峰表示,文心一言累计用户规模已达2亿,日均调用量也达到了2亿,高效满足了用户工作、生活和学习需求。

1534c698-fcd3-11ee-a297-92fbcf53809c.jpg

最后,王海峰介绍了百度AI人才计划的最新进展,百度在2020年提出了5年为全社会培养500万AI人才,目前这一目标已提前达成。他表示,“未来,我们将继续投身人才培养,让人才的点点星光,汇成璀璨星河。智能时代,人人都是开发者,人人都是创造者,让我们一起,创造美好未来。”

审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2368

    浏览量

    94237
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964

原文标题:百度CTO王海峰解读文心大模型进展:智能体、代码、多模型

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    立讯精密披露在人形机器人领域的最新进展

    11月26日,立讯精密在最新的投资者关系活动记录中披露了在人形机器人领域的最新进展
    的头像 发表于 12-03 14:50 429次阅读

    芯科科技分享在物联网领域的最新进展

    Labs(芯科科技)亚太区业务副总裁禄铭、中国大陆区总经理周巍及台湾区总经理宝陆格就公司技术路线、产品策略及市场趋势回答了媒体提问。三位高管围绕安全认证、无线连接、边缘计算等议题,介绍了公司在物联网领域的最新进展
    的头像 发表于 11-13 10:48 605次阅读

    百度模型X1.1正式发布

    今天,在WAVE SUMMIT深度学习开发者大会2025上,模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。
    的头像 发表于 09-10 11:08 1658次阅读

    宁畅与与百度模型展开深度技术合作

    近日,百度正式开源模型4.5系列模型。作为
    的头像 发表于 07-07 16:26 645次阅读

    百度模型X1 Turbo获得信通院当前大模型最高评级证书

    ,16项达5分,综合评级获当前最高级“4+级”, 成为国内首款通过该测评的大模型X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持
    的头像 发表于 05-21 18:19 1108次阅读
    <b class='flag-5'>百度</b><b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>X1 Turbo获得信通院当前大<b class='flag-5'>模型</b>最高评级证书

    百度发布4.5 Turbo、X1 Turbo和多款AI应用

    近日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了模型4.5 Turbo及深度思考
    的头像 发表于 04-30 10:16 924次阅读

    百度在AI领域的最新进展

    近日,我们在武汉举办了Create2025百度AI开发者大会,与全球各地的5000多名开发者,分享了百度在AI领域的新进展
    的头像 发表于 04-30 10:14 1094次阅读

    谷歌Gemini API最新进展

    体验的 Live API 的最新进展,以及正式面向开发者开放的高质量视频生成工具 Veo 2。近期,我们面向在 Google AI Studio 中使用 Gemini API 的开发者推出了许多不容错过的重要更新,一起来看看吧。
    的头像 发表于 04-12 16:10 1465次阅读

    百度发布模型4.5和文模型X1

    模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解
    的头像 发表于 03-18 16:29 707次阅读

    百度下一代模型正式开源

    随着模型的迭代升级和成本不断下降,一言将于4月1日0时起全面免费,所有PC端和APP端用户均可体验
    的头像 发表于 02-17 13:44 806次阅读

    百度搜索与心智能体平台接入DeepSeek及模型深度搜索

    近日,百度搜索与心智能体平台联合宣布了一项重要更新:将全面接入DeepSeek及模型最新的深度搜索功能。这一更新将为用户和开发者带来
    的头像 发表于 02-17 09:14 969次阅读

    百度模型将升级并开源

    百度近日宣布,其文模型系列将迎来新版本升级,计划在未来数月内逐步推出文模型4.5系列。这一消息无疑为AI领域注入了新的活力。 据悉,
    的头像 发表于 02-14 14:25 743次阅读

    百度模型4月1日起全面免费开放

    近日,百度公司正式对外宣布,其备受关注的模型在经过一系列迭代与优化后,将于4月1日零时全面免费开放给所有用户。此次免费开放的覆盖范围广泛,包括所有PC端及App端用户,让用户能够
    的头像 发表于 02-14 09:19 682次阅读

    凌智电子受邀参加模型生态大会

    12月26日在上海·张江科学会堂,由深度学习技术及应用国家工程研究中心主办,百度飞桨及模型承办,以“模力无限星河共创”为主题的
    的头像 发表于 01-03 16:35 944次阅读
    凌智电子受邀参加<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>生态大会

    FF将发布FX品牌最新进展

    "、"FF"或 "公司")今天宣布,将于2025年1月8日盘后公布其自2024年9月19日FX品牌发布以来的最新进展,包括最新项目进展、重大里程碑、新产品品类战略及下一步计划。
    的头像 发表于 01-03 15:58 973次阅读