0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

文心大模型4.0首发 文心一言用户规模已达4500万

百度 来源:百度 2023-10-22 10:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月17日,以“生成未来”为主题的百度世界2023在北京首钢园举办,百度首席技术官王海峰解读文心大模型4.0背后的关键技术和最新进展。王海峰表示,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升,9月已开始小流量上线,过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。

文心大模型4.0首发 理解、生成、逻辑和记忆能力显著提升

据了解,百度在3月16日发布知识增强大语言模型文心一言。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

文心一言的基础模型5月升级至文心大模型3.5,在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破,取得效果和效率的提升。

今天发布的文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。

据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍,周均的训练有效率超过98%。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。

在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。

此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。

在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。

文心一言助力国图馆藏文化资源活化 升级国家跳水队AI辅助训练系统

百度已经与中国国家图书馆展开战略合作,发挥各自的资源、技术和服务优势,共同推动文化资源和知识服务智能化,普惠大众。国家图书馆拥有全球最大的古代方志,利用文心大模型学习古代方志与家谱数据,帮助全球华人获取更多寻根线索。王海峰现场分享了海外华人赵佩娟延续祖父乡愁,成功“寻根”的故事。

中国国家跳水队教练、奥运五金王陈若琳和奥运冠军全红婵、陈芋汐、王宗源也来到世界大会现场,与王海峰热切互动,解密梦之队训练“独门绝技”。基于文心一言等百度大模型技术,中国国家跳水队AI辅助训练系统全面升级,通过从海量数据和知识中学习,掌握了丰富的跳水知识,理解和执行教练员和运动员的复杂指令,及时提供准确信息,并对动作实时打分、精准量化分析,提供最有价值的指导信息,助力中国国家跳水队高效训练。

现场,陈若琳受中国游泳协会主席周继红委托,授予百度为“中国国家跳水队人工智能合作伙伴”。陈若琳表示,中国国家跳水队与百度从2019年就开展了深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会,目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务,未来双方将携手持续用人工智能技术帮助跳水队智能训练,通过科学训练提升竞技水平。”

百度人才培养星河计划发布 再培养500万大模型人才

王海峰现场公布了百度人工智能人才培养的最新数据,百度在2020年提出5年为全社会培养500万AI人才,截至目前,百度已经培养了420万AI人才。

当下,大模型成为人工智能发展的热点方向,进一步加速产业变革,AI人才培养也需与时俱进。王海峰发布了百度人才培养星河计划,他表示,“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才,让人工智能科技的‘创新之花’,结出更多‘产业之果’,服务国家战略,服务社会发展,服务人民福祉!”






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267736
  • 文心一言
    +关注

    关注

    0

    文章

    134

    浏览量

    2241
  • 大模型
    +关注

    关注

    2

    文章

    3863

    浏览量

    5296

原文标题:百度CTO王海峰:文心大模型4.0首发,文心一言用户规模已达4500万

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    沐曦股份与合作伙伴赛道Meetup上海站即将举办

    沐曦股份携手模型,围绕专属赛题「优化 PaddleOCR-VL-1.5 + MetaX GPU」,共同探索国产算力平台在大模型能力上的部署与推理优化实践。
    的头像 发表于 05-19 10:34 400次阅读

    百度模型5.1正式发布

    代基础大模型模型 5.1正式发布! 5
    的头像 发表于 05-11 14:21 324次阅读
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>5.1正式发布

    百度发布5.1:预训练成本降至行业6%

    5月9日,百度正式发布新代基础大模型5.1。该模型基于百度自研的"多维弹性预训练"技术,在大幅压缩参数
    的头像 发表于 05-09 11:05 633次阅读

    海光DCU Day0适配百度ERNIE-Image文生图模型

      今天,百度模型团队发布ERNIE-Image文生图模型,海光DCU同步完成Day0适配与深度调优。全球开发者、科研机构和企业现可免费在光合开发者社区下载
    的头像 发表于 04-15 15:47 392次阅读

    百度衍生模型PaddleOCR登顶GitHub Star OCR全球第

    3月30日,百度衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌Tesseract OCR,成为全球Star数最高的OCR项目。
    的头像 发表于 03-31 11:40 574次阅读

    太初元碁:40+AI大模型全覆盖,新版本即即适配、上线即可用,实现国产“芯”速度

    、Qwen、GLM、Intern-S1、等在内的40+AI大模型的即即适配,上线即可用,涵盖了DeepSeek、Qwen 、GLM、Seed-OSS、
    的头像 发表于 02-25 09:21 2201次阅读

    百度模型5.0正式版上线

    今天,在百度Moment大会现场,模型5.0正式版上线。
    的头像 发表于 01-23 16:48 1603次阅读

    百度模型5.0 Preview荣登LMArena文本榜国内第

    12月23日,LMArena大模型竞技场发布最新排名,模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名国内第
    的头像 发表于 12-23 15:02 740次阅读

    百度模型5.0-Preview文本能力国内第

    11月8日凌晨,LMArena大模型竞技场最新排名显示,全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第
    的头像 发表于 11-11 17:15 1729次阅读

    百度模型X1.1正式发布

    今天,在WAVE SUMMIT深度学习开发者大会2025上,模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。
    的头像 发表于 09-10 11:08 2456次阅读

    中兴努比亚启动接入百度4.5系列开源大模型

    近日,中兴努比亚启动接入4.5系列开源大模型,为星云智能提供新引擎,共同推动人工智能在AI手机的创新应用,加速AI技术落地,进步提升用户
    的头像 发表于 07-15 09:35 1248次阅读

    宁畅与与百度模型展开深度技术合作

    与部署。 凭借覆盖训练、推理、微调全流程的AI 服务器产品矩阵,宁畅帮助企业在大模型时代键打通算力与应用“任督二脉”,显著缩短模型落地周期。 在已启动的深度技术合作中,双方将基于
    的头像 发表于 07-07 16:26 1096次阅读

    黑芝麻智能与模型技术合作升级

    近日,模型正式开源,黑芝麻智能即日起快速启动与模型技术合作。
    的头像 发表于 07-04 17:24 1614次阅读
    黑芝麻智能与<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>技术合作升级

    龙芯中科与心系列模型开展深度技术合作

              6月30日,4.5系列模型正式开源。龙芯中科在模型开源首日启动技术
    的头像 发表于 07-02 16:53 1529次阅读

    兆芯率先展开心系列模型深度技术合作

    6月30日,百度正式开源模型4.5系列等10款模型,并实现预训练权重和推理代码的完全开源,兆芯率先与心系列
    的头像 发表于 07-01 10:49 1146次阅读