0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

百度 来源:百度 2025-05-21 18:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百度在520居然还领了个证?是它,信通院当前大模型最高评级证书

7999959c-3570-11f0-afc8-92fbcf53809c.png

在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果——

百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

AI Day现场,百度吴甜系统性讲解了文心大模型最新版的技术创新。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

79b02a14-3570-11f0-afc8-92fbcf53809c.jpg

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示:

评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

79c72d5e-3570-11f0-afc8-92fbcf53809c.jpg

举两个例子——

当你把一张外文的药品说明书拍照上传到文心大模型4.5 Turbo,它可以:

◎ 看懂图片:不仅能识别图片中的文字,还能根据图片内容判断这是“用于缓解肌肉或关节疼痛的药品”;

◎ 多语种翻译:把识别出的日文翻译成中文,并根据图示中的红色字标记重点,比如注意事项等。

这样一来,即使你完全不懂日语,也能快速搞明白这药是干什么的、怎么用才安全。

79d82a46-3570-11f0-afc8-92fbcf53809c.png

你还可以拍照上传作业题目,让文心X1 Turbo解答:

7a1059c0-3570-11f0-afc8-92fbcf53809c.png

◎它会先思考解答这个题目的思路;

◎ 自主规划,识别图片中的明面信息和隐藏含义;

◎ 再思考分析,反思每个答案的准确性;

◎ 最后,给出详细步骤和答案。

思维与行动融合的指导模式,绝对比家长辅导有耐心!

7a6af1aa-3570-11f0-afc8-92fbcf53809c.gif

//多模态大模型:提升学习效率和效果

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。

针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

//自反馈增强框架:让模型学会“自我迭代”

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,因为通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

//深度思考:从“单线思维”到“复合思维”

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

//数据建设闭环:实现快速、高效的数据生产

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

从多项基准测试结果来看,文心大模型4.5 Turbo、X1 Turbo表现出色,效果领先。

7a9e4b04-3570-11f0-afc8-92fbcf53809c.png

7ab0e322-3570-11f0-afc8-92fbcf53809c.png

7acf5956-3570-11f0-afc8-92fbcf53809c.png

//更前瞻、更具想象力的创新应用

大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。

而在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。此外,基于飞桨文心,百度在全国范围内落地了7个产业赋能中心和7个教育创新中心,以及两个数据生态中心,形成了繁荣的良性发展生态。

7ae2cf36-3570-11f0-afc8-92fbcf53809c.png

//16岁高中生:打开文心一言,就像打开新华字典一样

本次AI Day ,我们还邀请到了一位16岁的高中生——陈君航。这位来自福建惠安第三中学的高一学生,从2023年就开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

初次接触文心一言时,陈君航正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他说,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

陈君航还借助文心一言从零自学了Python,开发出“智能文案生成器”帮妈妈减轻繁重的教学任务,原本三天的工作,现在只需几小时就可以完成。

当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。

“领证”并不是终点,大模型能力的进一步拓展,对创新应用的探索仍在继续!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2401

    浏览量

    95398
  • 文心一言
    +关注

    关注

    0

    文章

    134

    浏览量

    2252
  • 大模型
    +关注

    关注

    2

    文章

    3883

    浏览量

    5310

原文标题:今天520,我们领了个证

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度模型5.1正式发布

    新一代基础大模型模型 5.1正式发布! 5.1采用“多维弹性预训练”技术,仅以业界同规
    的头像 发表于 05-11 14:21 375次阅读
    <b class='flag-5'>百度</b><b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>5.1正式发布

    百度发布5.1:预训练成本降至行业6%

    5月9日,百度正式发布新一代基础大模型5.1。该模型基于百度自研的"多维弹性预训练"技术,在
    的头像 发表于 05-09 11:05 673次阅读

    沐曦股份曦云C系列GPU产品Day 0适配百度ERNIE-Image文生图模型

    4月15日,百度模型团队重磅推出ERNIE‑Image文生图模型,沐曦股份曦云 C 系列 GPU 已完成对 ERNIE‑Image 的
    的头像 发表于 04-15 17:39 623次阅读

    海光DCU Day0适配百度ERNIE-Image文生图模型

      今天,百度模型团队发布ERNIE-Image文生图模型,海光DCU同步完成Day0适配与深度调优。全球开发者、科研机构和企业现可免
    的头像 发表于 04-15 15:47 431次阅读

    瀚博半导体宣布深度参与百度飞桨黑客松生态活动

    近日,瀚博半导体正式宣布深度参与百度飞桨主办的黑客松生态活动。面向全球开发者开放旗下载天系列加速卡开发环境,支持部署百度ERNIE-4.5 系列开源
    的头像 发表于 04-11 09:41 827次阅读

    百度衍生模型PaddleOCR登顶GitHub Star OCR全球第一

    3月30日,百度衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌Tesseract OCR,成为全球Star数最高
    的头像 发表于 03-31 11:40 590次阅读

    百度模型5.0正式版上线

    今天,在百度Moment大会现场,模型5.0正式版上线。
    的头像 发表于 01-23 16:48 1618次阅读

    百度模型5.0 Preview荣登LMArena文本榜国内第一

    12月23日,LMArena大模型竞技场发布最新排名,模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名国内第一该
    的头像 发表于 12-23 15:02 751次阅读

    百度模型5.0-Preview文本能力国内第一

    11月8日凌晨,LMArena大模型竞技场最新排名显示,全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第一该
    的头像 发表于 11-11 17:15 1742次阅读

    中兴通讯智研开发智能体荣获最高评级

    近日,中兴通讯兴云数科推出面向基础工业软件的智研开发智能体,荣获中国信通可信AI软件开发智能体工具4+级评级,成为国内首批获得当前最高评级
    的头像 发表于 09-26 15:29 1060次阅读

    百度模型X1.1正式发布

    今天,在WAVE SUMMIT深度学习开发者大会2025上,模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。
    的头像 发表于 09-10 11:08 2467次阅读

    中兴努比亚启动接入百度4.5系列开源大模型

    近日,中兴努比亚启动接入4.5系列开源大模型,为星云智能提供新引擎,共同推动人工智能在AI手机的创新应用,加速AI技术落地,进一步提升用户AI体验。
    的头像 发表于 07-15 09:35 1262次阅读

    宁畅与与百度模型展开深度技术合作

    近日,百度正式开源模型4.5系列模型。作为
    的头像 发表于 07-07 16:26 1110次阅读

    商汤大装置万象大模型开发平台获得中国信通最高评级

    近日,中国信息通信研究(以下简称“中国信通”)完成可信AI《大模型推理平台通用能力成熟》首轮评估。
    的头像 发表于 07-01 10:48 1202次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究(以下简称“中国信通”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有模型
    的头像 发表于 06-11 11:57 1648次阅读