今天,「2025百度十大科技前沿发明」亮相!
从大模型、深度学习框架到智能体、数字人、无人驾驶等AI技术突破,今年发布的十大科技前沿发明涵盖了人工智能算力、框架、模型、场景应用全栈技术体系。
历经十余年技术投入,百度在AI领域积累了丰硕创新成果,人工智能全领域专利已连续七年居国内第一。
《2025人工智能创新与专利白皮书》显示,百度生成式AI、智能体专利中国第一,大模型专利申请量全球第二、中国第一,深度学习专利申请量全球第一,高级别自动驾驶专利族数全球第一。
同时,我们也在积极推进前沿科技发明在内外部场景的应用,加速创新成果落地转化,为产业创造价值。
一同见证前沿发明引领智能跃迁
感受AI应用效果涌现
1.自回归统一建模的原生多模态大模型
本发明是新一代文心大模型的核心技术,提出了业界首个能够同时支持语言、图像、视频、音频统一建模的多模态大模型技术框架,实现了多模态原生统一的融合建模,可同时支持任意模态的理解与生成;在此基础上构建了一种面向大模型的奖励系统,为多环境多任务场景提供高质量的强化学习奖励信号。
2.大模型训练全流程高效容错技术
本发明提出了大模型训练高效容错技术,构建了完备高效的软硬件故障自动召回定位恢复体系,创新性地提出基于大模型通信行为的全场景故障定位方法和零损失训练快照机制,攻克了集群训练中故障定位与召回恢复两大关键难题。同时,通过研制层次清晰、架构合理的容错接入体系及全流程测试框架,在大模型训练过程中实现了高效部署与验证,显著提升故障恢复效率,降低系统故障概率。
3.剧本驱动的高说服力数字人技术
本发明构建了高说服力数字人方案,依托数字人视频生成大模型基座设计了多模协同、高表现力、超长时长的数字人视频生产方案,涵盖可控视频生成技术、超拟真唇形驱动技术、剧本智能创作和AI大脑自主决策4个核心能力,突破大表情/大动作、音容话一致、人-物-场复杂交互等一系列业界难题。
4.基于多智能体协同的AI搜索引擎
该发明创新性地提出了一种AI搜索引擎技术,其核心框架Deep-Search以Master-Planner-Execu-tor-Generator四层智能体体系为技术底座,模拟人类信息处理的“感知-规划-执行-生成”全流程,动态适配从单轮事实查询到复杂多阶段推理的全场景需求。AI搜索引擎,系统地融合显式任务规划、动态工具调用与实时反思机制,为新一代智能搜索提供了核心技术支撑。
5.蒸汽机(文心专精)音视频一体化生成大模型技术
本发明是全球首个中文音视频一体化生成模型,通过多模态信息的精准同步与自然交互,支持分钟级多人有声音视频生成与交互;该发明由自回归扩散建模、有声一体化训练、高性能训推优化三大技术核心构成;通过极致的中文场景高质量数据清洗与结构化描述、训推一致性优化,调教支持长视频生成基座;搭载首创的Latent Multi Modal Planner技术重构生成逻辑,实现视频的全流程有声一体化生成;极致工程优化突破传统扩散模型限制,压缩视频成本,满足生成实时交互。
6.从芯片到集群的跨层级训推一体A基建系统性技水
本发明提出了从芯片到集群的跨层级协同优化、训推一体的AI基建系统性创新技术,计算架构上,首创Ultra Server柜级超节点,兼容多卡;自研XPULink与PD分离架构,全栈优化软硬件协同;存储系统上,自适应元数据架构突破大规模管理瓶颈,专属kVCache加速方案适配Al业务;网络技术上,推理专属2跳可达架构+弹性生eRDMA,构建低时延传输通道;云原生能力上,全链路智能运维(异常自感知/诊断/恢复),AI网关增LLM智能路由。
7.兼容端到端轨迹方案的自动驾驶横纵联合控制技术
本发明提出了一种可兼容端到端轨迹方案的自动驾驶横纵联合控制技术,基于车辆的横纵耦合动力学,设计线性时变模型预测控制器,实现车辆运动的横、纵向联合协同控制,模型假设近似更少,对上游数据依赖更少,横纵向指令更加稳定,实现对传统方案的升级和超越。该发明可完美适配Apollo ADFM的端到端上游轨迹方案,大幅提升安全性和乘坐舒适性,对于低速横向晃动幅度可优化70%,100%消除弯道横向抽动的控制问题。
8.信息流端到端内容理解与序列生成技术
本发明突破了现有推荐系统中内容理解与分发模型相互割裂的局限,首创端到端多模态内容理解与序列生成技术,构建了“理解生成-分发反馈-再理解生成”的自增强闭环。通过全新的多模态语义对齐和动态Token统一量化技术,融合用户快慢反馈,将多模态知识对齐与生成式行为建模深度融合,实现Feed信息流系统从记忆检索,迈向深度理解生成推理的新阶段。
9.飞桨科学计算高效求解技术
本发明基于飞桨的科学计算核心技术,通过组合算子拆分、高阶自动微分、符号表达式的推理和神经网络编译器技术,实现了微分方程的高效求解,解决了科学计算场景高阶微分方程求解的难题。本发明的微分方程求解速度较传统方法提升2到4个数量级,比PyTorch提速115%,被国际知名微分方程求解库DeepXDE唯一推荐;已在飞桨框架中实现,集成于Paddle-Science、PaddleCFD等产品,并实现产业化应用。
10.基于智能体的自进化应用生成技术
本发明以大模型与强化学习为核心,构建了由“需求模型、代码模型、创意模型”组成的三重自进化学习架构,通过自然语言理解用户需求,经由代码模型实现高质量代码生成,并在用户反馈与强化学习机制下形成持续优化的数据飞轮。基于该发明技术的系统不仅能执行代码生成任务,更能在实践中自我学习、逐步提升智能水平,真正实现“越用越聪明”的AI开发助手;其多模型协同机制与端到端轨迹学习技术,打破了传统无代码平台的静态瓶颈,形成可持续演化的智能体编程体系。
这些前沿发明是AI行业新技术趋势的重要反映,其中不少技术已落地内外部场景应用。例如:
信息流端到端内容理解与序列生成技术
该技术突破传统内容理解与分发模型割裂的局限,构建了“理解生成-分发反馈-再理解生成”的自增强闭环,该发明所在的“心流”团队于9月获得今年百度最高奖。
剧本驱动的高说服力数字人技术
曾推动数字人技术进入高质量、低成本、广应用的普惠时代,使数字人具备超拟真、高表现力、AI大脑灵活调度、剧本智能创作等特性。该技术曾支撑罗永浩数字人直播首秀创下GMV5500万元行业纪录。
兼容端到端轨迹方案的自动驾驶横纵联合控制技术
支撑了Apollo领先的控制技术方案,大幅提升自动驾驶车辆的安全性和乘坐舒适性。目前,萝卜快跑已累计提供超1400万次出行服务,安全行驶里程超2亿公里。
……
想了解更多前沿技术?来!就在百度世界2025,11月13日,北京国家会议中心二期,一起见证AI效果涌现时刻。
-
AI
+关注
关注
90文章
38347浏览量
297482 -
百度
+关注
关注
9文章
2368浏览量
94290 -
人工智能
+关注
关注
1813文章
49793浏览量
262049
原文标题:2025百度十大科技前沿发明,亮相!
文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
格灵深瞳精彩亮相百度世界2025大会
百度世界大会亮点 五年五芯 百度宣布打造最硬AI云
百度世界2025进行中 百度昆仑芯超节点亮相 性能巨幅提升
百度快讯:萝卜快跑获批在香港九龙跨区测试;百度2025十大科技前沿发明亮相;入选国家知识产权局首批产业

2025百度十大科技前沿发明亮相
评论