0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰出席2025世界顶尖科学家论坛之国际工程智能大会

思必驰 来源:思必驰 2025-11-04 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前,以人工智能为代表的前沿技术正推动一场新的范式革命,传统的学科壁垒不断被打破,跨学科融合与边界突破为复杂问题提供了新的解决方案。

近日,2025世界顶尖科学家论坛之国际工程智能大会成功召开,大会以“工程智能:面向未来工业体系的智能变革”为主题,全球顶尖学者与产业专家齐聚,共同勾勒由人工智能深度驱动的未来工业新图景。

上海交通大学特聘教授、思必驰联合创始人、首席科学家俞凯应邀出席,发表了《Towards Reliable Task-oriented LLM Agents》主题演讲,深刻剖析了当前大语言模型智能体的核心痛点——“幻觉”问题,创新性的提出了“不确定性感知的可靠性对齐”新范式,为构建真正可靠、可用的人工智能指明了方向。

从“输出错误”到“行为意外”:

智能体时代的幻觉新挑战

演讲伊始,俞凯首先厘清了“智能体”幻觉与传统大语言模型幻觉的本质区别。他指出,传统大语言模型的幻觉主要表现为“事实性错误”,而当大语言模型进化成能够主动执行、调用工具/与环境交互的“智能体”时,其幻觉则升维为“与人类合理预期不一致的行为”。

“例如,当你让智能体‘9点提醒我一下’,它可能并未理解你的意图是设定一个‘提醒’,而是机械地设定了晚上9点的闹钟,甚至回答‘我不能设定闹钟’你可以尝试......”。俞凯表示,这种行为上的偏差,在任务执行中可能带来比事实错误更严重的后果。

他进一步指出,幻觉的根源在于模型内外的“不确定性”。外部不确定性源于训练数据的噪声、缺失或过时信息;内部不确定性则源于神经网络模型的概率生成特性。为解决这些不确定性造成的幻觉问题,产业界形成了两种主流范式:一是通过引入搜索、数学/代码、数据库等工具增强的方式来扩展知识边界;二是通过评估模型输出的置信度,并设定阈值来拒绝低置信度的回答。

然而,这两种范式均面临严峻挑战:工具增强的方式虽扩展了知识,却引发了“工具幻觉”——包括工具的种类、调用时机、格式、内容等幻觉。即使增加训练数据能提升任务成功率,也无法消除“工具幻觉”的发生;而“置信度评估”范式则遭遇了更为棘手的“妄想”问题,即模型在输出完全错误答案时,却表现出极高的置信度,这使得基于阈值的拒答机制近乎失效。

范式转变:

从“消除不确定性”到“管理与利用不确定性”

在深入分析现有范式的局限后,俞凯带领与会者进行了一场认知层面的思辨。他提出,不确定性并非纯粹的缺陷,而是人类认知和交互中的本质属性,有时甚至是高效率沟通的必要条件。

“我们的目标不应是试图彻底消除不确定性,而是要像人类一样,学会识别、管理并利用它。”俞凯强调,“可靠性”的定义需要从单纯的“正确性”转变为综合考量“交互代价”与“有用性”的性价效用平衡。基于这一理念,他提出了第三种范式,即“基于不确定性感知的可靠性对齐”。这一范式的核心在于,将智能体从传统的“回答”或“拒答”扩展为包含“澄清”、“询问”、“切换工具”等在内的“非决定性行动”。

俞凯表示,智能体的可靠性不应片面追求绝对正确率,而应构建一个兼顾“有用性”与“负责度”的框架,让系统学会在不确定中做出合理决策与担当。

实践路径:

单智能体与多智能体的可靠性解决方案

会上,俞凯介绍了在实践中落实新范式的情况。在单智能体可靠性方面,团队通过“显式知识边界感知建模”的方式,来训练智能体明确区分“确定”、“不确定”和“拒答”区域。通过基于知识反馈的强化学习等技术,让智能体学会在信息不足时主动向用户澄清,而非强行执行或直接放弃。例如,当用户查询“请帮我查一下去北京的票价”时,可靠的智能体会主动询问“您从哪个城市出发?”,从而避免因信息缺失而产生的工具调用幻觉。实践证明,该方法显著降低了知识幻觉和工具幻觉,在数值推理和工具调用任务中的幻觉率甚至低于顶尖商业模型。

针对更为复杂的多轮交互场景,则引入“慢思考”精炼机制。对于智能体标记为“不确定”的响应,由一个独立的“精炼模型”进行深度推理和优化,形成“快速思维”负责高精度输出、“慢速思维”处理模糊地带的协同系统,有效解决了多轮对话中不确定性的传播与放大问题。

在多智能体可靠性方面,俞凯提出了“分布式路由选择”架构。不同规模和能力的模型组成一个模型池,面对用户查询,成本较低的小型模型首先进行自我评估,若胜任则直接回答,若不胜任则“路由”给更强大的模型。“这实现了一种既可靠又高效的资源配置,在保证性能的同时,尽可能控制计算成本。”

演讲的最后,俞凯表示,基于“不确定性感知的可靠性对齐”框架能够将人工智能从一台追求绝对正确的“答题机器”,转变为一个能够感知边界、主动沟通、协同决策的“可靠伙伴”。

作为思必驰首席科学家,俞凯带领团队研发的“1+N”分布式大模型智能体系统,也是基于“不确定性感知的可靠性对齐”范式构建。“1”即一个中枢大模型,负责基础语言处理与通用知识整合;“N”即N个垂域模型,针对具体行业场景进行优化,形成可柔性定制的行业语言大模型。现已广泛用于智能汽车、智慧物联、会议办公等领域,成本与响应速度优势显著。

这一创新范式并非一蹴而就,而是建立在俞凯与团队长期的学术研究与产业实践基础上。在今年8月召开的第二十四届中国计算语言学大会(CCL2025)和10月举行的2025年第二十届全国人机语音通讯学术会议(NCMMSC2025)现场,俞凯已就相关研究方向进行了分享,在行业内形成了持续讨论。

“不确定性感知的可靠性对齐”范式切中了AI工程化应用时所遇到问题的要害,引发了在场顶尖科学家与产业专家的共鸣与深入讨论。随着任务型大语言模型智能体在各个行业场景的深度融合,对“可靠性”的重新定义与技术攻坚,已成为推动人工智能纵深发展的关键引擎,并将催生以高质量、高可靠性为特征的新质生产力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50385

    浏览量

    267138
  • 思必驰
    +关注

    关注

    4

    文章

    423

    浏览量

    16057
  • 大模型
    +关注

    关注

    2

    文章

    3811

    浏览量

    5282

原文标题:2025世界顶尖科学家论坛之国际工程智能大会 | 直面“幻觉”挑战,思必驰俞凯提出构建可靠任务型AI新范式

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    苏州市委副书记王维一行莅临考察调研

    调研期间,王维一行实地参观了展厅,董事长、CEO高始兴,
    的头像 发表于 04-10 11:17 829次阅读

    苏州市委书记范波一行莅临调研

    调研期间,范波一行来到,了解人工智能大模型场景研发应用情况。
    的头像 发表于 01-10 09:32 1100次阅读

    首席科学家俞凯教授当选2026年度IEEE Fellow

    日前,全球最大的专业技术组织国际电气电子工程师协会(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(会士)名单,上海交通大学特聘教授、
    的头像 发表于 12-12 11:36 1031次阅读

    中兴通讯崔丽受邀出席2025腾冲科学家论坛

    近日,“2025腾冲科学家论坛”在云南启幕。本届论坛以“科学·AI改变世界”为主题,汇聚包括诺贝
    的头像 发表于 12-09 11:36 800次阅读

    科技亮相2025世界智能网联汽车大会

    10月16日至18日,以“汇智聚能 网联无限”为主题的2025世界智能网联汽车大会(以下简称“本届大会”)在北京隆重举行。作为全场景
    的头像 发表于 10-22 18:22 1113次阅读

    北汽集团2025世界智能网联汽车大会

    10月16日,由工业和信息化部、交通运输部、北京市人民政府共同主办,以“汇智聚能 网联无限”为主题的2025世界智能网联汽车大会暨中国国际
    的头像 发表于 10-17 16:06 897次阅读

    Momenta亮相2025世界智能网联汽车大会

    10月16日,2025世界智能网联汽车大会(WICV)在北京隆重开幕,Momenta作为智能驾驶领域领先企业受邀
    的头像 发表于 10-17 15:57 2359次阅读

    岚科技亮相2025世界机器人大会

    2025年8月,北京·北人亦创国际会展中心,2025世界机器人大会盛大启幕。作为全球机器人与人工智能
    的头像 发表于 08-14 17:22 2398次阅读
    <b class='flag-5'>思</b>岚科技亮相<b class='flag-5'>2025</b><b class='flag-5'>世界</b>机器人<b class='flag-5'>大会</b>

    智光2025世界机器人大会精彩回顾

    8月12日,历经五天的精彩展示与深度交流,2025世界机器人大会于北京亦创国际会展中心圆满落下帷幕。
    的头像 发表于 08-14 11:39 1494次阅读

    航盛集团亮相2025世界智能汽车大会

    近日,以“智联车路云·聚势双循环”为主题的2025世界智能汽车大会在重庆顺利举办。大会邀请了来自近二十个国家的百余名嘉宾,以前瞻视角解构
    的头像 发表于 08-07 17:12 2261次阅读

    科技亮相2025世界人工智能大会

    7月27日,世界人工智能大会(WAIC 2025)上,AI赋能舱驾融合新生态主题论坛顺利召开。本次论坛汇聚了众多行业领袖与专家,共同探讨AI
    的头像 发表于 08-01 16:50 1488次阅读

    澎峰科技亮相2025世界人工智能大会

    近日,2025世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2025)在中国·上海
    的头像 发表于 07-31 18:12 1103次阅读

    亮相2025世界人工智能大会

    近日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC2025)在上海盛大开幕。本届大会
    的头像 发表于 07-31 17:41 1046次阅读

    云知声亮相2025世界人工智能大会

    7月26日—29日,2025世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2025”)在上海召开,国务院总理李强
    的头像 发表于 07-28 17:53 987次阅读

    四维图新旗下杰发科技亮相2025世界半导体大会

    近日,2025世界半导体大会在南京举办。作为中国半导体领域极具影响力和标志性的行业会议,大会紧扣IC设计、晶圆制造等核心技术趋势。四维图新旗下杰发科技副总经理王璐受邀
    的头像 发表于 06-25 14:05 1063次阅读