0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

旷视借助大模型与智能体推动算法落地

旷视MEGVII 来源:旷视MEGVII 2025-10-11 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当下,AI技术繁荣无比,但无数企业却陷入“叫好不叫座”的困境:算法模型很先进,但一到真实的行业场景中就“水土不服”。问题究竟出在哪?大模型和智能体的兴起,又为我们提供了怎样的新解题思路?本文将深入探讨算法落地的核心痛点,并阐述我们如何借力新技术,打造出真正解决问题的产品。

一、 落地之困:价值兑现的“最后一公里”难题

尽管技术不断突破,但算法在深入行业应用时,依然面临几个核心挑战:

“专用”与“通用”的矛盾:

传统小模型要求算法定义明确,功能上稍作调整或者换一个细分场景都需要重新开发,研发成本高、周期长,难以规模化复制;

“感知”与“认知”的割裂:

由于小模型并不具备“类似于人的认知”,因此要求给出明确的算法定义,而对于部分需求而言,算法定义难以设计,因而这些功能无法被有效实现出来;

“交付”与“优化”的断层:

行业落地过程中,算法上线只是开始,持续不断的优化非常关键,仅仅提供算法本身是不够的。

二、破局之器:大模型与智能体的特性与优势

幸运的是,技术本身也在演进,大模型和智能体带来了新的可能性:

大模型的特点

“通用”但不“专精”

模型的能力来自于数据。得益于大量互联网数据的训练,目前的基础大模型具备了广泛的知识,但这些知识落到具体某个行业、场景上,就非常依赖于对应行业、场景的数据是否在互联网上出现过,以及出现过多少。所以,在我们看来,大模型在不同的场景下会有截然不同的表现,比如马路上的行人检测精度不错,但是油田场景中抽油机的驴头检测却效果不佳。基于大模型的这一特点,可以通过提示词快速赋能某个具体场景,但不少情况下也需要做行业化的迭代。

与人类形成模糊意义的“认知”对齐:

大模型除了能作为快速赋能的工具之外,还具备一些小模型不具备的能力,大模型与人类从模糊意义上来说认知是对齐的,这跟人与人之间的认知对齐形式非常像。举个例子,比如消防通道堵塞问题,对于人来说,即便是安全主管对安全员说“这条安全通道很重要,务必不能堵塞”,不同的安全员收到这个任务后的执行情况也会因人而异。如下图所示,这四种情况可以看作是不同意义上的“消防通道没有堵塞”。因此,人与人之间形成了模糊的认知对齐,而大模型也是如此,本身就能理解诸如消防通道堵塞、沿街晾晒等任务,而不需要像小模型一样在“什么东西堵算堵、堵多少算堵”等问题上纠结,这种模糊对齐的认知恰恰是互联网数据赋予的。

智能体的特点

智能体的两种内在模式:

从智能体底层的实现上来看,主要分为工作流模式和全自主模式。工作流模式指的是“智能体基于预设的方案工作,使用大模型和工具实现目标”,该模式适用于“有相对明确的流程,希望通过自动化来提升效率”的场景,其局限性在于面向新任务的拓展性受限。全自主模式指的是“智能体自主规划决策,以结果为导向”,该模式适用于“只有大致思路甚至没有思路,需要开放式、多路径的探索”的场景,该模式也存在一些问题,在算力消耗、鲁棒性、可信度方面都需要进一步的技术突破。

如何进行模式选择:

“Less structure, more intelligence”,从技术上来说确实如此,毕竟方案设计越少,对模型能力的要求也越高。但是从应用落地的角度上来说,效果好、成本低才是技术实现价值兑现的核心。因此,面向不同的行业、场景做出合理选择是必要的。比如在判断某次施工是否符合预设的流程规范时,工作流模式就是一种不错的选择。

三、解题之道:大小模型协同 & 端到端优化

面对前面提到的落地难点,旷视并未将大模型视为万能药,而是依托于十多年来积累的算法、系统、硬件的全栈技术实力,引入大模型和智能体,完成整体解决方案的升级。

大小模型协同

我们深刻理解大小模型各自的特点,因此采用大小协同架构,让大小模型在最适合的位置发挥价值。具体而言,我们利用大模型的通用属性,为行业场景提供快速接入的解决方案,也利用大模型的强认知属性,作为智能体的大脑中枢;同时,我们也在合适的场景下,用经过行业数据迭代的小模型实现应用降本。以视频巡检智能体为例,不仅集成了行业化的太乙大模型,还在模型库内接入了旷视沉淀的百余种视觉小模型,让视频巡检能够实现任务接入快、运行成本低、算法精度高。

端到端优化

一个AI系统的上线不是终点,而是优化的起点。基于此,旷视经过多年打磨,研发了一套高效的算法生产与应用平台(AIS),基于这套平台,我们实现了从数据到模型、从软件到硬件、从研发到落地的有机结合,解决了算法模型“交付即落后”的行业痛点,实现了技术与场景的“双向赋能”和协同进化。举例来说,使用这套平台可以快速实现三步走式的行业算法生产范式。在新场景落地初期,核心诉求、算法边界尚不明了,此时可以通过零样本、少样本技术快速调试基础模型,实现“从无到有”;在小范围使用一段时间后,可以依托于实际场景的数据做场景化训练,实现“从有到优”;最后,对于部分任务而言,积累了一定量的数据、认知后,可以产出场景模型与算法,实现“使用降本”。

结语:迈向“双向赋能”的新阶段

算法的价值,最终必须在场景中兑现。大模型和智能体不是炫技,而是我们解决老问题的新答案。它们让我们能够搭建一座桥梁,连接技术的无限可能性与行业的真实需求,真正实现技术与场景的双向奔赴、协同进化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能体
    +关注

    关注

    1

    文章

    560

    浏览量

    11647
  • 旷视
    +关注

    关注

    0

    文章

    90

    浏览量

    6942
  • 大模型
    +关注

    关注

    2

    文章

    3771

    浏览量

    5273

原文标题:算法落地之困:旷视如何用大模型与智能体破局?

文章出处:【微信号:megvii,微信公众号:旷视MEGVII】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智能硬件的敏捷法则

    对话硬件研发负责人王飞:当算法从“感知”走向“行动”,硬件如何成为智能的最佳载体?
    的头像 发表于 04-15 09:34 439次阅读

    【2025夏季班正课】大模型Agent智能开发实战 课分享

    【2025年12月班】大模型与Agent智能开发实战] 拒绝碎片化:体系化学 Agent 开发方法的技术深度剖析 在当今的人工智能应用开发领域,一种浮躁的“碎片化”风气正在蔓延。许多
    发表于 03-29 16:12

    助力第九届中关村国际前沿科技大赛总决赛举办

    3月26日,2026中关村论坛年会——第九届中关村国际前沿科技大赛总决赛在中关村国际技术交易中心举办。首席算法官葛维受邀担任本届大赛技术专家评委,与来自全球的顶尖创新者共同见证了前沿科技的激烈角逐与高光时刻。
    的头像 发表于 03-28 13:53 1623次阅读

    RAG、MCP与智能:大模型落地的三道关

    模型能力越来越强,但落地没那么快。从单次对话到多步任务,中间隔着系统工程。这篇文章聊三个绕不开的技术方向:RAG、MCP和智能。 一、RAG:让
    的头像 发表于 03-19 13:55 142次阅读

    Nullmax智能机方案加速推动L2级ADAS普惠落地

    作为领先的 AI 科技公司,Nullmax 凭借卓越的视觉感知技术、全栈软件算法能力与平台化战略布局,构建了覆盖高中低不同配置需求的辅助驾驶产品矩阵,可支持全场景端到端、行泊一、舱驾一及前
    的头像 发表于 03-16 14:58 456次阅读

    积极参与国家人工智能应用中试基地建设

    12月4日,“AI终端共创未来”国家人工智能应用中试基地(深圳、东莞)发布会在珠海举行。此次发布会响应国家“人工智能+”战略,旨在汇聚粤港澳大湾区产业优势资源,推动AI+移动终端领域高质量发展,共同打造世界级AI终端产业创新高地
    的头像 发表于 12-15 11:50 543次阅读

    Nullmax MaxDrive Basic智能机及小域控方案

    机产品结构紧凑,主要集成前摄像头模组、图像处理单元 (CPU/GPU/DSP) 以及智能驾驶软件算法,可高效快速部署 ADAS 功
    的头像 发表于 11-24 14:28 864次阅读
    Nullmax MaxDrive Basic<b class='flag-5'>智能</b>前<b class='flag-5'>视</b>一<b class='flag-5'>体</b>机及小域控方案

    入选2025北京人工智能治理案例集

    近日,在2025国际前瞻人工智能安全与治理大会上,由北京人工智能产业联盟编制的《人工智能治理案例集》正式发布。自主研发的统一生物特征安全
    的头像 发表于 11-11 17:56 1493次阅读

    科技AI大模型应用:提效、破局与落地,重塑智能新生态

    在这场数字化转型的浪潮中,腾科技AI大模型凭借其强大的提效能力、破局的创新思维以及切实的落地实践,已然成为重塑智能新生态的重要力量。从企业办公中的高效决策支持,到教育科研里的学术探索
    的头像 发表于 08-18 14:06 1846次阅读
    腾<b class='flag-5'>视</b>科技AI大<b class='flag-5'>模型</b>应用:提效、破局与<b class='flag-5'>落地</b>,重塑<b class='flag-5'>智能</b>新生态

    科技大模型机解决方案:低成本私有化落地,重塑行业智能应用新格局

    当大模型进入 “深水区”,私有化与低成本已成为企业选型的核心考量。腾科技大模型机解决方案,用技术创新打破 “安全与成本不可兼得” 的困境,让各行业都能轻松拥抱
    的头像 发表于 08-07 11:06 2037次阅读
    腾<b class='flag-5'>视</b>科技大<b class='flag-5'>模型</b>一<b class='flag-5'>体</b>机解决方案:低成本私有化<b class='flag-5'>落地</b>,重塑行业<b class='flag-5'>智能</b>应用新格局

    科技与云舟智维合作打造装备维修智能化平台

    近日,科技与云舟智维携手合作,共同打造装备维修智能化平台,这是全球首个大型装备智慧维保智能
    的头像 发表于 06-17 17:14 1350次阅读
    <b class='flag-5'>旷</b><b class='flag-5'>视</b>科技与云舟智维合作打造装备维修<b class='flag-5'>智能</b>一<b class='flag-5'>体</b>化平台

    开普云「开悟智核」:极致性价比的智能机,破局大模型应用难题

    当下,AI一机凭借开箱即用、数据可控等优势,成为行业大模型落地的重要载体之一。然而实际应用时,用户却面临诸多问题:算力成本与性能难以平衡;非满血版模型存在“幻觉”、精度低等问题;由于
    的头像 发表于 06-09 10:34 1320次阅读
    开普云「开悟智核」:极致性价比的<b class='flag-5'>智能</b><b class='flag-5'>体</b>一<b class='flag-5'>体</b>机,破局大<b class='flag-5'>模型</b>应用难题

    AI耳机迈入智能时代,2037年65%应用将为智能驱动

    近期发布的TWS耳机。随着智能的到来,AI耳机行业进入新的发展阶段。   基础NLP 大模型能力差距缩小,2037 年65% 应用将为智能
    的头像 发表于 05-24 01:15 7409次阅读
    AI耳机迈入<b class='flag-5'>智能</b><b class='flag-5'>体</b>时代,2037年65%应用将为<b class='flag-5'>智能</b><b class='flag-5'>体</b>驱动

    科技梧桐大模型赋能交通治理

    迭代已实现多场景任务覆盖。近期推出的“梧桐”大模型事件检测和交通抓拍系列产品,将AI能力深度落地于交通治理场景,在算法精度、成像质量和分析性能等方面实现显著提升,赋能交通治理更精准、更智能
    的头像 发表于 05-16 17:23 1282次阅读

    科技2025合作伙伴大会丨业内首次提出“AIoT智能”新理念

    4月29日,春满长安,雁塔风起,2025宇合作伙伴大会在西安国际会展中心隆重举行。宇和近两千名合作伙伴齐聚古都,共探AIoT与行业大模型深度融合的创新实践,共绘智能
    的头像 发表于 04-30 11:08 875次阅读
    宇<b class='flag-5'>视</b>科技2025合作伙伴大会丨业内首次提出“AIoT<b class='flag-5'>智能</b><b class='flag-5'>体</b>”新理念