0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

旷视借助大模型与智能体推动算法落地

旷视MEGVII 来源:旷视MEGVII 2025-10-11 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当下,AI技术繁荣无比,但无数企业却陷入“叫好不叫座”的困境:算法模型很先进,但一到真实的行业场景中就“水土不服”。问题究竟出在哪?大模型和智能体的兴起,又为我们提供了怎样的新解题思路?本文将深入探讨算法落地的核心痛点,并阐述我们如何借力新技术,打造出真正解决问题的产品。

一、 落地之困:价值兑现的“最后一公里”难题

尽管技术不断突破,但算法在深入行业应用时,依然面临几个核心挑战:

“专用”与“通用”的矛盾:

传统小模型要求算法定义明确,功能上稍作调整或者换一个细分场景都需要重新开发,研发成本高、周期长,难以规模化复制;

“感知”与“认知”的割裂:

由于小模型并不具备“类似于人的认知”,因此要求给出明确的算法定义,而对于部分需求而言,算法定义难以设计,因而这些功能无法被有效实现出来;

“交付”与“优化”的断层:

行业落地过程中,算法上线只是开始,持续不断的优化非常关键,仅仅提供算法本身是不够的。

二、破局之器:大模型与智能体的特性与优势

幸运的是,技术本身也在演进,大模型和智能体带来了新的可能性:

大模型的特点

“通用”但不“专精”

模型的能力来自于数据。得益于大量互联网数据的训练,目前的基础大模型具备了广泛的知识,但这些知识落到具体某个行业、场景上,就非常依赖于对应行业、场景的数据是否在互联网上出现过,以及出现过多少。所以,在我们看来,大模型在不同的场景下会有截然不同的表现,比如马路上的行人检测精度不错,但是油田场景中抽油机的驴头检测却效果不佳。基于大模型的这一特点,可以通过提示词快速赋能某个具体场景,但不少情况下也需要做行业化的迭代。

与人类形成模糊意义的“认知”对齐:

大模型除了能作为快速赋能的工具之外,还具备一些小模型不具备的能力,大模型与人类从模糊意义上来说认知是对齐的,这跟人与人之间的认知对齐形式非常像。举个例子,比如消防通道堵塞问题,对于人来说,即便是安全主管对安全员说“这条安全通道很重要,务必不能堵塞”,不同的安全员收到这个任务后的执行情况也会因人而异。如下图所示,这四种情况可以看作是不同意义上的“消防通道没有堵塞”。因此,人与人之间形成了模糊的认知对齐,而大模型也是如此,本身就能理解诸如消防通道堵塞、沿街晾晒等任务,而不需要像小模型一样在“什么东西堵算堵、堵多少算堵”等问题上纠结,这种模糊对齐的认知恰恰是互联网数据赋予的。

智能体的特点

智能体的两种内在模式:

从智能体底层的实现上来看,主要分为工作流模式和全自主模式。工作流模式指的是“智能体基于预设的方案工作,使用大模型和工具实现目标”,该模式适用于“有相对明确的流程,希望通过自动化来提升效率”的场景,其局限性在于面向新任务的拓展性受限。全自主模式指的是“智能体自主规划决策,以结果为导向”,该模式适用于“只有大致思路甚至没有思路,需要开放式、多路径的探索”的场景,该模式也存在一些问题,在算力消耗、鲁棒性、可信度方面都需要进一步的技术突破。

如何进行模式选择:

“Less structure, more intelligence”,从技术上来说确实如此,毕竟方案设计越少,对模型能力的要求也越高。但是从应用落地的角度上来说,效果好、成本低才是技术实现价值兑现的核心。因此,面向不同的行业、场景做出合理选择是必要的。比如在判断某次施工是否符合预设的流程规范时,工作流模式就是一种不错的选择。

三、解题之道:大小模型协同 & 端到端优化

面对前面提到的落地难点,旷视并未将大模型视为万能药,而是依托于十多年来积累的算法、系统、硬件的全栈技术实力,引入大模型和智能体,完成整体解决方案的升级。

大小模型协同

我们深刻理解大小模型各自的特点,因此采用大小协同架构,让大小模型在最适合的位置发挥价值。具体而言,我们利用大模型的通用属性,为行业场景提供快速接入的解决方案,也利用大模型的强认知属性,作为智能体的大脑中枢;同时,我们也在合适的场景下,用经过行业数据迭代的小模型实现应用降本。以视频巡检智能体为例,不仅集成了行业化的太乙大模型,还在模型库内接入了旷视沉淀的百余种视觉小模型,让视频巡检能够实现任务接入快、运行成本低、算法精度高。

端到端优化

一个AI系统的上线不是终点,而是优化的起点。基于此,旷视经过多年打磨,研发了一套高效的算法生产与应用平台(AIS),基于这套平台,我们实现了从数据到模型、从软件到硬件、从研发到落地的有机结合,解决了算法模型“交付即落后”的行业痛点,实现了技术与场景的“双向赋能”和协同进化。举例来说,使用这套平台可以快速实现三步走式的行业算法生产范式。在新场景落地初期,核心诉求、算法边界尚不明了,此时可以通过零样本、少样本技术快速调试基础模型,实现“从无到有”;在小范围使用一段时间后,可以依托于实际场景的数据做场景化训练,实现“从有到优”;最后,对于部分任务而言,积累了一定量的数据、认知后,可以产出场景模型与算法,实现“使用降本”。

结语:迈向“双向赋能”的新阶段

算法的价值,最终必须在场景中兑现。大模型和智能体不是炫技,而是我们解决老问题的新答案。它们让我们能够搭建一座桥梁,连接技术的无限可能性与行业的真实需求,真正实现技术与场景的双向奔赴、协同进化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能体
    +关注

    关注

    1

    文章

    387

    浏览量

    11521
  • 旷视
    +关注

    关注

    0

    文章

    86

    浏览量

    6885
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4970

原文标题:算法落地之困:旷视如何用大模型与智能体破局?

文章出处:【微信号:megvii,微信公众号:旷视MEGVII】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Nullmax MaxDrive Basic智能机及小域控方案

    机产品结构紧凑,主要集成前摄像头模组、图像处理单元 (CPU/GPU/DSP) 以及智能驾驶软件算法,可高效快速部署 ADAS 功
    的头像 发表于 11-24 14:28 315次阅读
    Nullmax MaxDrive Basic<b class='flag-5'>智能</b>前<b class='flag-5'>视</b>一<b class='flag-5'>体</b>机及小域控方案

    入选2025北京人工智能治理案例集

    近日,在2025国际前瞻人工智能安全与治理大会上,由北京人工智能产业联盟编制的《人工智能治理案例集》正式发布。自主研发的统一生物特征安全
    的头像 发表于 11-11 17:56 1218次阅读

    科技AI大模型应用:提效、破局与落地,重塑智能新生态

    在这场数字化转型的浪潮中,腾科技AI大模型凭借其强大的提效能力、破局的创新思维以及切实的落地实践,已然成为重塑智能新生态的重要力量。从企业办公中的高效决策支持,到教育科研里的学术探索
    的头像 发表于 08-18 14:06 1503次阅读
    腾<b class='flag-5'>视</b>科技AI大<b class='flag-5'>模型</b>应用:提效、破局与<b class='flag-5'>落地</b>,重塑<b class='flag-5'>智能</b>新生态

    科技大模型机解决方案:低成本私有化落地,重塑行业智能应用新格局

    当大模型进入 “深水区”,私有化与低成本已成为企业选型的核心考量。腾科技大模型机解决方案,用技术创新打破 “安全与成本不可兼得” 的困境,让各行业都能轻松拥抱
    的头像 发表于 08-07 11:06 1712次阅读
    腾<b class='flag-5'>视</b>科技大<b class='flag-5'>模型</b>一<b class='flag-5'>体</b>机解决方案:低成本私有化<b class='flag-5'>落地</b>,重塑行业<b class='flag-5'>智能</b>应用新格局

    科技与云舟智维合作打造装备维修智能化平台

    近日,科技与云舟智维携手合作,共同打造装备维修智能化平台,这是全球首个大型装备智慧维保智能
    的头像 发表于 06-17 17:14 826次阅读
    <b class='flag-5'>旷</b><b class='flag-5'>视</b>科技与云舟智维合作打造装备维修<b class='flag-5'>智能</b>一<b class='flag-5'>体</b>化平台

    AI耳机迈入智能时代,2037年65%应用将为智能驱动

    近期发布的TWS耳机。随着智能的到来,AI耳机行业进入新的发展阶段。   基础NLP 大模型能力差距缩小,2037 年65% 应用将为智能
    的头像 发表于 05-24 01:15 6934次阅读
    AI耳机迈入<b class='flag-5'>智能</b><b class='flag-5'>体</b>时代,2037年65%应用将为<b class='flag-5'>智能</b><b class='flag-5'>体</b>驱动

    科技梧桐大模型赋能交通治理

    迭代已实现多场景任务覆盖。近期推出的“梧桐”大模型事件检测和交通抓拍系列产品,将AI能力深度落地于交通治理场景,在算法精度、成像质量和分析性能等方面实现显著提升,赋能交通治理更精准、更智能
    的头像 发表于 05-16 17:23 803次阅读

    科技2025合作伙伴大会丨业内首次提出“AIoT智能”新理念

    4月29日,春满长安,雁塔风起,2025宇合作伙伴大会在西安国际会展中心隆重举行。宇和近两千名合作伙伴齐聚古都,共探AIoT与行业大模型深度融合的创新实践,共绘智能
    的头像 发表于 04-30 11:08 648次阅读
    宇<b class='flag-5'>视</b>科技2025合作伙伴大会丨业内首次提出“AIoT<b class='flag-5'>智能</b><b class='flag-5'>体</b>”新理念

    学习智能开发

    智能是大模型的应用落地,正在学习中,这本书太及时了,非常想看看。
    发表于 03-27 15:48

    海康威发布大模型化平台

    海康“观澜”大模型+DeepSeek“双模”协同,海康威发布“大模型化平台”,围绕“汇聚、融合、开放”助力大模型能力,在千行百业快速便
    的头像 发表于 03-20 17:34 1361次阅读

    携手曙光云与中科天玑合作打造城市智能空间

    近日,北京科技有限公司(以下简称“”)、曙光云计算集团股份有限公司(以下简称“曙光云”)与中科天玑数据科技股份有限公司(以下简称“中科天玑”)在北京举行了合作会谈,三方将在互联
    的头像 发表于 03-20 09:13 1077次阅读

    发布AIS算法生产平台V5.0版本

    近日,正式发布自研的算法生产平台AIS(AI Service)5.0版!此次升级,包括接入DeepSeek等三大核心能力重磅亮相,助力企业AI生产力再跃升!
    的头像 发表于 03-12 17:18 1336次阅读

    运动猿入选2024年度智能体育典型案例

    2025年3月3日,工业和信息化部、国家体育总局联合公布了“2024年度智能体育典型案例”名单,“运动猿智能体育教育产品方案”成功入选,成为智能
    的头像 发表于 03-10 10:04 837次阅读

    DeepSeek一机:加速AI训推超融合,推动行业智能落地

    在人工智能技术迅猛发展的今天,大模型技术正加速从“实验室”迈向“产业场景”,然而数据工程复杂、模型适配难、训练成本高等问题,仍是行业化落地的“拦路虎”。 华为DCS AI解决方案针对D
    的头像 发表于 02-20 11:14 1263次阅读
    DeepSeek一<b class='flag-5'>体</b>机:加速AI训推超融合,<b class='flag-5'>推动</b>行业<b class='flag-5'>智能</b>化<b class='flag-5'>落地</b>

    中标北京市大数据中心感知管理服务平台二期建设项目

    近日,成功中标北京市大数据中心感知管理服务平台(二期)建设项目,此次中标不仅是对技术实力和服务能力的认可,更标志着
    的头像 发表于 12-31 09:20 1178次阅读