0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

依图天问大模型4.0重磅发布

依图科技 来源:依图科技 2024-06-18 09:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年7月,依图发布了智能安防领域首个可实战可商用的多模态大模型—依图天问1.0。发布至今,依图天问大模型基座已完成了两次迭代升级,并率先在全国50多个项目中部署应用。 近日,在第十届中国(上海)国际技术进出口交易会上,依图科技最新版本的“依图天问大模型4.0”正式发布,以全新的交互体验、超高的进化能力,重新定义了多模态大模型在智能安防领域的应用边界。 此次发布的依图天问大模型4.0实现了众多功能的跨越式升级:融合自然语言与视觉信息,大幅提升视频内容的模糊检索能力;支持多条件组合场景布控,实现精细化布控和风险管理;依图天问4.0升级后的预训练模型支持算法极少样本冷启动,通过Agent代理辅助训练,真正实现了“想法既算法”的智能飞跃。‍‍‍‍‍‍

视频理解更细微,语义检索更丰富‍‍‍‍‍‍‍‍‍

语言交互的模糊性来源于语境的多样性。依图天问4.0引入多模态视觉搜索技术,将自然语言与视觉信息融合,以“用户”为主,深刻理解语境中的细微差别,例如:当需要搜索“骑电动车带多个煤气罐”的视频内容时,用户只需用日常语言描述需求,系统便可呈现出最贴近意图的搜索结果。同时,还可以针对视频内容里细小目标做模糊化检索。这些能力极大地提升了城市管理者日常运营和决策调度中的工作效率,降低了沟通成本。

全要素理解、多条件布控更全面

高精度的视频内容理解,解锁了复杂视频场景布控的可能。机器可以代替人去看视频,像人一样看"懂"视频,对视频内容进行全场景、全要素的理解,就可以对典型的场景目标和规则进行精准布控,提前预警潜在风险,科学高效地辅助决策。依图天问4.0支持多条件组合的场景布控,可帮助管理者进行精细化风险防控和管理。在城市管理、环境监测、公共安全等领域,这项技术展现出极高的实战应用价值。‍

样本更少更高效,现场训练更灵活

智能系统的一大特征是可以根据环境和需求的变化快速适配。传统的机器学习模型面对新的算法任务,需重新收集数据、训练模型,至少要1-3个月。依图天问4.0升级了预训练模型,可实现1分钟内对极少样本的新算法进行冷启动,1小时内完成在线标注训练,1天内快速部署上线。通过日常工作过程中快速积累的数据飞轮,操作人员每天花几分钟对齐数据、简单点击对错,几天时间就可让算法达到超过90%的准确率,展现出前所未有的智能化和灵活性,充分满足业务系统的敏捷性和管理的时效性。

想法即算法,Agent辅助更智能

Agent(代理)在多模态大模型体系里扮演着至关重要的角色。AI Agent能够基于历史交互记录和现有的算法能力,做出更为精准的决策辅助。依图天问4.0可辅助逐步对齐认知,解构重组算法。例如:当我们想训练一个“大型仓库里的小型叉车”,Agent会针对“大型仓库”和“小型叉车”的语义做对齐,从而使得用户的想法可以快速转化为直观的算法,让用户的每一个想法都能即时转化为直观的操作指令,实现“想法即算法”的飞跃,呈现出工作助手、智能体的灵动与高效特征。

AI新时代,因为看见,所以相信!

2019年起,依图就开始了以Transformer为基础的大模型研究与应用探索。2020年,依图推出预训练语言理解模型ConvBERT,通过全新的注意力模块,仅用1/10的训练时间和1/6的参数就获得了与谷歌BERT模型一样的精度,相比OpenAI的GPT-3,可用更少时间去探索语言模型的训练,也降低了模型在预测时的计算成本。2023年7月,依图天问多模态大模型正式发布,快速在全国项目中部署应用。

依图天问多模态大模型的工作范式,从传统深度学习的像素标注升级到了多模态大模型的表征对齐,通过视觉与语言模型的深度融合,归一了物理世界和认知世界的底层框架,构建起物理与认知世界的桥梁,实现了用户需求与技术创新的完美对接。此次发布的依图天问4.0在类人交互、情境理解、认知进化等方面再次迭代出新特点,提升了多模态大模型对复杂视频内容的理解和发现能力。‍ 依图求索新十年,在垂直视觉领域,随着工程化应用逐步落地,内容理解的复杂度不断提升,目标特征、关系特征、空间特征、行为特征、统计特征、知识特征、业务推理不断解锁。而多模态大模型在理论基础上的不断突破,让我们也看到解锁更多应用场景的可能。 我们坚信,在智能安防领域,多模态大模型将发挥出更大潜能,尤其是在个性化需求强烈、环境多变的复杂场景中,将展现出更大的商业和社会价值。基于数据与算力的智能化运营将成为公共安全和城市治理的新常态,各行各业也必将随着技术的突破性发展真正迈入人工智能的新时代。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 依图科技
    +关注

    关注

    0

    文章

    59

    浏览量

    11684
  • 大模型
    +关注

    关注

    2

    文章

    3753

    浏览量

    5268

原文标题:依图天问大模型4.0重磅发布:开启感知与认知融合的新篇章

文章出处:【微信号:依图科技,微信公众号:依图科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Momenta助力智己LS8重磅上市

    4月16日,跨时代科技旗舰SUV——智己LS8重磅上市。新车搭载基于Momenta强化学习大模型打造的IM AD智能辅助驾驶系统,为用户带来“更像人”的智能辅助驾驶体验。凭借跨时代硬核科技,智己LS8以“起步即旗舰,标配即满配”的绝对实力,成就“30万内唯一大满配的跨时代
    的头像 发表于 04-17 17:01 720次阅读

    高压、大电流、超低噪声负压LDO GM1301重磅发布

    共模重磅发布-40V/1A 超低噪声负压LDO GM1301!Pin-to-Pin替代TI(TPS7A33)负压LDO,搭配GM1415组成低噪正负压电源黄金组合,为高精度场景提供全国产电源解决方案。
    的头像 发表于 03-04 10:58 581次阅读
    高压、大电流、超低噪声负压LDO GM1301<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    盘古信息IMS V6 7.0重磅发布!四大核心升级,铸就新一代制造企业数智化转型产品

    引擎。 01 数智大脑 IMS V6 PCB行业套件重磅上线 基于多年PCB工业Know-How 沉淀,盘古信息历时5年、投入超12000人重磅打造的IMS V6 PCB行业套件正式上线, 深度贴合PCB 制造全流程业务场景,
    的头像 发表于 02-27 09:29 227次阅读
    盘古信息IMS V6 7.0<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>!四大核心升级,铸就新一代制造企业数智化转型产品

    阿里巴巴发布通义千旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。
    的头像 发表于 01-27 15:47 570次阅读
    阿里巴巴<b class='flag-5'>发布</b>通义千<b class='flag-5'>问</b>旗舰推理<b class='flag-5'>模型</b>Qwen3-Max-Thinking

    云知声山海知音大模型2.0重磅发布

    随着智能体时代到来,云知声在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·知医”5.0医疗大模型升级,今天迎来了“山海·知音”2.0的重磅发布,正在完成“一基两翼”技术战略升级的能力拼图。
    的头像 发表于 01-27 14:08 323次阅读
    云知声山海知音大<b class='flag-5'>模型</b>2.0<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    联想四大重磅发布加速AI工厂落地

    的优势布局,正式推出“联想AI工厂”解决方案,旨在帮助企业数据中心完成从传统“算力中心”向高效“AI工厂”的智能化转型,同时重磅发布新一代高端大模型训练AI服务器—基于英特尔至强6处理器的联想问
    的头像 发表于 12-13 15:39 1064次阅读

    中科曙光助力紫东太初4.0模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布。中科曙光作为核心生态伙伴,依托中国首个AI计算开放架构,为“紫东太初”4.0
    的头像 发表于 09-24 09:33 789次阅读

    OpenTenBase 5.0和TXSQL 8.0.30重磅发布

    内核,助力社区拥有了兼容PostgreSQL和MySQL的双内核引擎。如今,OpenTenBase和TXSQL双双迎来重磅升级。
    的头像 发表于 09-18 10:12 994次阅读

    开源鸿蒙共建地图4.0重磅发布

    近日,在2025开放原子开源生态大会开源鸿蒙主题演讲活动上,《开源鸿蒙共建地图4.0重磅发布,标志着开源鸿蒙在技术体系、系统能力和生态共建方面迈入全新阶段。活动现场,开放原子开源基金会秘书长助理兼
    的头像 发表于 07-28 17:45 960次阅读

    鸿之微发布鸿元AI大模型智能体2.0

    近日,“通信黄埔 数字台州”产业交流大会在浙江省台州市黄岩区隆重举行。鸿之微董事长曹荣根博士携鸿元AI 大模型智能体 2.0重磅亮相,并作《AI for Science 开启新材料的生物制造之旅》主题演讲。
    的头像 发表于 07-10 17:29 1508次阅读

    科技出席华为马来西亚及新加坡合作伙伴峰会

    近日,华为马来西亚合作伙伴峰会及新加坡合作伙伴峰会相继召开,科技作为华为重要的战略合作伙伴,连续受邀参加两场峰会,并向与会嘉宾展示和分享了在多模态大
    的头像 发表于 05-29 17:52 1087次阅读

    2025款东风奕派eπ007重磅上市

    近日,东风奕派重磅打造全球首场AI共创产品发布会,以前沿科技重构汽车发布场景,解锁前所未有的沉浸式交互体验。
    的头像 发表于 05-23 15:58 896次阅读

    联想重磅发布禧个人超级智能体和想想帮服务智能体

    5月8日,以“ 热AI自发光 ”为主题的 联想禧AI生态春季新品超能之夜 在上海璀璨启幕。发布会以一场充满科技感与年轻活力的“热AI时尚秀”,演绎了AI热力和青春活力的双向奔赴。 联想重磅
    的头像 发表于 05-09 08:51 1204次阅读
    联想<b class='flag-5'>重磅</b><b class='flag-5'>发布</b><b class='flag-5'>天</b>禧个人超级智能体和想想帮服务智能体

    MediaTek玑9400率先完成阿里Qwen3模型部署

    通义大模型团队在玑 9400 旗舰移动平台上率先完成 Qwen3(千 3)的端侧部署。未来,搭载玑 9400 移动平台的设备可充分发挥端侧 AI 性能潜力,运行千
    的头像 发表于 05-08 10:11 1482次阅读

    WIZnet高性能以太网单片机W55MH32重磅发布

    WIZnet高性能以太网单片机W55MH32重磅发布!本文详细解析了W55MH32芯片的高性能网络处理能力与硬件资源,以及两款开发板(L/Q-EVB)。芯片凭借TOE引擎、丰富外设及加密单元,为物
    的头像 发表于 05-07 16:17 1962次阅读
    WIZnet高性能以太网单片机W55MH32<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>!