0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

依图天问大模型4.0重磅发布

依图科技 来源:依图科技 2024-06-18 09:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年7月,依图发布了智能安防领域首个可实战可商用的多模态大模型—依图天问1.0。发布至今,依图天问大模型基座已完成了两次迭代升级,并率先在全国50多个项目中部署应用。 近日,在第十届中国(上海)国际技术进出口交易会上,依图科技最新版本的“依图天问大模型4.0”正式发布,以全新的交互体验、超高的进化能力,重新定义了多模态大模型在智能安防领域的应用边界。 此次发布的依图天问大模型4.0实现了众多功能的跨越式升级:融合自然语言与视觉信息,大幅提升视频内容的模糊检索能力;支持多条件组合场景布控,实现精细化布控和风险管理;依图天问4.0升级后的预训练模型支持算法极少样本冷启动,通过Agent代理辅助训练,真正实现了“想法既算法”的智能飞跃。‍‍‍‍‍‍

视频理解更细微,语义检索更丰富‍‍‍‍‍‍‍‍‍

语言交互的模糊性来源于语境的多样性。依图天问4.0引入多模态视觉搜索技术,将自然语言与视觉信息融合,以“用户”为主,深刻理解语境中的细微差别,例如:当需要搜索“骑电动车带多个煤气罐”的视频内容时,用户只需用日常语言描述需求,系统便可呈现出最贴近意图的搜索结果。同时,还可以针对视频内容里细小目标做模糊化检索。这些能力极大地提升了城市管理者日常运营和决策调度中的工作效率,降低了沟通成本。

全要素理解、多条件布控更全面

高精度的视频内容理解,解锁了复杂视频场景布控的可能。机器可以代替人去看视频,像人一样看"懂"视频,对视频内容进行全场景、全要素的理解,就可以对典型的场景目标和规则进行精准布控,提前预警潜在风险,科学高效地辅助决策。依图天问4.0支持多条件组合的场景布控,可帮助管理者进行精细化风险防控和管理。在城市管理、环境监测、公共安全等领域,这项技术展现出极高的实战应用价值。‍

样本更少更高效,现场训练更灵活

智能系统的一大特征是可以根据环境和需求的变化快速适配。传统的机器学习模型面对新的算法任务,需重新收集数据、训练模型,至少要1-3个月。依图天问4.0升级了预训练模型,可实现1分钟内对极少样本的新算法进行冷启动,1小时内完成在线标注训练,1天内快速部署上线。通过日常工作过程中快速积累的数据飞轮,操作人员每天花几分钟对齐数据、简单点击对错,几天时间就可让算法达到超过90%的准确率,展现出前所未有的智能化和灵活性,充分满足业务系统的敏捷性和管理的时效性。

想法即算法,Agent辅助更智能

Agent(代理)在多模态大模型体系里扮演着至关重要的角色。AI Agent能够基于历史交互记录和现有的算法能力,做出更为精准的决策辅助。依图天问4.0可辅助逐步对齐认知,解构重组算法。例如:当我们想训练一个“大型仓库里的小型叉车”,Agent会针对“大型仓库”和“小型叉车”的语义做对齐,从而使得用户的想法可以快速转化为直观的算法,让用户的每一个想法都能即时转化为直观的操作指令,实现“想法即算法”的飞跃,呈现出工作助手、智能体的灵动与高效特征。

AI新时代,因为看见,所以相信!

2019年起,依图就开始了以Transformer为基础的大模型研究与应用探索。2020年,依图推出预训练语言理解模型ConvBERT,通过全新的注意力模块,仅用1/10的训练时间和1/6的参数就获得了与谷歌BERT模型一样的精度,相比OpenAI的GPT-3,可用更少时间去探索语言模型的训练,也降低了模型在预测时的计算成本。2023年7月,依图天问多模态大模型正式发布,快速在全国项目中部署应用。

依图天问多模态大模型的工作范式,从传统深度学习的像素标注升级到了多模态大模型的表征对齐,通过视觉与语言模型的深度融合,归一了物理世界和认知世界的底层框架,构建起物理与认知世界的桥梁,实现了用户需求与技术创新的完美对接。此次发布的依图天问4.0在类人交互、情境理解、认知进化等方面再次迭代出新特点,提升了多模态大模型对复杂视频内容的理解和发现能力。‍ 依图求索新十年,在垂直视觉领域,随着工程化应用逐步落地,内容理解的复杂度不断提升,目标特征、关系特征、空间特征、行为特征、统计特征、知识特征、业务推理不断解锁。而多模态大模型在理论基础上的不断突破,让我们也看到解锁更多应用场景的可能。 我们坚信,在智能安防领域,多模态大模型将发挥出更大潜能,尤其是在个性化需求强烈、环境多变的复杂场景中,将展现出更大的商业和社会价值。基于数据与算力的智能化运营将成为公共安全和城市治理的新常态,各行各业也必将随着技术的突破性发展真正迈入人工智能的新时代。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 依图科技
    +关注

    关注

    0

    文章

    59

    浏览量

    10927
  • 大模型
    +关注

    关注

    2

    文章

    3439

    浏览量

    4960

原文标题:依图天问大模型4.0重磅发布:开启感知与认知融合的新篇章

文章出处:【微信号:依图科技,微信公众号:依图科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光助力紫东太初4.0模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布。中科曙光作为核心生态伙伴,依托中国首个AI计算开放架构,为“紫东太初”4.0
    的头像 发表于 09-24 09:33 430次阅读

    OpenTenBase 5.0和TXSQL 8.0.30重磅发布

    内核,助力社区拥有了兼容PostgreSQL和MySQL的双内核引擎。如今,OpenTenBase和TXSQL双双迎来重磅升级。
    的头像 发表于 09-18 10:12 540次阅读

    开源鸿蒙共建地图4.0重磅发布

    近日,在2025开放原子开源生态大会开源鸿蒙主题演讲活动上,《开源鸿蒙共建地图4.0重磅发布,标志着开源鸿蒙在技术体系、系统能力和生态共建方面迈入全新阶段。活动现场,开放原子开源基金会秘书长助理兼
    的头像 发表于 07-28 17:45 659次阅读

    鸿之微发布鸿元AI大模型智能体2.0

    近日,“通信黄埔 数字台州”产业交流大会在浙江省台州市黄岩区隆重举行。鸿之微董事长曹荣根博士携鸿元AI 大模型智能体 2.0重磅亮相,并作《AI for Science 开启新材料的生物制造之旅》主题演讲。
    的头像 发表于 07-10 17:29 1013次阅读

    科技出席华为马来西亚及新加坡合作伙伴峰会

    近日,华为马来西亚合作伙伴峰会及新加坡合作伙伴峰会相继召开,科技作为华为重要的战略合作伙伴,连续受邀参加两场峰会,并向与会嘉宾展示和分享了在多模态大
    的头像 发表于 05-29 17:52 856次阅读

    2025款东风奕派eπ007重磅上市

    近日,东风奕派重磅打造全球首场AI共创产品发布会,以前沿科技重构汽车发布场景,解锁前所未有的沉浸式交互体验。
    的头像 发表于 05-23 15:58 667次阅读

    联想重磅发布禧个人超级智能体和想想帮服务智能体

    5月8日,以“ 热AI自发光 ”为主题的 联想禧AI生态春季新品超能之夜 在上海璀璨启幕。发布会以一场充满科技感与年轻活力的“热AI时尚秀”,演绎了AI热力和青春活力的双向奔赴。 联想重磅
    的头像 发表于 05-09 08:51 934次阅读
    联想<b class='flag-5'>重磅</b><b class='flag-5'>发布</b><b class='flag-5'>天</b>禧个人超级智能体和想想帮服务智能体

    MediaTek玑9400率先完成阿里Qwen3模型部署

    通义大模型团队在玑 9400 旗舰移动平台上率先完成 Qwen3(千 3)的端侧部署。未来,搭载玑 9400 移动平台的设备可充分发挥端侧 AI 性能潜力,运行千
    的头像 发表于 05-08 10:11 930次阅读

    WIZnet高性能以太网单片机W55MH32重磅发布

    WIZnet高性能以太网单片机W55MH32重磅发布!本文详细解析了W55MH32芯片的高性能网络处理能力与硬件资源,以及两款开发板(L/Q-EVB)。芯片凭借TOE引擎、丰富外设及加密单元,为物
    的头像 发表于 05-07 16:17 1196次阅读
    WIZnet高性能以太网单片机W55MH32<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>!

    科技亮相华为中国合作伙伴大会2025

    以“因聚而生,众智有为”为主题的华为中国合作伙伴大会3月20日-21日在深圳国际会展中心盛大举行。作为华为的重要战略合作伙伴,科技受邀参会,全面展示了
    的头像 发表于 03-25 13:51 926次阅读

    低至¥2.27/h!就能使用全球最强开元模型——千 QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——千QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义千发布的最新开源推理
    的头像 发表于 03-19 12:34 873次阅读
    低至¥2.27/h!就能使用全球最强开元<b class='flag-5'>模型</b>——千<b class='flag-5'>问</b> QwQ-32B

    摩尔线程支持阿里云通义千QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千QwQ-32B的支持。
    的头像 发表于 03-07 17:48 1098次阅读
    摩尔线程支持阿里云通义千<b class='flag-5'>问</b>QwQ-32B开源<b class='flag-5'>模型</b>

    纳雷科技发布新一代无人机高度计雷达UAM231

    纳雷新一代无人机高度计雷达UAM231重磅发布,无人机雷达产品家族迎新成员。
    的头像 发表于 01-17 09:09 1964次阅读

    比亚迪2025款腾势D9重磅上市

    近日,“科技豪华全能旗舰MPV”——25款腾势D9重磅上市,推出DM-i超级混动版和纯电版共8个版本车型,官方指导价33.98万元——46.98万元。25款腾势D9在“设计、舒适、驾驭、三电、智能、安全”6大维度全面升级,再立MPV王者标杆!
    的头像 发表于 12-29 15:13 3072次阅读

    光庭信息超级软件工场SDW 2.0重磅发布

    近日,光庭信息2024年投资者开放日活动隆重举办。活动以“AI开发 再塑汽车变革”为主题,向广大投资机构及券商代表深度阐述了光庭信息未来一年的发展策略及事业规划,重磅发布了光庭信息及超级软件工场全新品牌形象,超级软件工场 2.0 版本也正式亮相,充分展示了光庭信息在 AI
    的头像 发表于 12-23 15:04 1219次阅读