0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

涂鸦On-App AI视频主体突出方案全新上线!自动追踪+智能放大,一键革新视频剪辑体验

涂鸦开发者 2025-04-10 19:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着智能 IPC 设备(如安防摄像头、宠物陪伴机器人、婴儿监视器等)日益普及,越来越多的生活场景被实时记录。然而在实际使用中,由于设备安装位置不当、广角镜头视野过大等原因,经常会出现拍摄主体占比过小的问题,导致"全景清晰而主体模糊",严重影响用户的观看体验。


一、涂鸦AI 推理模型自动突出主体

因此,涂鸦重磅推出 On-App AI 视频主体突出解决方案利用涂鸦赋能 App 的AI 能力对画面进行实时目标检测,自动定位、识别主体后,再利用图像算法对其进行智能自适应放大,使主体更突出、画面更聚焦。最后,对处理完成的视频进行编码与封装,即可输出经过优化的视频内容。


该方案适合拓展应用至生活各个场景中,如:

在室内监护中,可用于婴儿看护、宠物监测、宠物机器人等设备;

在医疗影像或科研中,可结合内镜或其他医疗设备突出术野关键区域;

在户外记录时,可用于智能喂鸟器、狩猎摄像机、自然景观摄像机等设备;

在安防与工业检测中,可用于巡检、维修等需要检查局部细节的设备。


a.例如针对家庭场景里的小猫,摄像头会自动识别主体并进行画面放大:

948192fe-15fb-11f0-9434-92fbcf53809c.png

(没有主体突出功能的视频画面)

94c12036-15fb-11f0-9434-92fbcf53809c.png

(有主体突出功能的视频画面)

b.在户外复杂场景下,涂鸦 On-App AI 视频主体方案依然能够精准识别目标对象,并进行动作追踪和画面放大。戳视频,直观体验生成效果:


二、详解涂鸦AI 视频主体突出技术

1、整体技术架构介绍

在涂鸦所有的 AI 产品/硬件解决方案中, 我们打通了端到端的 AI 能力:即设备端、云端、App 端三端协同。通过将先进的 AI 推理模型部署到涂鸦赋能 App 上,能够助力品牌商与开发者将先进的AI技术无缝集成到移动设备中,打造更灵活的 AI 架构、更优的用户体验、更安全的计算能力。


在移动端模型的部署中,涂鸦采用了轻量化技术架构TensorFlow Lite 等),这种技术架构的优势就在于具备高效推理、低延迟、低功耗等特点,并且支持本地模型实现离线运行、系统更新、部署等按需加载的机制,助力提高运行效率,打造更灵活的 AI 架构。

图像处理技术涂鸦采用了 OpenGL ES,可实现更高效的渲染与优化,充分利用 GPU 对图像处理过程进行加速;

视频编解码技术采用涂鸦平台提供的硬件解码,能够提升视频处理性能、降低 CPU 负载,确保视频流畅播放与低功耗运行。

951ad4b4-15fb-11f0-9434-92fbcf53809c.png

(涂鸦AI 视频主体突出技术架构图)


2、技术亮点

2.1 拥有更灵活的 AI 架构:轻量化和动态化

95352ac6-15fb-11f0-9434-92fbcf53809c.png

(轻量化与动态化运行流程示意图)

2.1.1 轻量级检测模型

涂鸦采用专门优化移动端的轻量级对象检测模型 EfficientDet-D0,该模型参数少、计算量小、推理速度快,可以精准检测视频中指定主体(如宠物、人物)的位置与类别。同时,基于智能分析能力可快速筛除无主体片段,有效降低计算负担,提升处理效率。



2.1.2 模型动态化

采用按需加载的动态模型管理机制,支持模型在线下载、更新与部署,确保视频应用始终使用最优模型版本,同时减少初始安装包体积,提高运行效率。



2.2 更优的用户体验:实时性和高效率

9549ef1a-15fb-11f0-9434-92fbcf53809c.png(AI实时数据处理流程示意图)

2.2.1实时交互处理

该方案支持实时响应用户的交互需求。依托本地计算的高效运行,可确保流畅无延迟的用户体验,无需依赖网络,即可实现快速响应与实时处理。



2.2.2 新增防抖图像算法

在检测视频主体位置的过程中,检测框可能会发生抖动偏移,从而导致主体放大的画面也会产生抖动;针对这一问题,涂鸦增加抖动阈值,确保视频处理画面时的平滑流畅。



2.2.3 微调模型以提高准确度

涂鸦积累了海量不同场景下的主体图片,覆盖不同光照条件下白天黑夜等多个场景,数据脱敏之后,涂鸦对这些模型进行精心的训练微调,确保模型推理过程中的泛化能力。



2.3 更安全的计算能力:低成本和隐私保护

955a108e-15fb-11f0-9434-92fbcf53809c.png(涂鸦 AI 端侧算力结构图)

2.3.1降低处理成本

涂鸦支持开发者动态调整视频帧的推理策略。在没有检测到视频主体的时候,系统会间隔多帧识别一帧;当检测到主体时,就会自动调整为间隔 3 帧检测一帧。这样就能充分利用移动端的硬件加速,显著提升视频编解码速度,降低 CPU 负载,提高整体性能。

而且,本地化处理相比云端处理的成本更低、更能节约云端负荷,算力消耗每万次减少 25 TFLOPs,节省成本约 10% 左右。



2.3.2 保护隐私安全

该方案的所有数据处理均在本地完成,显著降低时延、提高响应速度,同时避免数据外传,增强用户隐私保护,为应用提供更安全高效的计算环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38286

    浏览量

    297334
  • IPC
    IPC
    +关注

    关注

    3

    文章

    375

    浏览量

    54581
  • 涂鸦智能
    +关注

    关注

    7

    文章

    289

    浏览量

    20526
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于DP1323EL的电动车解锁方案:超高速读写,提升电动车一键解锁体验

    靠近车辆时,APP自动检测信号强度,实现“无感解锁”。例如,用户步行接近电动车5米左右范围内,车辆仪表盘会自动亮起,解锁车锁;上车后,踩下刹车即可一键启动。这种
    发表于 11-10 17:45

    重磅!腾视科技新官网正式上线AI算力与智能解决方案一键直达

    AI算力模组到全栈智能解决方案,从技术研发到场景落地,腾视科技始终以 “前沿技术落地者” 为定位,助力产业智能化升级。新官网的上线,是我们与世界对话的新起点,未来,我们期待与更多伙伴
    的头像 发表于 10-11 10:57 634次阅读
    重磅!腾视科技新官网正式<b class='flag-5'>上线</b>,<b class='flag-5'>AI</b>算力与<b class='flag-5'>智能解决方案</b><b class='flag-5'>一键</b>直达

    照片视频太普通?涂鸦On-App AI黑科技,让宠物/人像1秒C位出片!

    一键识别人/宠物并实现智能居中,点下就能让照片/视频秒变质感大片呢?01涂鸦助你一键生成氛围感
    的头像 发表于 08-14 18:55 936次阅读
    照片<b class='flag-5'>视频</b>太普通?<b class='flag-5'>涂鸦</b><b class='flag-5'>On-App</b> <b class='flag-5'>AI</b>黑科技,让宠物/人像1秒C位出片!

    AI视频分析系统

    方案背景人工智能大时代背景下,视频应用领域相关的行业应用方式已经发生了深刻的变化,各论安防监控还是各类垂直行业视频应用,都需要AI视觉分析与
    的头像 发表于 08-06 14:39 737次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>分析系统

    NVIDIA RTX Blackwell GPU为专业级视频剪辑提供加速

    42 摄像机正在消费级市场日益普及,它能够捕捉到比大多数标准摄像机高倍的颜色信息。与此同时,生成式 AI 视频模型的功能与质量均在迅速提升,使全新工具和工作流成为可能。
    的头像 发表于 07-04 15:00 889次阅读

    4K、多模态、长视频AI视频生成的下个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080
    的头像 发表于 06-16 00:13 6965次阅读

    全新上线IPC精彩时刻!配套On-App AI视频剪辑模板+全天候一键抓拍

    IPC精彩时刻功能,是涂鸦AI云开发者平台为所有带摄像头的智能硬件,专门打造的“AI视频增值服务”:通过
    的头像 发表于 05-08 19:06 819次阅读
    <b class='flag-5'>全新</b><b class='flag-5'>上线</b>IPC精彩时刻!配套<b class='flag-5'>On-App</b> <b class='flag-5'>AI</b><b class='flag-5'>视频剪辑</b>模板+全天候<b class='flag-5'>一键</b>抓拍

    智能照明新纪元:涂鸦 AI 照明系统如何重塑空间光影体验

    、语音交互、开发者生态与商业闭环体系,重新定义了智能照明的边界,为用户与开发者提供了站式解决方案。PART1AI场景生成从需求到光影,一键
    的头像 发表于 03-13 18:00 1352次阅读
    <b class='flag-5'>智能</b>照明新纪元:<b class='flag-5'>涂鸦</b> <b class='flag-5'>AI</b> 照明系统如何重塑空间光影体验

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发视频应用。AI Agent是
    发表于 03-05 19:52

    LoRa无线一键报警安防建设方案

    险情,不论是老人,还是小孩都可以一键紧急呼救,联动智能网关、手机APP等其他报警设备进行紧急求救。方案背景:•近年来,医患关系日趋紧张,患方辱骂、伤害、殴打医务人员
    的头像 发表于 02-28 14:41 1041次阅读
    LoRa无线<b class='flag-5'>一键</b>报警安防建设<b class='flag-5'>方案</b>

    开关柜一键顺控在一键停电、一键送电中的作用

    蜀瑞创新为大家科普,开关柜一键顺控技术在一键停电和一键送电中发挥了快速响应、减少人为错误、提高安全性、简化操作流程、降低操作风险、提高送电成功率等综合优势,对于提升电力系统的运行效率、安全性以及
    的头像 发表于 02-27 09:13 1282次阅读

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    在技术革新浪潮席卷全球的当下,智能视觉终端设备 —— 以 AI 眼镜为典型代表,正以革命性姿态打破物理与数字世界的藩篱,在虚实交融的界面中搭建起多维度的认知通道。 而深圳市新创云
    发表于 02-20 18:44

    UOS AI:一键解锁未来办公新姿势

    浏览新闻寻找素材,长篇大论眼花缭乱? 选中内容后 「AI随航」 图标自动显现 ,鼠标悬停图标后点击选择相应功能,几秒帮你总结内容,还能选中想要的内容一键续写润色和花式扩写! 老板夸你“效率堪比
    的头像 发表于 02-19 10:54 1152次阅读
    UOS <b class='flag-5'>AI</b>:<b class='flag-5'>一键</b>解锁未来办公新姿势

    阿里妈妈“淘宝星辰·图生视频”商用上线

    近日,阿里妈妈宣布其自研的淘宝星辰视频生成大模型已成功转化为商用级应用——淘宝星辰·图生视频。这创新性的AI工具现已正式对淘宝、天猫商家开放使用,标志着电商内容创作领域迈入了
    的头像 发表于 01-16 10:43 1113次阅读

    讯维AI视频行为分析系统:打造全方位智能安防解决方案

    分析、报警联动于体的AI视频行为分析系统。这一系统通过人工智能和深度学习技术,实现了对视频内容的智能
    的头像 发表于 01-16 09:33 2145次阅读
    讯维<b class='flag-5'>AI</b><b class='flag-5'>视频</b>行为分析系统:打造全方位<b class='flag-5'>智能</b>安防解决<b class='flag-5'>方案</b>