0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉的发展将能够有效提高多媒体系统的性能

科技观察者 来源:站长之家 作者:科技观察者 2020-10-15 13:49 次阅读

2020年10月12-16日,多媒体领域的国际顶级会议ACM MM 2020在美国西雅图举行,深兰科技再传捷报,获得了Video Relation Understanding竞赛/视频目标检测任务的第一名,以及异常事件检测挑战赛/常规异常事件检测任务的第三名。此次获奖方案均对现实应用场景有着实际意义,将有效提升自动驾驶、安防监控等领域的安全性。

尽管计算机视觉最新进展有效地提高了多媒体系统的性能,但仍然不能明确回答一个核心问题:机器是否理解视频中发生的事情,分析结果是否可以被人类用户解释?为了推动上述问题的研究,新加坡国立大学推出了VidOR数据集,同时在ACM MM 2020上举办了Video Relation Understanding竞赛。视频目标检测(Video Object Detection)作为竞赛任务,要求参与者开发鲁棒的目标检测器,在每个视频帧中使用检测框定位目标,并将指示同一目标实体的检测框链接到轨迹中,这将帮助机器在视频级别上理解目标实体的身份和动态,还可以使需要细粒度视频理解的许多应用程序受益(举例),还包括自动驾驶场景中对车身周围动态目标的有效检测,可提高驾驶安全性。

深兰科技DeepBlueAI团队面对诸多难点,包括检测器需要重新识别视频中消失重现的目标;画面剧烈抖动;视频分辨率较低,存在照明、模糊、物体外形发生变化;目标类别多及目标类别不均衡;很多非人工标注信息不准确等。经过分析,团队采用了目标检测+多目标跟踪的解决思路,通过检测器设计、深度度量学习模型设计与多目标跟踪算法实现构建了解决方案,最终战胜三星、厦门大学等团队斩获第一。

而获得第三的异常事件检测挑战赛/常规异常事件检测任务,更具现实意义,在城市管理、公共安全、交通控制和环境保护等方面起着关键作用。任务包含1000多个未修剪的真实视频,需要识别争吵,打架,抢劫,偷窃,爆炸,道路事故等近二十种异常事件。深兰科技的明星产品“熊猫智能公交车” 就有多个功能获益于这些获奖方案,除了领先的自动驾驶技术,车内还打造了“智能客舱”,其中的“异常行为识别系统”就包括了车厢内摔倒、偷盗等行为报警等功能。

近日,深兰科技的自动驾驶产品喜讯频传,熊猫智能公交车在上海临港新片区正式启动测试、在辽宁鞍山正式投入运行;AI智能扫路机在上海长宁正式启动无人驾驶模式的保洁作业;熊猫智能公交车和AI智能扫路机还分别获得,湖北国际物流机场颁发的“无人驾驶摆渡车组第一名”,以及“无人驾驶清扫组第一名”的奖状,有望在该机场运行并提供服务。而这些落地应用背后的保障正是在国际顶会竞赛上获奖的实力,以及对科研的敬畏。深兰科技将秉持人工智能服务民生的理念,稳步推进基础研究和落地应用,为百姓生活造福、为经济发展出力。
fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 安防监控
    +关注

    关注

    5

    文章

    244

    浏览量

    32724
  • 自动驾驶
    +关注

    关注

    773

    文章

    13049

    浏览量

    163232
收藏 人收藏

    评论

    相关推荐

    【量子计算机重构未来 | 阅读体验】 跟我一起漫步量子计算

    计算机有望在未来几年内实现商业化应用。届时,我们将能够更充分地利用量子计算机的优势,推动各行业的创新和发展
    发表于 03-13 19:28

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 575次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    智能化的计算机体系结构设计方案

    未来计算机体系结构将趋向于智能化和自适应性。智能化的计算机体系结构可以根据不同的任务和场景进行智能调整,提高计算机性能和效率。
    发表于 01-22 11:05 165次阅读
    智能化的<b class='flag-5'>计算机体系</b>结构设计方案

    最适合 AI 应用的计算机视觉类型是什么?

    着眼于使计算机能够像人类一样通过“看”来感知世界,从这一视角对人工智能 (AI) 进行了探讨。我将简要比较每一类计算机视觉,尤其关注在本地而不是依赖基于云的资源收集和处理数据,并根据数据采取行动的嵌入式
    的头像 发表于 12-18 13:09 6857次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 3134次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    计算机硬件和软件组成

    未来:高性能(速度快)、人性化(傻瓜式)、网络化(电信网/计算机网/有线电视网三网合一)、多媒体计算机技术+视频技术)、智能化(模拟人)
    的头像 发表于 10-28 11:13 1307次阅读
    <b class='flag-5'>计算机</b>硬件和软件组成

    讯维多媒体教学中控一体机

    随着科学技术的发展,特别是计算机技术的推广和普及, 多媒体技术在课堂教学中得到了广泛的应用。教育信息化的发展和素质教育的实施,要求小学教师必须掌握一定的
    的头像 发表于 08-18 10:03 300次阅读

    人工智能计算机视觉方向是什么

    人工智能计算机视觉方向是什么 人工智能计算机视觉方向是指利用人工智能技术对图像和视频进行各种分析、解释和操作的过程。计算机
    的头像 发表于 08-15 16:06 1200次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1142次阅读

    讯维多媒体信息发布系统,开启多媒体信息传播新模式

    文字、声音、图形、图像、动画、视频等两个以上不同类型信息媒体系统多媒体发布系统往往与计算机联系起来,由
    的头像 发表于 08-01 11:16 411次阅读

    讯维多媒体中控系统是什么

    多媒体中控系统是一种应用于多媒体教室、多功能会议厅、指挥控制中心、智能化家庭等场所的控制系统。用户可以使用按钮式控制面板、计算机显示器、触摸
    的头像 发表于 07-28 10:36 372次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    perception)视觉认知(visual cognition)图像和视频理解(image and videounderstanding).这些概念有一些共性之处,也有本质不同。从广义上说,计算机视觉就是"赋予机器自然
    发表于 07-20 15:41 0次下载

    计算机视觉体温测量系统

    电子发烧友网站提供《计算机视觉体温测量系统.zip》资料免费下载
    发表于 07-03 11:31 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>体温测量<b class='flag-5'>系统</b>

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 867次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 522次阅读