0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2018年最受关注的计算机视觉挑战赛是什么?

DPVg_AI_era 来源:未知 作者:李倩 2018-09-10 09:42 次阅读

计算机视觉界的顶级竞赛之一MS COCO 2018年结果最新出炉,在实例分割、全景分割、人体关键点检测、DensePose以及今年最新的街景检测和分割任务中,全部6项冠军均由中国团队包揽。其中,旷视获得了4项冠军(含1项并列第一),来自北邮和滴滴的团队分别获得1项冠军。微软亚洲研究院获得1项亚军,北京大学和360组成的团队也获得了1项亚军。

2018年最受关注的计算机视觉挑战赛是什么?

COCO!

MS COCO的全称是常见物体图像识别(Microsoft Common Objects in Context),起源于是微软于2014年出资标注的Microsoft COCO数据集,同名竞赛与此前著名的ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。

而在ImageNet竞赛停办后,COCO竞赛就成为是当前物体识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。

刚刚,ECCV官网上发布了2018年最新COCO竞赛的结果:

在物体检测、全景分割、人体关键点检测、DensePose以及2018年最新提出的Mapillary街景检测(Mapillary Detction)和街景全景分割(Mapillary Panoptic)6项任务中,中国的团队包揽了所有的冠军!

根据ECCV COCO Workshop的日程表,我们可以发现:

旷视团队(Megvii)获得了4项冠军:实例分割(并列第一)、全景分割、人体关键点检测,以及Mapillary街景全景分割;

北京邮电大学自动化学院模式识别与测控技术实验室(BUTP-PRIV)获得了DensePose任务的冠军;

滴滴团队(DiDi Map Vision)获得了Mapillary街景检测冠军。

不仅如此,其他中国团队也斩获了出色的结果:

微软亚洲研究院团队(MSRA)获得了人体关键点检测亚军;

北京大学和360组成的团队(PKU_360)获得了全景分割任务的亚军。

MS COCO 2018,当之无愧是中国计算机视觉团队称霸的一年!

COCO挑战赛:ImageNet 后最权威的计算机视觉衡量标杆

今年的COCO竞赛与ECCV 2018一同举办,而且新增了两项街景识别的新任务——Mapillary Vistas,这是是新近推出的街景集图像数据集,专注于图像的高阶语义理解,推动自动驾驶机器人导航等领域的技术落地。在数据集和应用任务方面,两者有很多不同,而后者对前者起补足作用。通常来讲,COCO 是自然场景下的物体识别,Mapillary 则聚焦于街景场景识别,因此联合挑战赛的形式有利于计算机视觉技术更贴近现实场景,更具应用价值。

COCO是一个旨在促进目标检测研究的图像数据集,重点关注检测上下文中的目标。COCO的注释包括80个类别对象的实例分割,91个类别的物品分割,人物实例的关键点检测,以及每个图像都有5个图像标题(image captions)。

自 2015 年首届挑战赛以来,COCO 赛项数量不断更新,评估标准也更加复杂;COCO 2018 相较往年又有改变。在检测方面,实例分割近年在 COCO 上大为流行,今年,COCO 和 Mapillary 都有此赛项;随着检测技术走向饱和,COCO 去掉了边界框检测这一赛项,但成绩依然出现在榜单上。

另外一个变动是新增了 DensePose和 Panoptic Segmentation 两个赛项。Panoptic Segmentation 同时解决一张图像上前景物体与背景物体的分类问题,把互为分裂的语义分割和实例分割整合为一,推动分割技术步入新境界,不断逼近现实应用。COCO 和 Mapillary 也都有此赛项。

COCO 2018挑战赛的具体任务包括:(1)利用分割掩模进行目标检测(实例分割),(2)全景分割,(3) 人体关键点检测,(4)DensePose。

1、COCO实例分割任务

COCO目标检测任务(Object Detection Task)旨在推动目标检测领域的先进技术。COCO 2018挑战中只出现具有对象分割输出的检测任务。

随着近年来物体检测技术已经成熟,COCO不再以边界框检测任务为主。虽然leaderboard仍保持开放,但边界框检测任务不是workshop challenge;相反,竞赛鼓励研究人员专注于更具挑战性和视觉信息的实例分割任务。

2、COCO全景分割任务

COCO全景分割任务(Panoptic Segmentation Task)的目标是推进场景分割的最新技术水平。全景分割需处理物体类和事件类,统一了两种典型的语义和实例分割任务。“全景”(panoptic)的定义是指“包括一个视图中可见的所有内容”,即一个统一的、全局的分割视图。

3、COCO 人体关键点检测任务

COCO 人体关键点检测任务需要在具有挑战性、不受控制的条件下定位人物的关键点(person keypoints)。关键点检测任务涉及同时检测并定位人物的关键点(在测试时没有给出人的位置)。

4、COCODensePose任务

COCO DensePose任务需要在具有挑战性,不受控制的条件下定位密集的人物关键点。DensePose任务涉及同时检测和定位人的密集关键点,将所有人物像素映射到人体的3D表面。

Mapillary Vistas挑战赛:2018年新加入的自动驾驶类任务

随着计算机视觉技术的不断进步,今年,Mapillary Research也加入了COCO竞赛,并提供了Mapillary Vistas数据集。Vistas是一个多样化的、像素精确的街道级图像数据集,用于在全球范围内增强自动驾驶能力。

Mapillary Vistas 数据集的设计和收集涵盖了外观的多样性、注释细节的丰富性和广阔的地理范围。相关竞赛的难点和要点在于把互为分裂的语义分割和实例分割整合为一,推动分割技术步入新境界,不断逼近现实应用。

Mapillary Challenges基于公开的Vistas Research数据集,其特点是:

28个stuff类,37个thing类,以及1个void类

25K高分辨率图像

地理范围覆盖全球,包括北美和南美、欧洲、非洲、亚洲和大洋洲

非常多样的天气条件(阳光、雨、雪、雾、雾)和捕获时间(黎明、白天、黄昏、夜晚)

广泛的相机传感器,不同的焦距,图像宽高比和不同类型的相机噪音

不同的捕捉视角(道路、人行道、公路外)

基于Mapillary Vistas数据集的竞赛任务包括:(1)目标检测和分割掩码(实例分割);(2)全景分割(panoptic segmentation),分别对应COCO的检测和全景分割任务。

1、Mapillary Vistas目标检测任务

Mapillary Vistas目标检测任务强调识别静态的街道图像对象(如路灯、路标,电线杆)的个体实例,以及动态的街道参与者(如汽车、行人、骑自行车的人)。这项任务旨在推动最先进的实例分割,针对汽车或运输机器人等自动驾驶应用的关键感知任务。

2、Mapillary Vistas全景分割任务

Mapillary Vistas Panoptic分割任务针对街景图像中的完整感知区域。全景分割需要同时处理stuff 类和thing类,统一了典型的不同语义和实例分割任务。

COCO 2017竞赛结果:中国团队刷榜,超越谷歌、Facebook

回过头去看2017年的COCO 竞赛的结果,当时是在ICCV 2017 “Joint COCO and Places Recognition Challenge Workshop” 公布。

当时,微软、Facebook、谷歌、商汤、旷视等企业,以及卡内基梅隆大学、北京大学、香港中文大学、上海交通大学等高校纷纷参与,竞争激烈。

在侧重对物体的理解的传统4大任务中:

物体检测(边界框 BBox):旷视研究院团队第一,港中文&北大团队 UCenter 第二,微软亚洲研究院(MSRA)团队与来自 FAIR 的团队分别获得第三、第四

语义分割(Segmentation):港中文&北大团队 UCenter 第一,旷视研究院团队第二,FAIR 和MSRA 分别获得第三、第四

人体关键点检测:旷视研究院第一,北航&商汤团队 OKS 第二

背景语义分割(Stuff Challenge):FAIR 团队第一,牛津视觉实验室第二

2017年的COCO 还联合举办了 Places 2017 这项侧重对场景理解的挑战赛,分为3个子任务:

Places 分为场景分割、物体分割和边缘检测三项任务。其中,物体分割(Instance Segmentation)任务,旷视击败了谷歌,赢得了冠军。

根据 Workshop 官方介绍,在 Places 环节受邀发表演讲的是来自谷歌(G-RMI)、今日头条(WinterIsComing,ByteDance)和中科院自动化所与京东合作的团队(CASIA_IVA_JD)。这无疑是后两个团队在 Places 2017 竞赛中取得好成绩的证明。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    8

    文章

    447

    浏览量

    37908
  • 计算机视觉
    +关注

    关注

    8

    文章

    1600

    浏览量

    45615

原文标题:2018 COCO 竞赛中国团队包揽所有冠军,旷视 4 项第一!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 566次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    最适合 AI 应用的计算机视觉类型是什么?

    着眼于使计算机能够像人类一样通过“看”来感知世界,从这一视角对人工智能 (AI) 进行了探讨。我将简要比较每一类计算机视觉,尤其关注在本地而不是依赖基于云的资源收集和处理数据,并根据数
    的头像 发表于 12-18 13:09 6853次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 3123次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-15 16:38 235次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    计算机视觉前景光明

    电子发烧友网站提供《计算机视觉前景光明.pdf》资料免费下载
    发表于 09-18 10:16 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>前景光明

    【RISC-V + OpenCV 计算机视觉】用 VisionFive 2 昉·星光 2 进行物体识别

    RVSpace:【RISC-V + OpenCV 计算机视觉】用 VisionFive 2 昉·星光 2 进行物体识别 bilibili:【【RISC-V + OpenCV 计算机视觉
    发表于 09-08 11:42

    计算机视觉中的九种深度学习技术

    计算机视觉中仍有许多具有挑战性的问题需要解决。然而,深度学习方法正在针对某些特定问题取得最新成果。 在最基本的问题上,最有趣的不仅仅是深度学习模型的表现;事实上,单个模型可以从图像中学习意义并执行
    发表于 08-21 09:56 359次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>中的九种深度学习技术

    人工智能计算机视觉方向是什么

    人工智能计算机视觉方向是什么 人工智能计算机视觉方向是指利用人工智能技术对图像和视频进行各种分析、解释和操作的过程。计算机
    的头像 发表于 08-15 16:06 1189次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1127次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉的概念和主要任务

    作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?
    的头像 发表于 07-17 11:20 886次阅读

    计算机视觉体温测量系统

    电子发烧友网站提供《计算机视觉体温测量系统.zip》资料免费下载
    发表于 07-03 11:31 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>体温测量系统

    计算机视觉驱动的迪斯科开源分享

    电子发烧友网站提供《计算机视觉驱动的迪斯科开源分享.zip》资料免费下载
    发表于 06-30 14:48 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>驱动的迪斯科开源分享

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 861次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 516次阅读