张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

盘点一下mAP最高的目标检测算法

新智元 2019-07-13 08:10 次阅读

目标检测中存在两个非常重要的性能:精度和速度,特指mAP和FPS。本文便对mAP最高的目标检测算法进行了盘点。

趁最近目标检测(Object Detection)方向的论文更新较少,赶紧做个"最强目标检测算法"大盘点。

要知道衡量目标检测最重要的两个性能就是 精度和速度,特指mAP 和 FPS。其实现在大多数论文要么强调 mAP 很高,要么就是强调 mAP 和 FPS 之间 Trade-off 有多好。

本文就来盘点一下mAP 最高的目标检测算法,小编将在COCO数据集上 mAP 最高的算法认为是"性能最强"目标检测算法。(COCO数据集是现在最主流的目标检测数据集,这一点看最新的顶会论文就知道了)

时间:2019.07.07

盘点内容:目标检测 mAP 最高的算法

说到目标检测算法,大家脑子里最先蹦出来的算法应该是 Faster R-CNN 和 YOLOv3。这一点在我调研的时候,从大家的反馈明显看得出来。

要知道 Faster R-CNN已经是2015年提出的论文了,而YOLOv3发表出来也已经一年多了。最近目标检测相关的论文,比较典型的有:SNIPER、CornerNet、ExtremeNet、TridentNet、FSAF、FCOS、FoveaBox、两个CenterNet 和 CornerNet-Lite等。

这么多目标检测算法,究竟哪家最强呢?!

性能最强的目标检测算法

这里罗列了几个mAP很强很强的算法,并以时间线的角度来展示。

注意:各个网络使用不同backbone,或加不同的tricks,都会有不同的 mAP。所以小编只介绍所能查到最强的算法或者最强组合算法。

SNIPER: Efficient Multi-Scale Training

mAP:47.6

Date:2018.05.23

arXiv:https://arxiv.org/abs/1805.09300

https://github.com/MahyarNajibi/SNIPER/

TridentNet:Scale-Aware Trident Networks for Object Detection

mAP:48.4

Date:2019.01.07 (已开源)

arXiv:https://arxiv.org/abs/1901.01892

https://github.com/TuSimple/simpledet

HTC + DCN + ResNeXt-101-FPN

mAP:50.7

Date:2019.01.22 (已开源)

arXiv:https://arxiv.org/abs/1901.07518

https://github.com/open-mmlab/mmdetection

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

mAP:48.3

Date:2019.04.16 (未开源)

arXiv:https://arxiv.org/abs/1904.07392

CornerNet-Saccade+gt attention

mAP:50.3

Date:2019.04.18 (已开源)

arXiv:https://arxiv.org/abs/1904.08900

https://github.com/princeton-vl/CornerNet-Lite

Cascade R-CNN:High Quality Object Detection and Instance Segmentation

mAP:50.9

Date:2019.06.24 (已开源)

arXiv:https://arxiv.org/abs/1906.09756

Caffe:https://github.com/zhaoweicai/cascade-rcnn

PyTorch:https://github.com/zhaoweicai/Detectron-Cascade-RCNN

Learning Data Augmentation Strategies for Object Detection

mAP:50.7

Date:2019.06.26 (已开源)

arXiv:https://arxiv.org/abs/1906.11172

https://github.com/tensorflow/tpu/tree/master/models/official/detection

综上所述,可知改进后的 Cascade R-CNN 算法是目前(2019.07.07)目标检测方向性能最强的算法,其 mAP 为 50.9。

侃侃

这里将 mAP 作为目标检测最强的指标,确实有失偏颇,不够严谨,因为很多人将目标检测应用在不同的任务上,其实要求的性能也有所不同。但请放心,小编后续会统计一波 FPS最快的目标检测算法 和 mAP-FPS Trade-off 最佳的算法。

原文标题:大盘点 | 性能最强的目标检测算法

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

构建高质量数据集,推动人工智能快速发展

当前人工智能还面临诸多挑战,例如数据孤岛问题、隐私保护问题、安全问题等瓶颈。一项2018年的研究显示....
的头像 倩倩 发表于 08-20 15:04 283次 阅读
构建高质量数据集,推动人工智能快速发展

Facebook的研究人员提出了Mesh R-CNN模型

这一研究的目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,....
的头像 将门创投 发表于 08-02 15:51 181次 阅读
Facebook的研究人员提出了Mesh R-CNN模型

基于编码器-解码器的架构来从水下图像重建出清晰的图像

研究人员首先充分考虑了水下成像过程中的波长相关衰减、光散射和水体的影响,合成了丰富的数据用于模型训练....
的头像 将门创投 发表于 08-02 15:33 256次 阅读
基于编码器-解码器的架构来从水下图像重建出清晰的图像

基于学习的数据增强策略扩充你的数据集!

数据增强广泛是机器学习中常用的数据处理手段,不同的数据集通常会利用针对性的数据处理手段来处理。例如M....
的头像 将门创投 发表于 08-02 15:00 297次 阅读
基于学习的数据增强策略扩充你的数据集!

人脸识别产品设计,AI产品经理需要了解的实战干货

获取图像的方式有两种,第一种是直接从源头获取,通过对接前端各类相机、NVR录像存储等设备。第二种是间....
的头像 将门创投 发表于 08-02 14:39 430次 阅读
人脸识别产品设计,AI产品经理需要了解的实战干货

代码+实验分析,助你全面理解C3F

为了能够使得输入图像兼容更多的网络,预处理时对图像的高和宽进行了限制,使其能够被16整除。确保网络中....
的头像 将门创投 发表于 08-02 14:22 161次 阅读
代码+实验分析,助你全面理解C3F

基于深度学习的推荐算法大部分都存在不同程度的数据集缺失和源码缺失

不同工作采用的数据集,验证方法,性能指标,数据预处理步骤都不同,这使得性能对比很困难,无法确定哪个工....
的头像 AI科技大本营 发表于 08-02 09:33 237次 阅读
基于深度学习的推荐算法大部分都存在不同程度的数据集缺失和源码缺失

NLP界的“神话”并没那么神?

我们惊讶地发现BERT在参数推理理解任务中的峰值性能达到77%,仅比平均未经训练的人类基线低3个点。....
的头像 新智元 发表于 07-27 07:55 227次 阅读
NLP界的“神话”并没那么神?

DeepMind把GAN又玩出了新花样!推出的是双视频判别器GAN

研究人员表示,由于“高效计算”组件和技术的使用,再加上新的定制数据集,他们训练出的最佳性能模型:双视....
的头像 新智元 发表于 07-27 07:37 167次 阅读
DeepMind把GAN又玩出了新花样!推出的是双视频判别器GAN

XLNet vs BERT,对比得明明白白!

训练语料库:Wikipedia + BooksCorpus,在处理Wikipedia时使用了与BER....
的头像 AI科技大本营 发表于 07-27 07:14 287次 阅读
XLNet vs BERT,对比得明明白白!

利用ISE13.4研究XC6SLX75T发生错误

嗨,大家好, 我正在研究XC6SLX75T,工具:ISE13.4。 XST中的设备利用率摘要低于切片寄存器数量9071932969%切片L...
发表于 07-25 14:02 34次 阅读
利用ISE13.4研究XC6SLX75T发生错误

一亿多条政府真实数据的比赛你见识过吗?

本次大赛面向的是内地和港澳地区高等院校、专业研究机构、数据分析公司、开发者等举办的大型数据创新类竞赛....
的头像 新智元 发表于 07-21 07:35 495次 阅读
一亿多条政府真实数据的比赛你见识过吗?

掌握PyTorch图片分类的简明教程

这次的实战使用的数据是交通标志数据集,共有62类交通标志。其中训练集数据有4572张照片(每个类别大....
的头像 AI科技大本营 发表于 07-18 15:24 331次 阅读
掌握PyTorch图片分类的简明教程

LaSOT数据集的构造原理和评估方法

图1:常用跟踪数据集统计示意图。包括OTB-2013、OTB-2015、TC-128、NUS-PRO....
的头像 AI科技大本营 发表于 07-18 14:52 400次 阅读
LaSOT数据集的构造原理和评估方法

哈工大讯飞联合实验室发布基于全词覆盖的中文BERT预训练模型

同理,由于谷歌官方发布的BERT-base(Chinese)中,中文是以字为粒度进行切分,没有考虑到....
的头像 AI科技大本营 发表于 07-18 14:36 505次 阅读
哈工大讯飞联合实验室发布基于全词覆盖的中文BERT预训练模型

如何在大型数据集中使用datatable包进行数据处理

为了能够更准确地构建模型,现在机器学习应用通常要处理大量的数据并生成多种特征,这已成为必要的。而 P....
的头像 AI科技大本营 发表于 07-18 14:24 353次 阅读
如何在大型数据集中使用datatable包进行数据处理

大数据+深度学习下,BigDL框架的利弊与应用教程

为什么要权衡这些问题其实不难理解,我们需要保持一致的环境,避免大型数据集跨不同集群之间的传递。此外,....
的头像 AI科技大本营 发表于 07-18 14:21 373次 阅读
大数据+深度学习下,BigDL框架的利弊与应用教程

不用写一行就带就可以参加 Kaggle,这个真香!

随着 AI 技术的不断发展与落地,有越来越多的平台和工具可供大家使用,这些平台针对不同领域、不同层次....
的头像 AI科技大本营 发表于 07-18 10:59 439次 阅读
不用写一行就带就可以参加 Kaggle,这个真香!

阐述正态分布的概率,并解释它的应用为何如此的广泛

我们可以将这些取值分为不同的集合类,在每一类中,我们记录属于该类结果的次数。例如,我们可以投1000....
的头像 AI科技大本营 发表于 07-13 08:03 427次 阅读
阐述正态分布的概率,并解释它的应用为何如此的广泛

半小时学会PyTorch快速图片分类

cnn_learner 使用来自给定架构的预训练模型构建CNN学习器、来自预训练模型的学习参数用于初....
的头像 新智元 发表于 07-13 07:57 309次 阅读
半小时学会PyTorch快速图片分类

时间序列的特征分析,一文帮你全Get!

首先我们来看 panda 包里面的 read_csv() 函数,它可以将时间序列数据集(关于澳大利亚....
的头像 AI科技大本营 发表于 07-13 07:37 701次 阅读
时间序列的特征分析,一文帮你全Get!

FRVT赛程全纪录:格灵深瞳全球排名前五

在FRVT评测中,测试集是完全不公开的,只有简略的几段话描述。这意味着FRVT用的不是传统那种通过在....
的头像 AI科技大本营 发表于 07-13 07:33 692次 阅读
FRVT赛程全纪录:格灵深瞳全球排名前五

Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果

谷歌的结果促进了半监督学习的复兴,而且还发现3点有趣的现象:(1)SSL可以匹配甚至优于使用数量级更....
的头像 新智元 发表于 07-13 07:31 425次 阅读
Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果

在kaggle的竞赛中,参赛者取得top0.3%的经验和技巧

预测价格对数和真实价格对数的RMSE(均方根误差)作为模型的评估指标。将RMSE转化为对数尺度,能够....
的头像 AI科技大本营 发表于 07-13 07:29 653次 阅读
在kaggle的竞赛中,参赛者取得top0.3%的经验和技巧

Hinton等人新研究告诉你:标签平滑技术到底怎么用!

为了对这一现象进行解释,本文对标签平滑对网络倒数第二层表示的影响进行了可视化,发现标签平滑使同一类训....
的头像 AI科技大本营 发表于 07-07 09:40 722次 阅读
Hinton等人新研究告诉你:标签平滑技术到底怎么用!

在多个数据集的光流预测任务上大幅提升了预测性能

在每个级别的网络架构(类似于PWC-Net)。˙wl表示水平l的初始粗流,F l表示翘曲的特征表示。....
的头像 新智元 发表于 07-07 07:56 440次 阅读
在多个数据集的光流预测任务上大幅提升了预测性能

没有数据的人工智能不是真正的智能

人工智能的目标是让机器像人类一样学会学习。算法训练、深度学习等都需要大量数据支持,数据挖掘是人工智能....
发表于 06-29 10:29 88次 阅读
没有数据的人工智能不是真正的智能

一套触屏式交互数据分析和预测系统再现《钢铁侠》全息黑科技

再现《钢铁侠》全息黑科技在ACM SIGMOD 2019上发表的该项目的研究论文中,研究人员详细介绍....
的头像 新智元 发表于 06-29 09:35 462次 阅读
一套触屏式交互数据分析和预测系统再现《钢铁侠》全息黑科技

无需翻译的无监督复述的新方法:允许从输入句子生成多样化、但语义上接近的句子

理论上来看,翻译技术可能是自动复述的有效解决方案,因为翻译技术是从语言实现中抽象出语义内容。例如,将....
的头像 新智元 发表于 06-29 07:41 693次 阅读
无需翻译的无监督复述的新方法:允许从输入句子生成多样化、但语义上接近的句子

何恺明团队所在的Facebook AI推出ResNeXt-101模型

本文试图通过研究一个未开发的数据体系来解决这个复杂的问题:使用外部社交媒体上数十亿的带有标签的图像作....
的头像 新智元 发表于 06-29 07:26 845次 阅读
何恺明团队所在的Facebook AI推出ResNeXt-101模型

Nature高光论文被质疑存在重大缺陷

本周,两位从事地震分析的数据科学家Arnaud Mignan和Marco Broccardo也撰文指....
的头像 新智元 发表于 06-29 07:21 426次 阅读
Nature高光论文被质疑存在重大缺陷

脑细胞研究员感谢人工智能

脑细胞研究员的独白:感谢人工智能,不用再每天对着显微镜苦干了,由于分析细胞并不需要添加固定剂或荧光染....
发表于 06-28 14:41 60次 阅读
脑细胞研究员感谢人工智能

李飞飞等人ICLR2019论文构建人类眼睛感知评估(HYPE),带给你新的认知

我们在ImageNet 的和CIFAR-10数据集上对HYPE 的性能进行了测试。当产生CIFAR-....
的头像 新智元 发表于 06-23 10:08 542次 阅读
李飞飞等人ICLR2019论文构建人类眼睛感知评估(HYPE),带给你新的认知

深度ReLU网络的训练动态过程及其对泛化能力的影响

基于这个框架,我们试图用统一的观点来解释这些令人费解的经验现象。本文使用师生设置,其中给过度参数化的....
的头像 新智元 发表于 06-15 10:48 618次 阅读
深度ReLU网络的训练动态过程及其对泛化能力的影响

清华大学“人工智能前沿与产业趋势”系列讲座的第五讲

其次是应用。雷鸣提到,在医疗方面,人类已经定义的疾病有3万多种,这疾病如何分类、如何预测,都是需要通....
的头像 新智元 发表于 06-15 10:10 977次 阅读
清华大学“人工智能前沿与产业趋势”系列讲座的第五讲

对抗性解耦学习,让“夏虫语冰”

面临上述的训练和测试数据之间的领域差异的问题,简单地应用数据驱动的模型可能导致模型聚焦于每个领域的偏....
的头像 新智元 发表于 06-07 15:46 503次 阅读
对抗性解耦学习,让“夏虫语冰”

如何利用深度学习技术处理图像水印

水印作为一种保护版权的有效方式被广泛地应用于海量的互联网图像,针对水印的各种处理显得越来越重要,比如....
的头像 AI科技大本营 发表于 06-07 11:32 461次 阅读
如何利用深度学习技术处理图像水印

数据可视化用来创造一条快速认识数据集的捷径

数据可视化用来创造一条快速认识数据集的捷径,图形化的数据表示方法能够将人类的注意力吸引到重要目标,搭....
的头像 新智元 发表于 06-07 11:16 513次 阅读
数据可视化用来创造一条快速认识数据集的捷径

一个完整的MNIST测试集,其中包含60000个测试样本

NIST手写字符集的第一部分已经在一年前发布,它是一个由2000名人口普查局员工手写的训练集和500....
的头像 AI科技大本营 发表于 06-02 09:43 497次 阅读
一个完整的MNIST测试集,其中包含60000个测试样本

MIT人工智能实验室的研究人员开发了一种“触觉手套”

即使我们的其他感官失败了,提供给我们大脑的触觉信息仍然是我们与周围环境交互的有力工具。这是一种非常重....
的头像 新智元 发表于 06-02 09:37 1003次 阅读
MIT人工智能实验室的研究人员开发了一种“触觉手套”

如何使用TensorFlow2.0构建和部署端到端的图像分类器

从 TensorFlow Datasets 中下载的数据集包含很多不同尺寸的图片,我们需要将这些图像....
的头像 AI科技大本营 发表于 05-31 17:08 571次 阅读
如何使用TensorFlow2.0构建和部署端到端的图像分类器

Adobe研究院的研究者们提出了全新的通用深度网络架构CPNet

我们将网络的核心命名为”CP模块“,其结构如下,大致分为两个部分。输入和输出都是一个THW x C的....
的头像 新智元 发表于 05-25 09:41 572次 阅读
Adobe研究院的研究者们提出了全新的通用深度网络架构CPNet

利用AI+脑电波,锁定你想听的声音

哥伦比亚大学Mortimer B. Zuckerman Mind Brain Behavior In....
的头像 新智元 发表于 05-25 09:37 702次 阅读
利用AI+脑电波,锁定你想听的声音

训练一个机器学习模型,实现了根据基于文本分析预测葡萄酒质量

我们可以把上述的其他信息也引入作为特征参数,这样就能构建出一个更全面的模型来预测葡萄酒质量。为了将文....
的头像 电子发烧友网工程师 发表于 05-16 18:27 734次 阅读
训练一个机器学习模型,实现了根据基于文本分析预测葡萄酒质量

对抗性样本真的是不自然且无意义的吗?

慢慢的,随着Nets越来越老,越来越聪明,他们开始在See-Far中发现越来越多的信号模式。他们发现....
的头像 电子发烧友网工程师 发表于 05-15 11:25 613次 阅读
对抗性样本真的是不自然且无意义的吗?

以图搜图背后的技术,你了解吗?

深度学习技术兴起之后,基于深度学习的图像特征开始成为图像检索的主流。我们知道CNN网络具有很多不同程....
的头像 将门创投 发表于 05-14 09:29 1509次 阅读
以图搜图背后的技术,你了解吗?

一种基于少样本目标类别图像的图像翻译模型

少样本图像翻译器 G 由一个内容编码器 Ex,一个类编码器 Ey 和一个解码器 Fx 构成。其中内容....
的头像 电子发烧友网工程师 发表于 05-14 09:12 655次 阅读
一种基于少样本目标类别图像的图像翻译模型

IJCAI录取结果被吐槽太厉害,主席都出来放话了

微软亚洲研究院实习生,知乎ID:“张旭”表示:审稿人不熟悉所在领域,大量刚刚入门的学生参与评审并给出....
的头像 新智元 发表于 05-14 08:48 813次 阅读
IJCAI录取结果被吐槽太厉害,主席都出来放话了

一种新型的GAN,在测试期间只需几张示例图像

基于该假设,研究人员使用包含许多不同对象类的图像的数据集来训练FUNIT模型,以模拟过去的视觉体验。....
的头像 电子发烧友网工程师 发表于 05-13 09:17 634次 阅读
一种新型的GAN,在测试期间只需几张示例图像

对抗样本真的是bug吗?对抗样本不是Bug, 它们是特征

过去几年里,对抗样本在机器学习社区中得到了极大的关注。关于如何训练模型使它们不易受到对抗样本攻击的工....
的头像 新智元 发表于 05-10 08:54 621次 阅读
对抗样本真的是bug吗?对抗样本不是Bug, 它们是特征

如何使用多注意力长短时记忆进行实体属性的情感分析

属性情感分析是细粒度的情感分类任务。针对传统神经网络模型无法准确构建属性情感特征的问题,提出了一种融....
发表于 05-08 17:07 73次 阅读
如何使用多注意力长短时记忆进行实体属性的情感分析

Hive的创建文件数限制的解决方法

解决Hive创建文件数过多的问题
发表于 04-29 11:12 162次 阅读
Hive的创建文件数限制的解决方法

基于react父组件传值给子组件的例子说明state和props

react-9 state , props  和  map 循环渲染的简单描述...
发表于 04-12 06:12 152次 阅读
基于react父组件传值给子组件的例子说明state和props

MAP致命错误

嗨, 我正在使用planAhead 14.4,在映射过程中我收到以下错误: FATAL_ERROR:Map:mapbafragmast.c:1981:1.68&...
发表于 03-13 06:23 93次 阅读
MAP致命错误

如何阅读.map文件

如何阅读.map文件 以上来自于谷歌翻译 以下为原文 how to read the .map file...
发表于 03-08 16:27 318次 阅读
如何阅读.map文件

怎么在map文件中查找bootloadable start

当在PSoC 3项目上为Bootloader设置闪存保护时,很容易从地图文件中找到引导加载程序Flash启动和结束。PSOC5项目的MAP...
发表于 01-22 07:15 203次 阅读
怎么在map文件中查找bootloadable start

如何在原理图中不显示s2p文件名

嗨,有人知道如何在原理图中不显示s2p文件名吗? 谢谢你:FLJ于2014年3月14日上午7点14分 以上来自于谷歌翻译 &nbs...
发表于 01-15 14:38 204次 阅读
如何在原理图中不显示s2p文件名

利用切片的最佳利率是多少?

我对资源利用有一些疑问。 1)利用切片的最佳率是多少? 80%或90%?? (鉴于其他资源充足) 我曾经达到切片利用率的99%, ...
发表于 01-14 14:01 134次 阅读
利用切片的最佳利率是多少?

清洗误标注的开发集和测试集样本

在进行误差分析时,你可能会注意到一些开发集的样本被误标注(mislabeled )了。此处的“误标注”指的是图像在使用算法处理前,已...
发表于 12-19 09:48 556次 阅读
清洗误标注的开发集和测试集样本

建立开发集和测试集(总结)

• 被选择作为开发集和测试集的数据,应当与你未来计划获取并对其进行良好处理的数据有着相同的分布,而不一定和训练集的数据分布...
发表于 12-14 10:56 435次 阅读
建立开发集和测试集(总结)