快捷搜索:  MTU2MjE4NzQ3MA`

目标检测二十年的技术综述和总结及未来的发展

谋略机视觉中的目标检测,因其在真实天下的大年夜量利用需求,比如自动驾驶、视频监控、机械人视觉等,而被钻研学者广泛关注。

几天前,arXiv新出一篇目标检测文献《Object Detection in 20 Years: A Survey》对该领域20年来呈现的技巧进行了综述,这是一篇投向PAMI的论文,作者们review了400+篇论文,总结了目标检测成长的里程碑算法和state-of-the-art,并且难能珍贵的对算法流程各个技巧模块的演进也进行了阐明,还深入到目标检测的特定领域如人脸检测、行人检测等进行了总结,着末枚举了未来可能的成长偏向。

温故而知新,异常值得参考!

作者信息:

该文作者来自美国密歇根大年夜学、北京航空航天大年夜学、滴滴出行。

下图是作者在谷歌学术检索目标检测相关关键字返回的历年文献数量,可见该领域20年来越来越受到学术界的关注。2018年有将近1200篇相关文献颁发。

目标检测路线图

作者将目标检测近20年来的里程碑算法画在光阴轴上,如下:

可见作者将算法大年夜致分为2012年之前的传统检测措施与2012年之后呈现的基于深度进修的检测措施。

传统措施比如我们所熟知的V-J检测、HOG检测、DPM算法。

深度进修措施截然不合的分为两条技巧路径:单阶段检测算法与两阶段检测算法。

同时作者把目标检测的一些精度前进的措施的呈现也列在了光阴轴上,比如bounding box regression、multi-resolution detection等。

在今朝最有名的评估数据集 VOC 2007 、VOC 2012、 COCO 上不合年份呈现的算法精度前进,如下图:

可见,深度进修在检测领域的开山之作 RCNN 取得了大年夜幅度精度前进,开辟了检测的新期间。而今年新出的 TridentNet 是今朝在 COCO 数据集上取得最高精度的算法。

目标检测数据集

作者总结了通用目标检测及几个特定目标检测的数据集。

通用目标检测领域常用数据集:

几个常用数据集的示例图片:

行人检测常用数据集:

人脸检测常用数据集:

文本检测常用数据集:

交通灯检测与交通标志检测常用数据集:

遥感目标检测常用数据集:

目标检测技巧演进

作者将目标检测中涉及的各类技巧的演进铺展开来,让我们能就单一技巧看到成长路径。

早期目标检测算法代表:

多尺度检测技巧演进路线图:

困绕框回归技巧演进路线图:

目标高低文建模技巧演进路线图:

困绕框非极大年夜抑制(NMS)技巧演进路线图:

难检测负样本掘客技巧演进路线图:

目标检测谋略加速

目标检测生成是谋略密集型义务,以是在其成长的各个阶段,目标检测算法的加速就不停是一个紧张议题。

作者总结的目标检测谋略加速措施:

可见主如果在三个层次加速:

数值谋略层次(如积分图、矢量量化等)、

检测引擎层次(收集剪枝与量化、轻量级收集设计等)、

检测流程层次(特性图共享、分类器加速、级连检测等)。

由于今朝CNN检测措施是主流,作者列出了近年呈现的卷积谋略的一些加速措施及当光阴繁杂度:

目标检测进展

作者在这部分描述了近三年来state-of-the-art目标检测技巧的钻研进展。

1. 更好地引擎(engine)

作者将深度进修目标检测收集的骨干网称为其引擎。改进目标检测的一个直接思路便是应用加倍先辈的骨干网。

如下图:

相同算法用相同颜色的圆点表示,应用相同引擎的算法结果用一个大年夜括号连接,我们可以随意马虎看出,应用不合的引擎对终极精度的影响更大年夜。

2. 应用更好的特性

作者主要指:1)特性交融;2)进修大年夜感想熏染野的高分辨率特性

3. 逾越滑动窗口

不再是局限于候选区域再分类的模式。作者提到两种新模式:

1)子区域搜索 sub-region search。将目标检测看为从初始网格到终极ground truth box的路径筹划历程。

2)关键点定位。将目标检测看为特定语义点定位的历程。

比如:

ECCV18 Oral | CornerNet目标检测开启猜测“界限框”到猜测“点对”的新思路

Grid R-CNN解读:商汤最新目标检测算法

4. 目标定位改进

1)困绕框提精。

2)改进loss函数用于正确定位。比如:

5. 检测与瓜分一路进行

瓜分可以赞助目标检测前进种别识别的精度、得到更好地目标定位、嵌入加倍富厚的高低文。

瓜分的收集可以作为目标检测的提取收集,也可以作为多义务进修的丧掉函数,用以改进目标检测。

6. 扭转和尺度变更鲁棒的目标检测

针对旋转变更鲁棒改进偏向:

1)扭转不变丧掉函数;

2)扭转校对;

3)Rotation RoI Pooling。

针对尺度变更鲁棒的改进:

1)尺度自适应练习;

2)尺度自适应检测。

7. Training from Scratch

不应用预练习模型,从头开始练习目标检测收集。

8. 抗衡练习

比如有钻研注解,GAN可以用来改进小目标的检测。

9. 弱监督的目标检测

不应用困绕框标注,而仅应用图像级的目标标注的算法。

削减标注资源,扩大年夜练习集。

目标检测利用

作者枚举了目标检测的几个特殊利用,包括行人检测、人脸检测、文本检测、交通灯及标志检测、遥感目标检测。

指出每种检测义务面临的艰苦和寻衅,并简述了今朝应对这些问题的措施。

目标检测的未来偏向

作者枚举的未来偏向包括:

1. 轻量级目标检测算法;

2. 用AutoML设计目标检测算法;

3. 域适应(domain adaptation)改进目标检测;

4. 弱监督的目标检测;

5. 小目标检测;

6. 视频目标检测

7. 交融其他传感器信息的目标检测。

论文地址:

https://arxiv.org/abs/1905.05055v1

(*本文为 AI科技大年夜本营转载文章,转载请联系作者)

公开课杰出保举

本次课程将会先容若何使用TensorRT加速YOLO目标检测,课程将会着重先容编程措施。本次课程还会涉及到 TensorRT 中数据类型,流处置惩罚,多精度推理等细节的展示。本次课程特色是解说+示例分享。本次课程中,QA也是一个异常杰出的环节。

保举涉猎

开源要自主?华为若何“复制”Google模式

谷歌用1.2万个模型“推翻”现有无监督钻研成果!斩获ICML 2019最佳论文

24式,加速你的Python

荔枝“自由”?同伙,你实现了吗?

为防 Android 碎片化?Google 逼迫开拓者应用自有开拓对象!

Docker 存储选型,这些年我们碰到的坑

制造业转型物联网,看博世若何破界

回报率850%? 这个用Python优化的比特币买卖营业机械人的确太烧脑了...

口试阿里技巧岗,竟然挂在第4 轮……

你点的每个“在看”,我都卖力当成了爱好

您可能还会对下面的文章感兴趣: