新的方向
随着学术界不断创新,整个目标检测领域发展飞快,从两阶段的 faster rcnn 开始,到一阶段的 yolov3 和 retinanet,性能和速度不断提升。但是上述做法都算作 anchor-base 做法,anchor-base 做法最大弊端是先验 anchor 需要针对不同数据进行调整,一旦设置不好对最终结果影响较大,故很多学者希望解决该问题。
2017 年 Zhaowei Cai 等提出 Cascade R-CNN,通过对 rcnn 部分的 iou 正负样本定义阈值进行深入分析,将两阶段算法扩展到多阶段,该思想将整个 faster rcnn 系列算法精度推到了一个新的高度,至今也是提高精度的利器
2015 年百度提出 DenseBox,其算是一个知名的 anchor-free 算法,直接利用特征图语义进行检测,其主要目的是解决普适物体检测问题,包括物体检测和关键点检测等等。由于当时 fast rcnn 系列风头正盛,所有当时没有引起多少重视
2016 年 face++研究员针对 DenseBox 存在的 bbox 回归不准的问题提出 UnitBox 算法,主要是提出了 IoU 损失,将 xywh 优化统一起来
2018 年 Hei Law 等提出著名的 cornernet 算法,其也属于 anchor-free 算法,但是创新性的将目标检测任务转化为左上右下关键点检测问题,其思想深深影响了后续算法。同年商汤科技将上述思想应用于两阶段算法中,提出了 grid rcnn
归功于 FPN 和多尺度预测的功效,2019 年和 2020 年是 anchor-free 算法井喷之年,典型的有 Chunhua Shen 等提出的 fcos,直接输出特征图,然后回归点距离 gt bbox4 条边的距离;Xingyi Zhou 等提出的 centernet,直接将物体检测任务建模成预测中心点加上宽高属性;微软研究院等提出的 reppoint,通过 9 个语义点和 dcn 思想回归出 bbox
在上述发展基础上,2020 年也有很多学者将 nlp 领域的 transformer 引入到目标检测领域,其最大优点是:不需要设置 anchor,不需要 nms,不需要复杂后处理,不需要提供多少先验知识,超参也比较少,基于这些优点从而代码相比 faster rcnn 也简单很多,容易理解。典型算法是 facebook 提出的 detr 和商汤科技提出的可变形 detr,基于 transformer 的目标检测算法未来潜力无穷。
Last updated