DINO:DETR 的高效变体
论文
DINO(DETR with Improved deNoising anchor boxes)是一种基于 DETR 的目标检测模型,通过多种创新方法显著提升了训练效率和检测性能。
解析文章
DINO 的核心改进包括对比去噪训练(Contrastive DeNoising Training)、混合查询选择(Mixed Query Selection)和两次前瞻(Look Forward Twice)。这些方法共同加速了模型的收敛速度,并提高了检测精度。
对比去噪训练(Contrastive DeNoising Training)
对比去噪训练通过引入正负样本查询,解决了 DETR 中的噪声问题。正样本查询靠近真实目标框(GT box),而负样本查询则远离目标框。通过这种方式,模型能够更好地区分目标和背景,从而减少重复预测和误分类的问题。
混合查询选择(Mixed Query Selection)
混合查询选择策略结合了静态查询和动态查询的优点。它通过选择编码器特征来初始化解码器的位置查询,同时保持内容查询的可学习性。这种方法能够更好地利用编码器的特征信息,从而提高解码器的性能。
两次前瞻(Look Forward Twice)
两次前瞻方法通过利用后一层的改进信息来优化前一层的预测结果。与传统的单次前瞻方法相比,这种方法能够更有效地利用层间的梯度信息,从而提高预测的准确性。
视频
https://www.bilibili.com/video/BV1d7axeuEQg/ https://www.bilibili.com/video/BV1p24y1t7tF/ https://www.bilibili.com/video/BV1hm4y1J7Kg/ https://www.bilibili.com/video/BV1pY4y1A7NC/ https://www.bilibili.com/video/BV1Hr2AYvEwr/