DETR-2-Backbone
【DETR源码解析】二、Backbone模块
来自 https://blog.csdn.net/qq_38253797/article/details/127614228 满船清梦压星河HK
R50有Layer1-Layer4 冻结Layer1浅层特征提取层
https://blog.csdn.net/qq_45819091/article/details/124808773
CW 源码解析目标检测的跨界之星DETR(三)、Backbone与位置编码 https://zhuanlan.zhihu.com/p/372255160
https://www.163.com/dy/article/FSRN2NOH0511DPVD.html https://zhuanlan.zhihu.com/p/308301901 骨架网络可以是任何一种,作者选择resnet50,将最后一个stage即stride=32的特征图作为编码器输入。由于resnet仅仅作为一个小部分且已经经过了imagenet预训练,故和常规操作一样,会进行如下操作:
resnet中所有BN都固定,即采用全局均值和方差
resnet的stem和第一个stage不进行参数更新,即parameter.requires_grad_(False)
backbone的学习率小于transformer,lr_backbone=1e-05,其余为0.0001
假设输入是(b,c,h,w),则resnet50输出是(b,1024,h//32,w//32),1024比较大,为了节省计算量,先采用1x1卷积降维为256,最后转化为序列格式输入到transformer中,输入shape=(h'xw',b,256),h'=h//32