Anchor-free轻量级红外目标检测方法（特邀）

高凡; 杨小冈; 卢瑞涛; 王思宇; 高久安; 夏海

doi:10.3788/IRLA20220193

Anchor-free轻量级红外目标检测方法（特邀）

doi: 10.3788/IRLA20220193

高凡^{1, 2,},
杨小冈^2,,
卢瑞涛²,
王思宇²,
高久安²,
夏海²

1.
北京华航无线电测量研究所，北京 100013
2.
火箭军工程大学导弹工程学院，陕西西安 710025

基金项目: 国家自然科学基金（61806209）；陕西省自然科学基金（2020 JQ-490）；航空科学基金（201851 U8012）

详细信息

作者简介:
高凡，男，硕士生，主要从事计算机视觉方面的研究

中图分类号: TP391.4

Anchor-free lightweight infrared object detection method (Invited)

Gao Fan^{1, 2
,},
Yang Xiaogang^2
,,
Lu Ruitao²,
Wang Siyu²,
Gao Jiuan²,
Xia Hai²

1.
Beijing Huahang Radio Measurement Institute, Beijing 100013, China
2.
Missile Engineering Institute, Rocket Force University of Engineering, Xi’an 710025, China

Funds: National Natural Science Foundation of China （61806209）；Natural Science Foundation of Shaanxi Province（2020 JQ-490）；Chinese Aeronautical Establishment（201851 U8012）

摘要: 针对红外目标的特点，提出了一种anchor-free轻量级红外目标检测方法，提高了嵌入式平台对红外目标的检测能力。针对计算资源有限的平台，提出了一种新的轻量级卷积结构，引入非对称卷积增强标准卷积的特征表达能力，同时有效减少参数和计算量。设计并行多路特征通道，经过通道拼接生成丰富的特征，结合注意力模块和Channel Shuffle构建轻量级特征提取单元。增加SkipBranch促进浅层信息向高层传递，进一步丰富高层特征。在FLIR数据集进行实验验证，设计的轻量级网络结构精度为81.7% ，超过了 YOLOv4-tiny，但模型参数量减少了75.0%、计算量下降了71.1%，并且推理时间压缩了91.3%，能够满足嵌入式平台红外目标的实时检测需求。
- 红外目标 /
- 轻量化 /
- 目标检测 /
- 神经网络 /
- 非对称卷积
Abstract: According to the characteristics of infrared targets, an anchor-free lightweight infrared target detection method was proposed, which improved the detection ability of embedded platform. For the platform with limited computing resources, a new lightweight convolution structure was proposed. Asymmetric convolution was introduced to enhance the feature expression ability of standard convolution, reducing the amount of parameters and computation effectively. A lightweight feature extraction unit was constructed by designing parallel multi-feature path, which generated rich features through channel concatation, then combining with attention module and channel shuffle. SkipBranch was added to promote the transmission of shallow information to the high level and further enrich the characteristics of the high level. Experiments on FLIR dataset showed that the accuracy of the designed lightweight network structure was 81.7%, which exceeded YOLOv4-tiny. However, the model parameters and calculation amount were reduced by 75.0% and 71.1% respectively, and the reasoning time was compressed by 91.3%, which could meet the real-time detection requirements of infrared object on embedded platform.
- infrared target /
- lightweight /
- object detection /
- neural network /
- asymmetric convolution
图 1 PMFP结构

Figure 1. Structure of PMFP

下载: 全尺寸图片幻灯片

图 2 常规卷积和非对称卷积

Figure 2. Conventional convolution and asymmetric convolution

下载: 全尺寸图片幻灯片

图 3 Channel Shuffle

Figure 3. Channel Shuffle

下载: 全尺寸图片幻灯片

图 4 Slim-Focus结构

Figure 4. Structure of Slim-Focus

下载: 全尺寸图片幻灯片

图 5 降采样效果对比

Figure 5. Comparison of down-sampling effect

下载: 全尺寸图片幻灯片

图 6 SkipBranch结构

Figure 6. Structure of SkipBranch

下载: 全尺寸图片幻灯片

图 7 PMFPSNet轻量级模型结构

Figure 7. Structure of lightweight model PMFPSNet

下载: 全尺寸图片幻灯片

图 8 PANet结构

Figure 8. Structure of PANet

下载: 全尺寸图片幻灯片

图 9 Centerness label和IoU label

Figure 9. Centerness label and IoU label

下载: 全尺寸图片幻灯片

图 10 检测结果对比

Figure 10. Comparison of detection results

下载: 全尺寸图片幻灯片

表 1 模型性能比较

Table 1. Comparison of model performance

Model mAP Parameters GFLOPS Delay/ms

CSPNet 0.787 2.24 M 6.87 7.18
ShuffleNet 0.789 2.12 M 6.26 7.86
Maxpool 0.773 1.57 M 4.98 7.28
YOLOv4-tiny 0.811 6.27 M 17.2 84.6
PMFPSNet 0.817 1.57 M 4.98 7.34

下载: 导出CSV

[1]	Howard A G, Zhu M, Chen B, et al. MobileNets: Efficient convolutional neural networks for mobile vision applications [J]. arXiv preprint, 2017: 1704.04861. doi: 10.48550/arXiv.1704.04861
[2]	Sandler M, Howard A, Zhu M, et al. MobileNetV2: Inverted residuals and linear bottlenecks[C]//IEEE/CVF Conference on Computer Vision & Pattern Recognition, 2018: 4510-4520.
[3]	Howard A, Sandler M, Chen B, et al. Searching for MobileNetV3[C]//IEEE/CVF International Conference on Computer Vision, 2019: 1314-1324.
[4]	Hu Jie, Shen Li, Sun Gang, et al. Squeeze-and-excitation networks[C]//IEEE/CVF Conference on Computer Vision & Pattern Recognition, 2018: 7132-7141.
[5]	Zhang X, Zhou X, Lin M, et al. ShuffleNet: An extremely efficient convolutional neural network for mobile devices[C]//CVF Conference on Computer Vision & Pattern Recognition, 2018: 6848-6856.
[6]	Ma N, Zhang X, Zheng H T, et al. ShuffleNetV2: Practical guidelines for efficient CNN architecture design[C]//European Conference on Computer Vision, 2018, 11218: 122-138.
[7]	Iandola F N, Han S, Moskewicz M W, et al. SqueezeNet: AlexNet-level accuracy with 50 x fewer parameters and <0.5 MB model size [J]. arXiv preprint, 2016: 1602.07360.
[8]	Han K, Wang Y, Tian Q, et al. GhostNet: More features from cheap operations[C]//CVF Conference on Computer Vision & Pattern Recognition, 2020: 1577-1586.
[9]	Tan M X, Le Q V. EfficientNet: Rethinking model scaling for convolutional neural networks [J]. arXiv preprint, 2019: 1905.11946. doi: 10.48550/arXiv.1905.11946
[10]	Tan M X, Le Q V. EfficientNetV2: Smaller models and faster training [J]. arXiv preprint, 2021: 2104.00298. doi: 10.48550/arXiv.2104.00298
[11]	Ren S, He K, Girshick R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks [J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6): 1137-1149. doi: 10.1109/TPAMI.2016.2577031
[12]	Wang Chen, Zhang Xiufeng, Liu Chao, et al. Detection method of wheel hub weld defects based on the improved YOLOv3 [J]. Optics and Precision Engineering, 2021, 29(8): 1942-1954. (in Chinese) doi: 10.37188/OPE.20212908.1942
[13]	Cheng Yan, Yu Xuelian, Qian Weixian, et al. Ship wake extraction and detection from infrared remote sensing images [J]. Infrared and Laser Engineering, 2022, 51(2): 20210844. (in Chinese) doi: 10.3788/IRLA20210844
[14]	Wang Chunzhe, An Junshe, Jiang Xiujie, et al. Region proposal optimization algorithm based on convolutional neural networks [J]. Chinese Optics, 2019, 12(6): 1348-1361. (in Chinese) doi: 10.3788/CO.20191206.1348
[15]	Szegedy C, Ioffe S, Vanhoucke V, et al. Inception-v4, inception-ResNet and the impact of residual connections on learning[C]//AAAI Conference on Artificial Intelligence, 2017: 4278-4284.
[16]	Zhang Ruiyan, Jiang Xiujie, An Junshe, et al. Design of global-contextual detection model for optical remote sensing targets [J]. Chinese Optics, 2020, 13(6): 1302-1313. (in Chinese) doi: 10.37188/CO.2020-0057
[17]	Li Weipeng, Yang Xiaogang, Li Chuanxiang, et al. Infrared object detection network compression using Lp normalized weight [J]. Infrared and Laser Engineering, 2021, 50(8): 20200510. (in Chinese) doi: 10.3788/IRLA20200510
[18]	Yang Lingxiao, Zhang Ru-Yuan, Li Lida, et al. SimAM: A simple, parameter-free attention module for convolutional neural networks[C]//International Conference on Machine Learning, 2021, 139: 11863-11874.
[19]	Ju Moran, Luo Haibo, Liu Guangqi, et al. Infrared dim and small target detection network based on spatial attention mechanism [J]. Optics and Precision Engineering, 2021, 29(4): 843-853. (in Chinese) doi: 10.37188/OPE.20212904.0843
[20]	Lin T Y, Dollar P, Girshick R, et al. Feature pyramid networks for object detection[C]//IEEE Computer Society Conference on Computer Vision & Pattern Recognition, 2017: 936-944.
[21]	Liu S, Qi L, Qin H, et al. Path aggregation network for instance segmentation[C]//IEEE Conference on Computer Vision & Pattern Recognition, 2018: 8759–8768.
[22]	Tian Z, Shen C, Chen H, et al. FCOS: Fully convolutional one-stage object detection[C]//CVF International Conference on Computer Vision, 2019: 9626-9635.

[1]	张景程, 乔新博, 赵永强. 红外偏振摄像机动目标检测跟踪系统（特邀） . 红外与激光工程, 2022, 51(4): 20220233-1-20220233-10. doi: 10.3788/IRLA20220233
[2]	蒋昕昊, 蔡伟, 杨志勇, 徐佩伟, 姜波. 基于YOLO-IDSTD算法的红外弱小目标检测 . 红外与激光工程, 2022, 51(3): 20210106-1-20210106-10. doi: 10.3788/IRLA20210106
[3]	李博, 张心宇. 复杂场景下基于自适应特征融合的目标跟踪算法 . 红外与激光工程, 2022, 51(10): 20220013-1-20220013-11. doi: 10.3788/IRLA20220013
[4]	韩金辉, 魏艳涛, 彭真明, 赵骞, 陈耀弘, 覃尧, 李楠. 红外弱小目标检测方法综述 . 红外与激光工程, 2022, 51(4): 20210393-1-20210393-24. doi: 10.3788/IRLA20210393
[5]	李延伟, 殷龙海, 李玉龙, 谢新旺, 张景国, 谢虹波. 机载红外成像系统主支撑结构新型轻量化设计方法与应用 . 红外与激光工程, 2022, 51(11): 20220232-1-20220232-9. doi: 10.3788/IRLA20220232
[6]	蔡仁昊, 程宁, 彭志勇, 董施泽, 安建民, 金钢. 基于深度学习的轻量化红外弱小车辆目标检测算法研究 . 红外与激光工程, 2022, 51(12): 20220253-1-20220253-11. doi: 10.3788/IRLA20220253
[7]	陈明, 赵连飞, 苑立民, 徐峰, 韩默. 基于特征选择YOLOv3网络的红外图像绝缘子检测方法 . 红外与激光工程, 2020, 49(S2): 20200401-20200401. doi: 10.3788/IRLA20200401
[8]	徐云飞, 张笃周, 王立, 华宝成. 非合作目标局部特征识别轻量化特征融合网络设计 . 红外与激光工程, 2020, 49(7): 20200170-1-20200170-7. doi: 10.3788/IRLA20200170
[9]	南天章, 耿建君, 陈旭, 陈颖. 基于邻域特征的红外低慢小目标检测 . 红外与激光工程, 2019, 48(S1): 174-180. doi: 10.3788/IRLA201948.S128002
[10]	唐聪, 凌永顺, 郑科栋, 杨星, 郑超, 杨华, 金伟. 基于深度学习的多视窗SSD目标检测方法 . 红外与激光工程, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
[11]	吴天舒, 张志佳, 刘云鹏, 裴文慧, 陈红叶. 基于改进SSD的轻量化小目标检测算法 . 红外与激光工程, 2018, 47(7): 703005-0703005(7). doi: 10.3788/IRLA201847.0703005
[12]	陈卫, 孙晓兵, 乔延利, 陈震庭, 殷玉龙. 海面耀光背景下的目标偏振检测 . 红外与激光工程, 2017, 46(S1): 63-68. doi: 10.3788/IRLA201746.S117001
[13]	许典, 曹佃生, 林冠宇, 于向阳. 双光栅光谱仪光栅转轴的多目标优化 . 红外与激光工程, 2017, 46(3): 320001-0320001(7). doi: 10.3788/IRLA201746.0320001
[14]	孙照蕾, 惠斌, 秦莫凡, 常铮, 罗海波, 夏仁波. 红外图像显著目标检测算法 . 红外与激光工程, 2015, 44(9): 2633-2637.
[15]	袁良, 占春连, 李燕, 卢飞, 李正琪, 李涛. 红外目标光谱辐射亮度测试技术 . 红外与激光工程, 2015, 44(12): 3807-3811.
[16]	刘志刚, 卢云龙, 魏一苇. 有监督的高光谱图像伪装目标检测方法 . 红外与激光工程, 2013, 42(11): 3076-3081.
[17]	黎志华, 李新国. 基于OpenCV的红外弱小运动目标检测与跟踪 . 红外与激光工程, 2013, 42(9): 2561-2565.
[18]	薛松, 韩广良. 基于旋转角预估的红外指定目标快速捕获 . 红外与激光工程, 2013, 42(11): 2907-2912.
[19]	黄曦, 张建奇, 张绍泽, 吴鑫. 目标高真实感红外图像生成方法 . 红外与激光工程, 2013, 42(4): 1084-1088.
[20]	赵春晖, 刘振龙. 改进的红外图像神经网络非均匀性校正算法 . 红外与激光工程, 2013, 42(4): 1079-1083.

点击查看大图

图(10) / 表(1)

计量

文章访问数: 409
HTML全文浏览量: 92
PDF下载量: 62
被引次数: 0

全文HTML

0. 引　言

目标检测作为计算机视觉的一个重要的分支，随着相关理论的深入研究和技术的广泛应用，取得了巨大的进步。而人工智能在实际中的应用，严重依赖高性能服务器的算力支撑。由于内存、计算等硬件的发展难以满足当前不断进步的神经网络模型庞大的存储和运算需求，模型的轻量化成为亟待解决的问题。

由于端侧和边缘设备的硬件资源有限，在模型的参数量、计算量以及推理速度与精度之间取得更加平衡的性能，才能满足实际需求。在神经网络的研究中，设计合理有效的结构来使得各层获取丰富多样的特征是网络性能提升的关键。由于参数量较少，轻量化的网络难以通过获取和复杂结构相比拟的丰富特征。

目前轻量化神经网络的设计取得了一系列成果。MobileNetv1^[1]采用深度可分离卷积替代传统卷积，并使用分辨率超参数控制输入图像分辨率和宽度超参数调节网络宽度，有效减少了模型参数量；MobileNetv2^[2]通过inverted residual block结构，优化MobileNetv1的性能；MobileNetv3^[3]引入轻量级注意力机制SENet^[4]对通道关系重新建模，并利用神经网络结构搜索（Neural Architecture Search，NAS）技术，进一步提高模型性能。ShuffleNetv1^[5]提出了pointwise group convolution来降低计算复杂度，并引入Channel Shuffle，以提高通道不同组内的信息流动；ShuffleNetv2^[6]针对神经网络在硬件上的实际运行情况，提出了网络设计准则并设计了新的轻量级结构，进一步提高了模型在硬件上的推理速度。SqueezeNet^[7]通过1×1和3×3的卷积共同组成Fire模块，有效减少了参数量。GhostNet^[8]在卷积生成特征图的基础上，又通过有效的线性运算来进行特征图扩展，减少了参数量和计算量。EfficientNet^[9]研究了网络深度、宽度和分辨率对性能指标的影响，并通过NAS获得了效果更好的模型；EfficientNetv2^[10]在此基础上引入了Fused-MBConv模块，并通过渐进式学习策略加快了训练速度。上述高效的模型大多通过深度可分离卷积和NAS实现，对计算资源有极高的要求，而且不能完全适用于特定的红外场景。

以Faster R-CNN^[11]和YOLO^[12]系列为代表的anchor-based算法在模型训练之前需要对数据进行聚类分析，确定最优的锚框，而锚框的设置对模型的性能会造成影响，对于不同的任务场景又需要进行重新调整。Anchor-free算法通过消除先验框，有效缓解了预设锚框带来的超参数干扰，简化了训练过程；同时避免了大量负样本带来的样本不均衡，大幅减少了IoU计算，降低了内存占用和时间消耗，适用于完成端侧实时精确目标检测任务。

针对红外图像分辨率较低、目标纹理特征不明显^[13]的问题，文中设计了一种轻量级特征提取网络，将非对称卷积和标准卷积相结合，提高对不同尺度目标特征的表达能力，降低了参数和计算量；在特征通道设置不同大小的卷积核，融合不同卷积结构的细节特征；并引入注意力机制和Channel Shuffle增强通道维度的特征获取和信息流动。为缓解红外图像在下采样过程中的细节丢失，采用改进的Fcous结构，同时提高了推理速度。通过SkipBranch结构直接将浅层定位信息和高层语义信息相融合，丰富高层的特征，加强轻量级结构的特征描述。实验结果表明，文中的轻量化模型具有较高的检测精度，在模型参数和计算量大幅压缩的条件下，实现了嵌入式平台红外目标实时检测。

4. 结　论

文中提出了一种anchor-free轻量级红外目标检测方法，在模型PMFPSNet中通过并行多特征通道轻量级卷积结构PMFP提高特征提取单元对不同尺度目标特征的获取能力，经过通道融合生成丰富的特征，同时有效减少参数和计算量；结合无参数注意力模块SimAM和Channel Shuffle在不增加参数的情况下提高模型性能，采用Slim-Focus结构改善在降采样过程中的红外特征丢失，增加SkipBranch分支促进浅层信息向深层网络的流动，提高模型在学习过程中的效率。在FCOS算法的基础上，利用IoU分支融合定位信息和分类信息，提高网络的精度。实验结果表明，PMFPSNet模型的检测精度更高，且参数量和计算量大幅减少，能够更好地完成嵌入式平台的红外目标实时检测任务。设计的轻量级模型PMFPSNet实现网络结构精简的情况下，mAP为81.7%且高于其他轻量级网络。同时相较于anchor-based模型，参数量和计算量分别下降75.0%和71.1%，具有更快的推理速度。

参考文献 (22)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

Anchor-free轻量级红外目标检测方法（特邀）

doi: 10.3788/IRLA20220193

作者简介:
高凡，男，硕士生，主要从事计算机视觉方面的研究

Anchor-free lightweight infrared object detection method (Invited)

计量

Anchor-free轻量级红外目标检测方法（特邀）

doi: 10.3788/IRLA20220193

1. 北京华航无线电测量研究所，北京 100013

2. 火箭军工程大学导弹工程学院，陕西西安 710025

作者简介:
高凡，男，硕士生，主要从事计算机视觉方面的研究

English Abstract

Anchor-free lightweight infrared object detection method (Invited)

1. Beijing Huahang Radio Measurement Institute, Beijing 100013, China

2. Missile Engineering Institute, Rocket Force University of Engineering, Xi’an 710025, China

全文HTML

1.1. 并行多特征通道轻量级卷积结构

1.2. 注意力机制和Channel Shuffle

1.3. Slim-Focus降采样

1.4. SkipBranch结构

2.1. PMFPSNet结构

2.2. Anchor-free算法实现

3.1. 特征提取网络性能对比

3.2. 下采样结构性能对比

3.3. 轻量级网络性能对比

目录

Model	mAP	Parameters	GFLOPS	Delay/ms
CSPNet	0.787	2.24 M	6.87	7.18
ShuffleNet	0.789	2.12 M	6.26	7.86
Maxpool	0.773	1.57 M	4.98	7.28
YOLOv4-tiny	0.811	6.27 M	17.2	84.6
PMFPSNet	0.817	1.57 M	4.98	7.34

留言板

Anchor-free轻量级红外目标检测方法（特邀）

doi: 10.3788/IRLA20220193

作者简介: 高凡，男，硕士生，主要从事计算机视觉方面的研究

Anchor-free lightweight infrared object detection method (Invited)

计量

出版历程

Anchor-free轻量级红外目标检测方法（特邀）

doi: 10.3788/IRLA20220193

1. 北京华航无线电测量研究所，北京 100013 2. 火箭军工程大学 导弹工程学院，陕西 西安 710025

作者简介: 高凡，男，硕士生，主要从事计算机视觉方面的研究

English Abstract

Anchor-free lightweight infrared object detection method (Invited)

1. Beijing Huahang Radio Measurement Institute, Beijing 100013, China 2. Missile Engineering Institute, Rocket Force University of Engineering, Xi’an 710025, China

全文HTML

1.1. 并行多特征通道轻量级卷积结构

1.2. 注意力机制和Channel Shuffle

1.3. Slim-Focus降采样

1.4. SkipBranch结构

2.1. PMFPSNet结构

2.2. Anchor-free算法实现

3.1. 特征提取网络性能对比

3.2. 下采样结构性能对比

3.3. 轻量级网络性能对比

目录

作者简介:
高凡，男，硕士生，主要从事计算机视觉方面的研究

1. 北京华航无线电测量研究所，北京 100013

2. 火箭军工程大学导弹工程学院，陕西西安 710025

作者简介:
高凡，男，硕士生，主要从事计算机视觉方面的研究

1. Beijing Huahang Radio Measurement Institute, Beijing 100013, China

2. Missile Engineering Institute, Rocket Force University of Engineering, Xi’an 710025, China