Volume 50 Issue 3
Mar.  2021
Turn off MathJax
Article Contents

Shi Guojun. Target recognition method of infrared imagery via joint representation of deep features[J]. Infrared and Laser Engineering, 2021, 50(3): 20200399. doi: 10.3788/IRLA20200399
Citation: Shi Guojun. Target recognition method of infrared imagery via joint representation of deep features[J]. Infrared and Laser Engineering, 2021, 50(3): 20200399. doi: 10.3788/IRLA20200399

Target recognition method of infrared imagery via joint representation of deep features

doi: 10.3788/IRLA20200399
  • Received Date: 2020-10-19
  • Rev Recd Date: 2021-01-20
  • Available Online: 2021-05-12
  • Publish Date: 2021-03-15
  • For the target recognition of infrared imagery, a method was proposed via the combination of convolutional neural network (CNN) and joint sparse representation (JSR). CNN learned the deep features of the infrared target imagery, which described the multi-layer properties of the target. Different layers of deep features described the target charateristics from differnt aspects, so they can well complement each other. The joint use of multi-layer deep features could provide more valid information for target recognition. During the classification, JSR was employed to represent the multi-level deep feature vectors and the inner correlations among different features was used to improve the overall representation precision. Therefore, JSR not only made use of individual deep features but also considered their inner correlations. According to the outs from JSR, the target label of the input sample was determined based on the minimum error. The experiments were conducted based on mid-wave infrared (MWIR) dataset under the conditions of original test samples, noise test samples, and small training set. Simultaneously, the proposed method was compared with four previous methods. According to the experimental results, the proposed method achieves better performance under the three conditions, validating its potential in infrared imagery target recognition.
  • [1] 曹海杰, 刘宁, 许吉, 等. 红外图像自适应逆直方图增强技术[J]. 红外与激光工程, 2020, 49(4): 0426003. doi:  10.3788/IRLA202049.0426003

    Cao Haijie, Liu Ning, Xu Ji, et al. Infrared image adaptive inverse histogram enhancement technology [J]. Infrared and Laser Engineering, 2020, 49(4): 0426003. (in Chinese) doi:  10.3788/IRLA202049.0426003
    [2] 谷雨, 刘俊, 沈宏海, 等. 基于改进多尺度分形特征的红外图像弱小目标检测[J]. 光学 精密工程, 2020, 28(6): 1375-1386. doi:  10.3788/OPE.20202806.1375

    Gu Yu, Liu Jun, Shen Honghai, et al. Infrared dim-small target detection based on an improved multiscale fractal feature [J]. Optics and Precision Engineering, 2020, 28(6): 1375-1386. (in Chinese) doi:  10.3788/OPE.20202806.1375
    [3] 王园园, 赵耀宏, 罗海波, 等. 海面红外图像的动态范围压缩及细节增强[J]. 红外与激光工程, 2019, 48(1): 0126003. doi:  10.3788/IRLA201948.0126003

    Wang Yuanyuan, Zhao Yaohong, Luo Haibo, et al. Dynamic range compression and detail enhancement of sea-surface infrared image [J]. Infrared and Laser Engineering, 2019, 48(1): 0126003. (in Chinese) doi:  10.3788/IRLA201948.0126003
    [4] 王洪庆, 许廷发, 孙兴龙, 等. 目标运动轨迹匹配式的红外-可见光视频自动配准[J]. 光学 精密工程, 2018, 26(6): 1533-1541. doi:  10.3788/OPE.20182606.1533

    Wang Hongqing, Xu Tingfa, Sun Xinglong, et al. Infrared-visible video registration with matching motion trajectories of targets [J]. Optics and Precision Engineering, 2018, 26(6): 1533-1541. (in Chinese) doi:  10.3788/OPE.20182606.1533
    [5] 乔铁英, 蔡立华, 李宁, 等. 基于红外辐射特性系统实现对面目标测量[J]. 中国光学, 2018, 11(5): 804-811. doi:  10.3788/co.20181105.0804

    Qiao Tieying, Cai Lihua, Li Ning, et al. Opposite target measurement based on infrared radiation characteristic system [J]. Chinese Optics, 2018, 11(5): 804-811. (in Chinese) doi:  10.3788/co.20181105.0804
    [6] 吴彩莲, 郝永平, 张乐, 等. 基于多特征融合的红外目标识别算法[J]. 弹箭与制导学报, 2019, 39(3): 39-44.

    Wu Cailian, Hao Yongping, Zhang Le, et al. Infrared target recognition algorithm based on multi-feature fusion [J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2019, 39(3): 39-44. (in Chinese)
    [7] 苏娟, 杨罗, 张阳阳. 基于轮廓片段匹配和图搜索的红外目标识别方法[J]. 兵工学报, 2015, 36(5): 854-860. doi:  10.3969/j.issn.1000-1093.2015.05.013

    Su Juan, Yang Luo, Zhang Yangyang. Infrared target recognition algorithm based on fragment matching and graph searching [J]. Acta Armamentarii, 2015, 36(5): 854-860. (in Chinese) doi:  10.3969/j.issn.1000-1093.2015.05.013
    [8] 谢志华, 刘国栋. 基于多尺度局部二元模式共生直方图的红外人脸识别[J]. 红外与激光工程, 2015, 44(1): 391-397. doi:  10.3969/j.issn.1007-2276.2015.01.065

    Xie Zhihua, Liu Guodong. Infrared face recognition based on co-occurrence histogram of multi-scale local binary patterns [J]. Infrared and Laser Engineering, 2015, 44(1): 391-397. (in Chinese) doi:  10.3969/j.issn.1007-2276.2015.01.065
    [9] 赵爱罡, 王宏力, 杨小冈, 等. 一种仿射不变的前视红外目标识别方法[J]. 激光与光电子学进展, 2015, 52: 071501.

    Zhao Aigang, Wang Hongli, Yang Xiaogang, et al. An affine invariant method of forward looking infra-red target recognition [J]. Laser & Optoelectronics Progress, 2015, 52: 071501. (in Chinese)
    [10] 张迪飞, 张金锁, 姚克明, 等. 基于SVM分类的红外舰船目标识别[J]. 红外与激光工程, 2016, 45(1): 0104004. doi:  10.3788/irla201645.0104004

    Zhang Difei, Zhang Jimsuo, Yao Keming, et al. Infrared ship-target recognition based on SVM classification [J]. Infrared and Laser Engineering, 2016, 45(1): 0104004. (in Chinese) doi:  10.3788/irla201645.0104004
    [11] 杨春伟, 王仕成, 廖守忆, 等. 基于核稀疏编码的红外目标识别方法[J]. 红外技术, 2016, 38(3): 230-235. doi:  10.11846/j.issn.1001_8891.201603010

    Yang Chunwei, Wang Shicheng, Liao Shouyi, et al. An infrared target recognition method based on kernel sparse coding [J]. Infrared Technology, 2016, 38(3): 230-235. (in Chinese) doi:  10.11846/j.issn.1001_8891.201603010
    [12] 黄乐弘, 曹立华, 李宁, 等. 深度学习的空间红外弱小目标状态感知方法[J]. 中国光学, 2020, 13(3): 527-536.

    Huang Lehong, Cao Lihua, Li Ning, et al. A state perception method for infrared dim and small targets with deep learning [J]. Chinese Optics, 2020, 13(3): 527-536. (in Chinese)
    [13] D’acremont A, Fablet R, Baussard A, et al. CNN-based target recognition and identification for infrared imaging in defense systems [J]. Sensors, 2019, 19: 2040. doi:  10.3390/s19092040
    [14] Chen S Z, Wang H P, Xu F, et al. Target classification using the deep convolutional networks for SAR images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(8): 4806-4817. doi:  10.1109/TGRS.2016.2551720
    [15] Zhu X X, Tuia D, Mu L, et al. Deep learning in remote sensing: A comprehensive review and list of resources [J]. IEEE Geoscience and Remote Sensing Magazine, 2017, 5(4): 8-36. doi:  10.1109/MGRS.2017.2762307
    [16] Zhang H C, Nasrabadi M N, Zhang Y N, et al. Multi-view automatic target recognition using joint sparse representation [J]. IEEE Transactions on Aerospace and Electronic System, 2012, 48(3): 2481-2497. doi:  10.1109/TAES.2012.6237604
    [17] Ding B Y, Wen G J. Exploiting multi-view SAR images for robust target recognition [J]. Remote Sensing, 2017, 9(11): 1150. doi:  10.3390/rs9111150
  • 加载中
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(6)  / Tables(1)

Article Metrics

Article views(585) PDF downloads(100) Cited by()

Related
Proportional views

Target recognition method of infrared imagery via joint representation of deep features

doi: 10.3788/IRLA20200399
  • College of Information and Electrical Engineering, Heilongjiang Bayi Agricultural University, Daqing 163319, China

Abstract: For the target recognition of infrared imagery, a method was proposed via the combination of convolutional neural network (CNN) and joint sparse representation (JSR). CNN learned the deep features of the infrared target imagery, which described the multi-layer properties of the target. Different layers of deep features described the target charateristics from differnt aspects, so they can well complement each other. The joint use of multi-layer deep features could provide more valid information for target recognition. During the classification, JSR was employed to represent the multi-level deep feature vectors and the inner correlations among different features was used to improve the overall representation precision. Therefore, JSR not only made use of individual deep features but also considered their inner correlations. According to the outs from JSR, the target label of the input sample was determined based on the minimum error. The experiments were conducted based on mid-wave infrared (MWIR) dataset under the conditions of original test samples, noise test samples, and small training set. Simultaneously, the proposed method was compared with four previous methods. According to the experimental results, the proposed method achieves better performance under the three conditions, validating its potential in infrared imagery target recognition.

    • 红外成像具备夜间侦察能力,是对可见光侦察的有力补充。随着红外图像处理技术的发展,其在目标跟踪、识别等方面已经取得广泛运用[1-5]。在军事领域,基于红外图像的目标识别对于情报侦察具有重要意义。与传统基于图像的目标识别类似,红外图像目标识别主要涉及目标检测和分类两个阶段。检测阶段实现对大幅图像中的感兴趣区域定位,获取潜在目标图像切片。分类阶段则根据有效先验知识对为未知输入进行目标类别的决策。现有的红外图像目标识别方法主要通过特征提取和分类器设计两个阶段进行设计验证。其中,典型的特征包括目标轮廓、局部纹理、图像变换特征等[6-9]。分类中,最为广泛的包括支持向量机(Support Vector Machine, SVM)[10]、稀疏表示分类(Sparse Representation Classification, SRC)[11]等。近年来,深度学习技术发展迅猛,已成为图像解译领域的主流工具[12-15]。在红外图像目标识别领域,以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习模型也得到运用和验证[12-13]。相比传统的“特征提取+分类器”的方法,基于深度学习模型的算法实现了两者的紧耦合,通过端到端训练的形式学习红外目标图像的多层次特征进而获得最佳的决策机制。

      文中提出了深度特征联合表征的红外图像目标识别方法。设计CNN学习红外目标图像的多层次深度特征。CNN不同卷积层通过多个卷积核获得红外目标的不同特性。各个层次深度特征具有独立性也具有内在关联性。为此,在分类决策阶段,采用联合稀疏表示(Joint Sparse Representation, JSR)[16-17]对多层次深度特征进行表示。JSR可在独立表示各类深度特征的同时,利用它们之间的关联性提升表示精度。最终,根据不同训练类别对测试样本的重构误差进行决策。实验中,基于中波红外(MWIR)目标图像数据集开展实验,分别对原始测试样本、噪声测试样本进行分类。此外,还在少量训练样本的条件下进行验证。与现有基于CNN的红外图像目标识别方法相比,文中对于深度特征的运用更为充分,可为目标分类提供更充分的类别信息。此外,JSR模型的引入对于多层次深度特征的共同使用提供了良好工具,能发挥特征的有效性获得可靠的决策结果。实验结果表明,所提方法对于红外图像目标识别具有较强的有效性和稳健性,具有一定的使用潜力。

    • 相比传统的神经网络,现代深度学习不断增加网络深度,特征学习能力显著增强。在图像处理领域,以CNN为代表的神经网络结构得到广泛运用和验证。CNN通过不同卷积核学习得到原始输入的多层次特征,实现对图像特性的互补描述。传统的CNN通过端到端的训练学习可直接用于分类问题。然而,这种处理方式对于中间过程中的多层次深度特征运用不够充分。为此,文中考虑将CNN网络中的多层次特征图进行同步运用,为后续分类提供更为有效的输入。

      根据参考文献[12-15]等现有研究成果,文中设计红外图像目标识别的CNN结构如图1所示。该网络包括3个卷积层,共112个不同卷积核。对于训练得到的特征图,文中分别针对每个卷积层进行深度特征构造。具体地,对于每个卷积层的输出特征图,采用降采样进行降维处理,然后串接为特征矢量。对于不同卷积层的特征图,采用相同算法重复便可得到相应的深度特征矢量。不同卷积层获得的深度特征矢量在描述红外图像目标特性上存在互补性。同时,各层次深度特征源于同一幅红外目标图像,因此同时也具有内在相关性。

      Figure 1.  CNN architecture for infrared imagery target recognition

    • JSR作为传统单任务稀疏表示算法的扩展,主要解决多个稀疏表示任务的同时求解问题。同时,JSR模型可引入内在约束,考察不同稀疏表示任务的关系从而提升整体精度。相比单个稀疏表示问题的独立求解,现有成果证明JSR模型具有更高的求解精度和运行效率[16-17]。文中利用JSR对红外目标图像提取的多层次深度特征进行表征和分类。假设$y$为待识别的测试样本,按照图1所示的深度网络获得$K$个不同层次的深度特征矢量,记为:$\left[ {{y^{(1)}}\;{y^{(2)}}\; \cdots \;{y^{(K)}}} \right]$。JSR的核心问题是获得$K$个稀疏表示问题的最小重构误差,求解相应的系数矢量:

      式中:${A^{(k)}}$为对应第k个层次深度特征的全局字典;${\alpha ^{(k)}}$为对应的稀疏系数矢量;$\beta = \left[ {{\alpha ^{(1)}}\;{\alpha ^{(2)}}\; \cdots \;{\alpha ^{(K)}}} \right]$为系数矩阵。

      在公式(1)中,各个深度特征的稀疏系数求解之间并无关联,其最终结果等效于不同任务的独立求解。事实上,同一测试样本衍生得到的多层次深度特征之间是存在关联的。为此,JSR模型通过引入关联性约束更新优化目标函数如下:

      式中:$\lambda $为大于零的正则化系数;$ {\left\| \beta \right\|_{2,1}} $${\ell _{\rm{1}}}/{\ell _2}$)范数约束不同深度特征对应的系数分布规律,即为它们的内在关联性。

      根据公式(2)的求解结果,可按照类别分别计算所有层次深度特征对于测试样本的重构误差。根据最小误差的原则可对输入红外图像的目标类别进行决策。

      式中:$A_i^{(k)}$为第i类训练样本中对应第k层次深度特征的字典;$\alpha _i^{(k)}$为对应$A_i^{(k)}$的系数矢量。

    • 文中将CNN和JSR模型联合运用于红外图像目标识别,构建如图2所示的流程图。CNN主要用于特征提取阶段,采用大量训练样本获得图1所示网络的最优参数。训练后的网络可分别对每一个用于训练的红外图像进行处理,按照第2章的流程构建不同层次的深度特征矢量,进而构建图2中所示的深度特征字典(含K个不同层次的深度特征)。对于待识别的测试样本,通过相同的网络获得其相应的K个深度特征矢量,并通过JSR进行联合表征。根据求解结果,按照公式(3)分别计算各个类别的重构误差,据此作出目标类别的判决结果。

      Figure 2.  Illustration of infrared imagery target recognition via joint representation of deep features

    • 采用中波红外目标数据集(MWIR)开展实验,覆盖波长范围3~5 μm,其中包含的10类目标类别及图像示意图如图3所示。该数据集采用目标圆周运动方式进行全方位采集,从而有效覆盖不同方位条件下的红外图像数据。实验中,对于任一类目标,通过图像平移、裁剪(包含目标区域)的方式获得120幅图像用作训练,100幅图像用于测试(测试样本与训练样本不同)。

      Figure 3.  Labels and illustrations of the 10 targets in MWIR dataset

      从公开文献中的红外目标识别算法中选取4类进行对比实验,包含采用SVM、SRC、JSR和CNN的方法。其中,SVM[10]和SRC[11]方法对红外目标图像提取的PCA特征矢量进行分类;JSR方法采用与文中一致的联合表征模型[16],但其特征均为投影变换类;CNN方法采用与文中相同的网络结构,但直接以原始图像为输入进行训练和决策,不涉及深度特征的进一步处理。

      后续实验首先基于原始MWIR图像样本开展,然后对测试样本进行不同程度的噪声添加,检验所提方法的噪声稳健性,最后,对训练集进行不同程度的削减,考核方法在少量训练样本条件下的识别能力。

    • 首先对3.1节设置的原始测试样本进行测试。此时,测试样本和训练集采集自相近的场景,相似度较高,目标识别难度相对较低。图4显示了所提方法对图3所示10类目标原始测试样本的混淆矩阵,对角线对应不同目标的正确识别率。定义平均识别率为${P_{{\rm{av}}}}{\rm{ = }}{N_{\rm{c}}}/{N_{\rm{T}}}$,式中${N_{\rm{c}}}$为所有类别正确识别的测试样本总数;${N_{\rm{T}}}$为所有测试样本的总数,据此计算得到所提方法的平均识别率为97.7%。表1对比了所提方法与4类对比方法的识别结果。对比可见,所提方法取得了最高的平均识别率,表明其对于MWIR数据集中原始测试样本的识别有效性。与JSR方法相比,文中通过运用鉴别力更强的深度特征有效提升了最终性能。与CNN方法相比,文中通过对其学习的多层次深度特征的联合运用,进一步提升了识别性能。上述结果验证了所提方法的有效性及其优势性能。

      Figure 4.  Confusion matrix of the proposed method for original test samples

      MethodAverage recognition rate
      Proposed97.7%
      SVM94.5%
      SRC95.1%
      JSR96.6%
      CNN97.2%

      Table 1.  Comparison of recognition results on the original test samples with different methods

    • 在原始测试样本的条件下,测试样本与训练集获取条件相近,具有相当的信噪比(SNR)。实际过程中,测试样本可能采集自不同的场景,受到不同程度的噪声干扰。为此,文中基于原始测试样本构造不同信噪比下的噪声样本。具体地,根据测试样本的能量,按照预设的信噪比要求构造加性高斯白噪声,并将其加入当前测试样本。通过调整信噪比要求,即可获得不同噪声水平(含信噪比10 dB、5 dB、0 dB、−5 dB和−10 dB)下的测试集。采用所提方法和对比方法对噪声样本进行测试,获得如图5所示的统计结果。可见,随着测试样本信噪比的降低,各类方法均出现性能下降。对比来看,所提方法在各个信噪比均取得了最高的平均识别率。特别是,CNN方法在低噪声水平下性能下降十分剧烈,文中方法引入JSR作为末端分类器提升了整体噪声稳健性。上述结果验证了所提方法对于噪声干扰的有效性。

      Figure 5.  Comparison of recognition results on the noisy test samples with different methods

    • 训练样本的规模和数量是分类器识别性能的重要影响因素。实际过程中,考虑到非合作目标红外图像获取的难度,训练样本往往十分稀缺。为此,识别算法在小规模训练集条件下的适应性十分关键。为此,文中对原始训练集进行随机削减,获得80%、60%、40%和20%比例下的训练集。图6显示了不同方法在各个削减训练集下的平均识别率。可以看出,所提方法在各个比例下均可确定最高性能,显示其在少量训练样本条件下的有效性。CNN方法识别性能与训练样本规模紧密相关,这也导致其在低比例训练集条件下识别率下降十分显著。文中通过结合多层次深度特征和联合稀疏表示提高了对于少量训练样本的适应性。

      Figure 6.  Comparison of recognition results under reduced training sets with different methods

    • 文中将CNN与JSR模型结合,用于红外图像目标识别。CNN用于红外目标图像的特征提取,获得了多层次的深度特征矢量;JSR模型对多层次特征矢量进行了表征分析,利用关联性约束提高了表示精度,获得了可靠决策。实验在MWIR数据集上开展,对10类目标进行了识别测试。根据实验结果,文中方法对原始图像样本以及噪声干扰样本均保持最高的平均识别率。随着训练集规模的减小,所提方法的性能依然高于对比方法。实验结果可有效验证所提方法对于红外目标识别的有效性。

Reference (17)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return