-
各种神经网络架构已被开发用于不同类型的任务。在图像处理相关任务领域,如图像分类、分割、超分辨率和人脸识别,CNN因其优越性和较少的可训练参数而被人们所熟知。与一般的图像处理类似,采用编码器-解码器结构的CNN算法作为大气校正问题的主要框架。
文中的网络模型如图2所示,CNN的架构分为三个主要模块,包括卷积编码器、Embedding层和卷积解码器。网络由3层编码器和4层解码器组成,其中每个编码器由一个卷积层(Conv)、一个归一化层(Batchnorm)以及一个带泄露修正线性单元函数(LeakyReLU)作为激活层构成,每个解码器由转置卷积层(Convtrans)、归一化层、改进激活层以及激活层(ReLU)构成。网络的参数设置如表1所示,包括编码器、解码器及Embedding层的卷积核、步幅和填充。输入为探测器输出电压和测试距离,其中编码器所需的电压值是在实验室环境下探测器接收到标准黑体辐射源的测试数据。图2中,输入的特征向量为探测器输出电压
$ V $ ,$ (c,T,\lambda ) $ 为描述$ V $ 的特征参数,其中,$ c $ 是限定维度的常量,这里取1,$ T $ 和$ \lambda $ 分别代表红外辐射的温度和波段。测试距离$ d $ 是直接输入隐藏层中的全连接层中。Operation layer Number of filters Size of each filter Stride Padding Output size 1×9×3 Encoder Conv_1 64 4×3 2×2 1 1×2×64 Conv_2 128 5×3 2×2 1 1×1×128 Conv_3 64 18×1 1×1 1 1×1×64 Embedding layers Embedding_distance - - - - 64 Embedding_1 - - - - 64 Embedding_2 - - - - 64 Decoder Convtrans_1 256 18×1 1×1 1 2×2×128 Convtrans _2 128 5×4 2×2 1 4×4×64 Convtrans _3 64 5×3 2×2 1 8×8×2 Convtrans_4 2 4×3 2×2 1 2×3×9 Table 1. Network parameter settings
为了提高模型的训练效率,减少输入的空间维度,同时降低对样本训练集大小和计算资源的需求,对编码器进行改进,不采用传统卷积法中的最大值池化,而是采用步进卷积,将输入压缩成一个潜在空间的向量。
在保证模型精度的前提下,降低模型复杂度,利用编码器将输入的电压值降维成一个一维向量。然而,为了纳入红外辐射计和被测目标的位置关系,增加了一个独立的Embedding层,在其中处理测试距离。编码器和独立的Embedding层输出一个向量,将这个向量作为潜在空间处理的输入。潜在空间包含两个Embedding层,每层包含64个神经元,在每一个Embedding层之后都要进行LeakyReLU运算。
理论上,潜在空间需要将混合代表向量计算为需要的大气透过率和大气程辐射,所以需要解码器将大气透过率和大气程辐射扩展为可读维度作为输入,所以采用转置卷积层进行上采样,对向量升高维度,四个转置卷积层的参数见表1,在转置卷积层后放置一个批量归一化层和LeakyReLU的组合,防止梯度爆炸。将编码器最后一层的LeakyReLU修改为ReLU,用于消除输出结果中的负参数。
-
在将实验所得到的电压值输入设计的网络中,其架构见图2。测试数据包含三个波段的测试数据,且涉及到的温度点较多,笔者观察到,随着温度升高,探测器输出电压也随之增大,数据分布跨度大,量纲不统一,直接放入网络中进行拟合的话,模型精度会有所降低。对于这种情况有两种处理方式:一是增加卷积层数量,数量越多准确率越高,但这种方法无疑会增加计算负担,使其更难训练;另一种是对数据进行预处理,降低输入特征之间的差异,消除量纲对模型的影响,减少运算量提高性能。为此,对实验数据进行归一化处理。
采用min-max归一化方法,对原始数据线性变换,将数据缩放到[0,1]范围内,则归一化后的样本数据可以表示为:
式中:
$ x $ 为样本数据;$ {x_{\max }} $ 、$ {x_{\min }} $ 分别为样本数据中的最大值和最小值。 -
建立编码器-解码器结构的CNN算法模型,实验过程中三个波段下的测试数据经归一化后分批输入编码器进行学习训练,批尺寸大小设为8,测试距离在Embedding层直接输入,当前距离下的大气透过率和对应的大气程辐射作为解码器输出,利用卷积神经网络进行学习训练,得到测试距离和大气透过率、大气程辐射的模型,给出两者的对应关系。
文中提出的基于编码器-解码器结构的CNN算法的大气修正训练过程如图3所示。在训练阶段利用Adam优化器进行网络性能优化,学习率设为0.001。
-
为了验证分析结果和提出的校准算法,用实验室搭建的红外辐射计和标准黑体辐射源进行了辐射测量校准实验。该设备的红外探测器工作在1~16 μm的波段,光敏面尺寸为1 mm×1 mm,通过计算机控制红外辐射计内的滤光片轮转动,可实现对1~3、3~5、8~14 μm三个波段的红外辐射测量。 采用的标准黑体辐射源的温度范围为50~1 000 ℃,温度分辨力为0.01 ℃,有效辐射面大小为Φ50 mm,工作波长范围为1.4~14 μm,在此范围内具有较高的有效发射率,不小于0.995。
-
在一定积分时间内,红外辐射计内探测器输出的电压值与辐照度之间呈线性关系。为了得到系统响应度和偏置电压值,采用平行光管定标法对红外辐射计进行辐射定标,流程如图4所示,实验装置如图5所示。标准黑体辐射源采用高温腔型黑体,平行光管可以对黑体发出的辐射进行均匀扩束,从而得到平行辐射。调节标准黑体辐射源的温度并得到探测器输出电压,便可以计算出红外辐射计的定标响应参数。
设置标准黑体辐射源的温度范围为100~900 ℃,根据普朗克公式可以计算出对应的黑体辐射照度,对1~3、3~5、8~14 μm三个波段下测量的实验结果进行拟合,结果如图6所示。拟合方程可写作:
由公式(20)可知,红外辐射计的系统响应为1.206×104,偏置电压为2.582×10−3 V。
-
为了验证模型性能,在测试距离范围0.5~3 m,间隔0.5 m,采用基于恒定标准源的宽动态红外辐射测量方法进行多组实验,得到多组探测器输出电压值,使用图2中所构建的结构对网络进行训练。训练后各距离的大气透过率和大气程辐射的网络输出值如图7所示。
图7中,随着测试距离增加,大气透过率减小且大气程辐射增加,距离越远,大气传输对红外辐射的影响越明显;黑体温度几乎不会对大气透过率和大气程辐射产生影响; 在不同波长下的大气传输也不同,可能导致这种现象的原因是在空气中气体成分对某些特定波段影响较大,例如水蒸气分子和气溶胶三个波段都有较为明显的影响,二氧化碳及其他微量气体成分(N2O和CH4)对3~5 μm波段影响较大,而臭氧对长波8~14 μm波段影响较大。
-
在常规的辐射测量方法中,大气透过率和大气程辐射是用Modtran4.0计算的,而线性修正和非线性修正方法也必须要使用Modtran进行模拟计算,这就使得测量精度很大程度上取决于输入的大气参数的完整度和准确度。实验过程中,地面平均温度约为20 ℃,压力约为1 021 kPa,相对湿度约77%,海拔11 m,能见度23 km。对MODTRAN软件输入相关大气参数,计算水平距离为1~3 m,间隔为1 m。
采用基于恒定标准源的宽动态红外辐射测量方法,将标准黑体辐射源放置于距离红外辐射计2 m处,将温度设置为200 ℃和700 ℃,此时在三个波段下Modtran4.0、线性修正方法、非线性修正方法及编码器-解码器结构的CNN算法得到的大气透过率和大气程辐射如图8所示。
为了验证红外辐射测量精度的提高,进行辐射反演,设置黑体温度为500 ℃,此时的辐照度理论值和利用Modtran4.0、线性修正方法、非线性修正方法及编码器-解码器结构的CNN算法得到的大气透过率和大气程辐射进行辐射反演的结果如图9所示,对应的红外辐射测量误差如图10所示,具体数值如表2所示。
Figure 8. Calculation results of atmospheric transmittance and atmospheric path radiation with different methods
从误差曲线可以看出,编码器-解码器结构的CNN算法的误差明显小于其他方法,且误差相对稳定,考虑到误差大小可能主要是由算法引起的。当测试距离较小时,Modtran4.0的误差较大,且Modtran4.0的对于距离的分辨率为1 m,不适合实验室环境下的近距离测量。线性修正方法计算结果趋势相同,这种方法认为实验环境为大气分布均匀,仅进行了线性校正;而非线性修正方法需要利用Modtran4.0模拟数据和实测值进行拟合,在近距离测量时无法获得大量Modtran4.0数据,样本量小,导致拟合精度较差。
Measurement error Measurement method 1-3 μm 3-5 μm 8-14 μm Mean relative error Modtran4.0 4.4408% 7.7930% 9.2662% Encoder-decoder CNN 3.0783% 3.8186% 5.3452% Linear correction method 3.9120% 5.9204% 8.2427% Nonlinear correction method 3.7673% 5.3866% 7.8982% Maximum relative error Modtran4.0 4.6787% 7.9853% 9.4576% Encoder-decoder CNN 3.1332% 4.1722% 5.4866% Linear correction method 4.0767% 6.0062% 8.4335% Nonlinear correction method 3.7945% 5.6752% 8.1451% Table 2. Measurement error
Research on atmospheric transmission calibration method of infrared target simulator
doi: 10.3788/IRLA20220378
- Received Date: 2022-08-10
- Rev Recd Date: 2022-09-20
- Publish Date: 2023-03-25
-
Key words:
- atmospheric correction /
- infrared radiation transfer /
- convolutional neural network /
- encoder-decoder
Abstract: