-
当前红外图像噪声数据集较少,常用的方法是在干净的红外图像中添加的噪声,通过改变噪声水平来丰富数据集,但现实中的红外图像噪音类型复杂,强度也不尽形同。因此,此次实验使用了艾睿光电公司提供的红外图像降噪数据集,该数据集通过各种红外成像仪器进行数据采集,拍摄了不同时间、不同场景、不同环境下14 bit的红外数据,数据集包含2000对噪声与干净图像对,图像的分辨率为256×192。如图6所示。
Figure 6. Iraytek infrared noise data ((a), (c), (e), (g) are infrared noise images, (b), (d), (f), (h) are infrared clean images)
为了增加训练样本的多样性,同时还选择了艾睿公司的T3热红外模组、FLIR One Pro拍摄了500张干净的红外图片,分别对图像增加了
$ \sigma = 15 $ 的高斯噪声以及均值为0,方差为0.04的均匀分布的随机乘性噪声,添加后的数据集数量到达3000对图像对。 -
目前图像降噪算法的主流定量评估是使用峰值信噪比(peak signal-to-noise ratio, PSRN) , 结构相似性 (structural similarity, SSIM)的值来测试去噪效果,定性评估是使用视觉图形来显示恢复的干净图像[32-33]。
PSRN是一种像素级别的差异,通常用对数分贝单位表示。如公式15所示:
式中:
$ I $ 和$ K $ 分别为估计量和被估计量;$ i $ 和$ j $ 均为像素点;$ {N_{\max }} $ 为图形点颜色的最大值,在实验中设为255。SSIM指标可以分别从亮度、对比度、结构三个方面评估退化图像和参考图像之间的相似性,在公式(14)中有所定义。
-
实验参数设置如下:将数据集按7∶2∶1比例分为训练样本、验证样本及测试样本。单个图像样本的分辨率为256×192,在数据增强上,使用垂直/水平翻转。采用Xavier函数初始化卷积权重,优化器(Optimizer)选择Adam,学习率(Learning Rate)设置为0.0001,批次设置 (Batch-Size)设置为8,迭代次数为700次,整个训练用时约为24小时。网络框架采用Pytorch 1.8,训练平台为Inter Core i7-7700HQ CPU@2.80 GHz,内存为16 GB,显卡为NVIDIA GeForce GTX 1050Ti (4 G)。
-
整个实验分为损失权重选择实验、有效去噪实验和消融实验。
(1) 损失权重选择实验
公式12中,损失权重
$ \beta $ 起到了平衡边缘损失函数和语义损失函数的作用。通过不同权重因子在测试数据中的PSRN和SSIM的指标值,选定合适的权重因子。实验以艾睿数据集中的100张数据作为测试数据,在迭代200,400次时,分别以0.1,0.12,0.14,0.16,0.2,0.25,0.5作为权重因子进行测试。从表1中的数值可以发现,权重因子在0.16和0.14时PSRN指标近乎一致,差距较小。而在SSIM指标上0.14时最高,0.16处的SSIM要略低。因此,文中选择0.14作为损失权重因子。
Loss weight 200 iteration 400 iteration PSRN/dB SSIM PSRN/dB SSIM 0.1 15.29 0.3729 21.69 0.6729 0.12 15.34 0.3841 21.83 0.6841 0.14 15.39 0.4005 22.24 0.7013 0.16 15.41 0.3991 22.29 0.7004 0.2 15.48 0.3739 22.01 0.6954 0.25 15.36 0.3714 22.11 0.6932 0.5 15.17 0.3692 21.78 0.6689 Table 1. Comparison table of loss weight
(2) 有效去噪实验
为了验证网络有效性,选择BM3D算法[11]、CBDNet[34]、MIRNet[35]、RIDNet[36]及DPIR[37]进行对比,训练集采用数据集中的2100对作为训练集,600对作为验证集,测试数据采用两种不同的数据,艾睿数据集中的300张; OTCBVS数据集中的100张图片。评价指标采用峰值信噪比(PSRN)和结构相似性(SSIM)。实验结果如图7、8所示,评价指标如表2所示。
Figure 7. Experimental results of the Iraytek dataset, the green area in the lower right corner is the magnification of the red area
Figure 8. Experimental results of OTCBVS dataset, the green area in the lower right corner is the magnification of the red area
Algorithm Year Iraytek dataset(300) OTCBVS(100) PSRN/dB SSIM PSRN/dB SSIM BM3D 2007 27.43 0.7814 _ _ CBDNet 2019 29.86 0.8517 27.87 0.7765 RIDNet 2019 30.67 0.8993 32.73 0.7821 DPIR 2020 30.78 0.9009 32.86 0.7839 MIRNet 2020 31.52 0.9032 32.77 0.7842 Ours 30.71 0.9057 32.71 0.7827 Table 2. Comparison table of effective denoising experimental data
艾睿数据集对比分析:从表2中的指标可以看出,MIRNet的峰值信噪比(PSRN)最高,RIDNet、DPIR和文中提出的算法的PSRN基本一致,略低于MIRNet算法,CBDNet和BM3D算法表现的指标数较差;结构相似性(SSIM)指标上,所提算法最高,DPIR和MIRNet算法的指标值略低于文中算法,而BM3D、CBDNet及RIDNet算法的指标值差距较大。通过图7观察,CBDNet、RIDNet、MIRNet图中存在着少量噪点,细节保持较好,而BM3D明显过度平滑,边缘细节丢失严重,文中提取的算法很好的平衡了噪点平滑和细节保留,视觉效果上更加贴近Groundtruth图像。
OTCBVS数据集对比分析:OTCBVS数据集目前主要应用与目标检测中,图像噪点较多,视觉效果较差,同时OTCBVS没有Groundtruth图像,在实验中以BM3D算法的结果作为Groundtruth图像。从指标中可以看出,RIDNet、DPIR、MIRNet及文中算法在PSRN和SSIM指标上基本相近,差异较小。CBDNet算法表现较差;视觉感受上,从图8可以发现,CBDNet算法中的存在明显的噪点,RIDNet,DPIR、MIRNet及文中算法在去噪效果和细节保持均有不错的表现,但前三者在整体对比度有所增强。
(3) 消融实验
文中提出的模型以UNet结构为主体结构,编解码过程中分别引入MAR和GFC两个模块,通过消融实验,验证新增加的两个模块可以有效的提升PSRN和SSIM指标。
从表3中的结果可以看出,采用模型1的方案在实验中结果较差,PSRN指标仅为27.96 dB,SSIM指标为0.8253;对比模型1和模型5可以清晰的发现,使用MAR和GFC模块后,PSRN和SSIM指标有了大幅提升。这也验证了两个模块在红外图像的去噪中起到了积极的作用。
Model structure Iraytek testset PSRN/dB SSIM Model 1.(UNet + conv + concat) 27.96 0.8253 Model 2.(UNet + conv + GFC) 28.14 0.8432 Model 3.(UNet+bottleneck+concat) 28.86 0.8628 Model 4.(UNet+ bottleneck + GFC) 29.69 0.8861 Model 5.(UNet +MAR + GFC) 30.71 0.9057 Table 3. Comparison table of ablation experiment indexes under Iraytek testset
通过上述的两个实验证明,文中提出的GFDNet网络不仅可以实现降噪功能,而且可以最大程度的保留红外图像中边缘细节,同时可以有效提升视觉效果。
Multi-drop attention residual infrared image denoising network based on guided filtering
doi: 10.3788/IRLA20220060
- Received Date: 2022-01-18
- Rev Recd Date: 2022-04-01
- Publish Date: 2022-11-30
-
Key words:
- guided filter /
- visual attention /
- U-NET
Abstract: At present, infrared images are widely used in various fields, but limited by the non-uniformity of detector unit, the infrared image has the disadvantages of low signal-to-noise ratio and blurred visual effects, which seriously affect its application in advanced fields. Commonly used denoising algorithms cannot take into account the smoothing of denoising and the preservation of edge details. In response to the above problems, this paper proposes a multi-drop attention residual denoising network based on guided filtering. A guided convolution module is designed according to the principle of guided filtering and a multi-drop attention residual module is designed for both the extraction of shallow and deep features. Experiments have proved that the network after adding the new module can effectively reduce the noise of infrared images, and can maintain the edge detail information in the image to the greatest extent, improve the visual effect, and also have good performance on the PSRN and SSIM indicators.