多输入融合对抗网络的水下图像增强

林森; 刘世本; 唐延东

doi:10.3788/IRLA20200015

多输入融合对抗网络的水下图像增强

doi: 10.3788/IRLA20200015

林森^1,2,3,,
刘世本¹,
唐延东^2,3

1.
辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105
2.
中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016
3.
中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

基金项目: 国家自然科学基金（61473280，91648118）；辽宁省自然科学基金面上项目（2015020100）；辽宁省教育厅科研项目（LJ2019JL022）

详细信息

作者简介:
林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

中图分类号: TP391

Multi-input fusion adversarial network for underwater image enhancement

Lin Sen^{1,2,3
,},
Liu Shiben¹,
Tang Yandong^2,3

1.
Electronic and Information Engineering School, Liaoning Technical University, Huludao 125105, China
2.
State Key Laboratory of Robotics, Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang 110016, China
3.
Institutes for Robotics and Intelligent Manufacturing, Chinese Academy of Sciences, Shenyang 110016, China

摘要: 针对水下图像出现对比度低、颜色偏差和细节模糊等问题，提出了多输入融合对抗网络进行水下图像增强。该方法主要特点是生成网络采用编码解码结构，通过卷积层滤除噪声，利用反卷积层恢复丢失的细节并逐像素进行细化图像。首先，对原始图像进行预处理，得到颜色校正和对比度增强两种类型图像。其次，利用生成网络学习两种增强图像与原始图像之间差异的置信度图。然后，为减少在生成网络学习过程中两种增强算法引入的伪影和细节模糊，添加了纹理提取单元对两种增强图像进行纹理特征提取，并将提取的纹理特征与对应的置信度图进行融合。最后，通过构建多个损失函数，反复训练对抗网络，得到增强的水下图像。实验结果表明，增强的水下图像色彩鲜明并且对比度提升，评价指标UCIQE均值为0.639 9，NIQE均值为3.727 3。相比于其他算法有显著优势，证明了该算法的良好效果。
- 深度学习 /
- 生成对抗网络 /
- 多输入融合 /
- 编码解码框架 /
- 水下图像增强
Abstract: For underwater image of low contrast, color deviation and blurred details and other issues, the multi-input fusion adversarial networks was proposed to enhance underwater images. The main feature of this method was that the generative network used encoding and decoding structure, filtering noise through convolution layer, recovering lost details through deconvolution layer and refining the image pixel by pixel. Firstly, the original image was preprocessed to obtain two types of images: color correction and contrast enhancement. Secondly, the confidence graph of the difference between the two enhanced images and the original image was learned by using the generated network. Then, in order to reduce artifacts and details blur introduced by the two enhancement algorithms in the process of generating network learning, the texture extraction unit was added to extract texture features from the two enhanced images, and the extracted texture features were fused with the corresponding confidence map. Finally, the enhanced underwater image was obtained by constructing multiple loss functions and training the adversarial network repeatedly. The experimental results show that the enhanced underwater image has bright color and improved contrast, the average value of UCIQE and NIQE is 0.639 9 and 3.727 3 respectively. Compared with other algorithms, the algorithm has significant advantages and proves its good effect.
- deep learning /
- generative adversarial network /
- multi-input fusion /
- encoding and decoding structure /
- underwater image enhancement

图 1 预处理图

Figure 1. Preprocessing graph

下载: 全尺寸图片幻灯片

图 2 卷积和反卷积

Figure 2. Convolution and deconvolution

下载: 全尺寸图片幻灯片

图 3 网络结构图

Figure 3. Network structure diagram

下载: 全尺寸图片幻灯片

图 4 ReLU对比实验

Figure 4. ReLu comparison experiment

下载: 全尺寸图片幻灯片

图 5 残差连接实验。 (a) 原图；(b) 无残差连接；(c) 残差连接；(d) 残差连接和一层卷积层

Figure 5. Skip connection experiment. (a) Original drawing; (b) No residual connection; (c) Residual connection; (d) Residual connection and one layer of convolution

下载: 全尺寸图片幻灯片

图 6 颜色恢复试验。(a) Original；(b) 标准颜色卡；(c) LAB；(d) DUIENet；(e) DCP；(f) DehazeNet and HWD；(g) MFGAN

Figure 6. Experimental of color restoration. (a) Origianl；(b) Standard color card；(c) LAB；(d) DUIENet；(e) DCP；(f) DehazeNet and HWD；(g) MFGAN

下载: 全尺寸图片幻灯片

图 7 实验结果图。(a) Original；(b) DCP；(c) LAB；(d) CLAHE；(e) DehazeNet and HWD；(f) DUIENet；(g) UGAN；(h) MFGAN

Figure 7. Experimental result . (a) Original；(b) DCP；(c) LAB；(d) CLAHE；(e) DehazeNet and HWD；(f) DUIENet；(g) UGAN；(h) MFGAN

下载: 全尺寸图片幻灯片

图 8 特征匹配实验结果

Figure 8. Experimental results of feature matching

下载: 全尺寸图片幻灯片

表 1 UCIQE评价指标结果

Table 1. Quantitative results in terms of UCIQE

Image	DCP	LAB	CLAHE	DehazeNet and HWD	DUIENet	UGAN	MFGAN
1	0.676 2	0.600 8	0.645 5	0.669 7	0.630 3	0.690 6	0.676 6
2	0.636 3	0.576 9	0.615 8	0.613 8	0.577 2	0.619 6	0.641 0
3	0.595 1	0.466 6	0.461 6	0.546 9	0.441 2	0.561 6	0.637 7
4	0.598 5	0.569 9	0.605 1	0.653 3	0.566 8	0.601 5	0.624 1
5	0.590 3	0.546 8	0.577 7	0.580 7	0.593 8	0.577 7	0.624 4
6	0.638 8	0.568 5	0.592 6	0.639 1	0.568 1	0.592 6	0.640 3
Average	0.622 5	0.554 9	0.583 1	0.617 2	0.562 9	0.607 3	0.639 9

下载: 导出CSV

表 2 NIQE评价指标结果

Table 2. Quantitative results in terms of NIQE

Image	DCP	LAB	CLAHE	DehazeNet and HWD	DUIENet	UGAN	MFGAN
1	3.559 5	3.850 2	3.909 8	4.715 6	4.700 6	4.663 0	3.614 4
2	3.581 4	3.547 5	3.411 6	4.873 4	4.901 1	3.525 3	3.442 2
3	6.457 1	6.047 4	5.804 9	8.510 4	6.034 8	3.327 0	4.548 6
4	3.585 5	3.712 1	3.875 2	3.993 4	4.150 3	4.562 4	3.359 9
5	4.050 1	4.065 9	3.904 6	3.868 5	4.507 8	5.097 9	3.745 3
6	3.226 1	3.400 2	3.497 2	3.580 7	3.061 8	5.546 0	3.455 4
Average	4.076 6	4.058 9	4.067 2	4.923 6	4.559 4	4.453 6	3.727 3

下载: 导出CSV

[1]	Hu Haofeng, Li Xiaobo, Liu Tiegen. The latest development of underwater image restoration technology based on polarization imaging [J]. Infrared and Laser Engineering, 2019, 48(6): 0603006. (in Chinese)
[2]	Chen Qingjiang, Zhang Xue. Application of hybrid residual learning and guided filtering algorithm in image defogging [J]. Optical Precision Engineering, 2019, 27(12): 2702−2712. (in Chinese)
[3]	Cameron Fabbri, Md Jahidul Islam, Junaed Sattar. Enhancing underwater imagery using generative adversarial networks[C]//IEEE International Conference on Robotics and Automation(ICRA), 2018: 7159-7165.
[4]	Guo Yecai, Li Hanyu, Zhuang Peixian. Under-water image enhancement using a multiscale dense generative adversarial network [J]. IEEE Journal of Oceanic Engineering, 2019−2911447.
[5]	Li Chuan, Michael Wand. Precomputed real-time texture synthesis with markovian generative adversarial networks[C]//European Conference on Computer Vision Springer, 2016: 702-716.
[6]	Ye Xinchen, Xu Hongcan, Ji Ming, et al. Underwater image enhancement using stacked generative adversarial networks[C]//Pacific Rim Conference on Multimedia, 2018: 514-524.
[7]	Liang Tianquan, Zhang Xiaoyun, Duan Peng, et al. Target detection of underwater strong scattering medium by improved dark channel method [J]. Infrared and Laser Engineering, 2020, 49(2): 0203012. (in Chinese)
[8]	He Kaiming, Sun Jian, Fellow, et al. Single image haze removal using dark channel prior [J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2011, 33(12): 2341−2353.
[9]	Wang Chunzhe, An Junshe, Jiang Xiujie, et al. Candidate region optimization algorithm based on convolutional neural network [J]. Chinese Optics, 2019, 12(6): 1348−1361. (in Chinese)
[10]	Long Jonathan, Shelhamer Evan, Darrell Trevor. Fully convolutional networks for semantic segmentation[C]// IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2015, 3434-3440.
[11]	Li Chongyi, Guo Chunle Wenqi Ren, et al. An underwater image enhancement benchmark dataset and beyond [J]. IEEE Transactions on Image Processing, 2020, 29: 4376−4389. doi: 10.1109/TIP.2019.2955241
[12]	Pan Panwang, Fei Yuan, Cheng En. Underwater image de-scattering and enhancing using dehazenet and hwd [J]. Journal of Marine Science and Technology, 2018, 26(4): 531−540.
[13]	Miao Yang, Sowmya Arcot. An underwater color image quality evaluation metric [J]. IEEE Transactions on Image Processing, 2015, 24(12): 6062−6071. doi: 10.1109/TIP.2015.2491020
[14]	Mittal Anish, Rajiv Soundararajan, Alan C Bovik, et al. Making a "completely blind" image quality analyzer [J]. IEEE Signal Processing Letters, 2013, 20(3): 209−212. doi: 10.1109/LSP.2012.2227726
[15]	Dai Chenggang, Lin Mingxing, Wang Zhen, et al. Color compensation based on bright channel and fusion for underwater image enhancement [J]. Acta Optica Sinica, 2018, 38:1110003. (in Chinese)

[1]	孙敬波, 季节. 视频监控下利用记忆力增强自编码的行人异常行为检测 . 红外与激光工程, 2022, 51(6): 20210680-1-20210680-7. doi: 10.3788/IRLA20210680
[2]	张津浦, 王岳环. 融合检测技术的孪生网络跟踪算法综述 . 红外与激光工程, 2022, 51(10): 20220042-1-20220042-14. doi: 10.3788/IRLA20220042
[3]	庞忠祥, 刘勰, 刘桂华, 龚泿军, 周晗, 罗洪伟. 并行多特征提取网络的红外图像增强方法 . 红外与激光工程, 2022, 51(8): 20210957-1-20210957-9. doi: 10.3788/IRLA20210957
[4]	钟友坤, 莫海宁. 基于深度自编码-高斯混合模型的视频异常检测方法 . 红外与激光工程, 2022, 51(6): 20210547-1-20210547-7. doi: 10.3788/IRLA20210547
[5]	王嘉业, 李艺璇, 张玉珍. 基于学习的光栅图像噪声抑制方法 . 红外与激光工程, 2022, 51(2): 20220006-1-20220006-10. doi: 10.3788/IRLA20220006
[6]	夏信, 何传亮, 吕英杰, 王守志, 张博, 陈晨, 陈海鹏, 李美萱. 深度学习驱动的智能电网运行图像数据压缩技术 . 红外与激光工程, 2022, 51(12): 20220097-1-20220097-6. doi: 10.3788/IRLA20220097
[7]	王志远, 赖雪恬, 林惠川, 陈福昌, 曾峻, 陈子阳, 蒲继雄. 基于深度学习实现透过浑浊介质图像重构（特邀） . 红外与激光工程, 2022, 51(8): 20220215-1-20220215-10. doi: 10.3788/IRLA20220215
[8]	赵倩, 周冬明, 杨浩, 王长城, 李淼. 结合多尺度特征融合和多输入多输出编-解码器的去模糊算法 . 红外与激光工程, 2022, 51(10): 20220018-1-20220018-13. doi: 10.3788/IRLA20220018
[9]	李霖, 王红梅, 李辰凯. 红外与可见光图像深度学习融合方法综述 . 红外与激光工程, 2022, 51(12): 20220125-1-20220125-20. doi: 10.3788/IRLA20220125
[10]	闵莉, 曹思健, 赵怀慈, 刘鹏飞. 改进生成对抗网络实现红外与可见光图像融合 . 红外与激光工程, 2022, 51(4): 20210291-1-20210291-10. doi: 10.3788/IRLA20210291
[11]	黄攀, 杨小冈, 卢瑞涛, 常振良, 刘闯. 基于空间联合的红外舰船目标数据增强方法 . 红外与激光工程, 2021, 50(12): 20210281-1-20210281-10. doi: 10.3788/IRLA20210281
[12]	刘云朋, 霍晓丽, 刘智超. 基于深度学习的光纤网络异常数据检测算法 . 红外与激光工程, 2021, 50(6): 20210029-1-20210029-6. doi: 10.3788/IRLA20210029
[13]	刘鹏飞, 赵怀慈, 李培玄. 对抗网络实现单幅RGB重建高光谱图像 . 红外与激光工程, 2020, 49(S1): 20200093-20200093. doi: 10.3788/IRLA20200093
[14]	唐聪, 凌永顺, 杨华, 杨星, 路远. 基于深度学习的红外与可见光决策级融合检测 . 红外与激光工程, 2019, 48(6): 626001-0626001(15). doi: 10.3788/IRLA201948.0626001
[15]	梁欣凯, 宋闯, 赵佳佳. 基于深度学习的序列图像深度估计技术 . 红外与激光工程, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002
[16]	郭强, 芦晓红, 谢英红, 孙鹏. 基于深度谱卷积神经网络的高效视觉目标跟踪算法 . 红外与激光工程, 2018, 47(6): 626005-0626005(6). doi: 10.3788/IRLA201847.0626005
[17]	李方彪, 何昕, 魏仲慧, 何家维, 何丁龙. 生成式对抗神经网络的多帧红外图像超分辨率重建 . 红外与激光工程, 2018, 47(2): 203003-0203003(8). doi: 10.3788/IRLA201847.0203003
[18]	姚旺, 刘云鹏, 朱昌波. 基于人眼视觉特性的深度学习全参考图像质量评价方法 . 红外与激光工程, 2018, 47(7): 703004-0703004(8). doi: 10.3788/IRLA201847.0703004
[19]	张秀玲, 侯代标, 张逞逞, 周凯旋, 魏其珺. 深度学习的MPCANet火灾图像识别模型设计 . 红外与激光工程, 2018, 47(2): 203006-0203006(6). doi: 10.3788/IRLA201847.0203006
[20]	刘天赐, 史泽林, 刘云鹏, 张英迪. 基于Grassmann流形几何深度网络的图像集识别方法 . 红外与激光工程, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002

点击查看大图

图(8) / 表(2)

计量

文章访问数: 4477
HTML全文浏览量: 3025
PDF下载量: 124
被引次数: 0

全文HTML

0. 引　言

随着国家大力提倡人工智能产业的发展，水下机器人被广泛使用在深海勘探等方面。由于悬浮的散射颗粒对光场的吸收和散射作用导致水下图像出现对比度低、颜色偏差和细节模糊等问题^[1]，使得水下机器人无法获取高质量的水下清晰图像，因此水下图像增强成为一个非常重要的处理步骤。

近年来，一些研究者尝试利用深度学习技术改善图像质量问题，并在图像去雾^[2]等方面得到广泛应用。Fabbri等^[3]提出水下生成对抗网络(Underwater Generative Adversarial Networks，UGAN)，生成器使用了类似于编解码框架，而判别器通过对输出进行L约束，能较好地提升水下图像质量。针对水下图像存在细节模糊和颜色失真问题，Guo等^[4]介绍了一种多尺度密集块(Multiscale Dense Block，MSDB)算法进行水下图像增强，即密集生成对抗网络(Dense Generative Adversarial Networks，DensGAN)，在MSDB中，输入的特征需通过两个分支，并且特征会在两个分支中间进行串联之后再次反馈到各自支路中，判别器类似于PatchGAN^[5](Patch Generative Adversarial Networks)。Ye等^[6]提出了一种堆叠条件生成对抗网络的水下图像增强(Underwater Image Enhancement Based On Stacked Generative Adversarial Networks，UIE-sGAN)，包括雾度检测子网和色彩校正子网，雾度检测子网的输出是雾度掩膜(Haze mask)，并将雾度掩膜和RGB图像作为颜色校正子网的输入，并输出颜色校正的水下图像。

上述算法是单分支或多分支网络进行水下图像增强，能有效地进行水下图像颜色校正，但是都是单输入图像，不能同时对多个退化特征有效地进行增强。而文中针对比度低、颜色偏差和细节模糊等问题，提出基于多输入融合对抗网络的水下图像增强(Underwater Image Enhancement Base On Multi-Input Fusion Adversarial Network, MFGAN)，算法主要有以下特点：(1) 以生成对抗网络为基本框架，并利用生成网络学习同一图像的不同特征增强之间的置信度图，还引入了两个纹理提取单元进行纹理特征提取，通过融合操作，获得清晰图像。此外，为提高网络的鲁棒性，构建了多损失函数。(2) 在MFGAN的残差连接中加入一层卷积层，通过对比实验证明其结构更有效地学习细节特征。(3) 构建了从水下退化图像到清晰图像的端到端映射，不依赖于任何水下成像模型和先验知识，适用性更强。通过主观和客观评价两方面表明MFGAN与其他经典及新颖算法相比，处理后的图像色彩鲜明和对比度提升。

4. 结　论

针对水下图像颜色失真、雾化和低对比度等问题，设计了基于多输入融合对抗网络的水下图像增强。MFGAN主要由一个生成网络和一个判别网络组成。生成网络主要负责合成水下清晰图像，判别网络的作用是不断驱动生成网络合成与参考图像在视觉上相同的图像。其次，为了网络更好学习图像的特征，利用多个子网络对同幅图像不同的增强特征进行学习，对应输出相乘相加。最后，构建了多损失函数，提高网络的鲁棒性，利用生成网络与判别网络进行相互交替训练。实验结果表明，相比于对比算法，MFGAN的UCIQE平均值为0.639 9，NIQE平均值为3.727 3，特征点匹配平均高5-10个匹配点，证明了MFGAN能恢复出更多的细节信息，适用于在不同类型的水下退化图像。在未来的工作将考虑水下成像模型与网络训练相结合，对水下退化图像进行复原。

参考文献 (15)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

多输入融合对抗网络的水下图像增强

doi: 10.3788/IRLA20200015

作者简介:
林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

Multi-input fusion adversarial network for underwater image enhancement

计量

多输入融合对抗网络的水下图像增强

doi: 10.3788/IRLA20200015

1. 辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105

2. 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

3. 中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

作者简介:
林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

English Abstract

Multi-input fusion adversarial network for underwater image enhancement

全文HTML

1.1. 预处理

1.2. 卷积

1.3. 反卷积

1.4. 网络结构图

1.5. 残差连接

2.1. 生成网络

2.2. 判别网络

2.3. 损失函数

3.1. 数据集和训练

3.2. 主观评价

3.3. 客观评价

目录

留言板

多输入融合对抗网络的水下图像增强

doi: 10.3788/IRLA20200015

作者简介: 林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

Multi-input fusion adversarial network for underwater image enhancement

计量

出版历程

多输入融合对抗网络的水下图像增强

doi: 10.3788/IRLA20200015

1. 辽宁工程技术大学 电子与信息工程学院，辽宁 葫芦岛 125105 2. 中国科学院沈阳自动化研究所 机器人学国家重点实验室，辽宁 沈阳 110016 3. 中国科学院机器人与智能制造创新研究院，辽宁 沈阳 110016

作者简介: 林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

English Abstract

Multi-input fusion adversarial network for underwater image enhancement

全文HTML

1.1. 预处理

1.2. 卷 积

1.3. 反卷积

1.4. 网络结构图

1.5. 残差连接

2.1. 生成网络

2.2. 判别网络

2.3. 损失函数

3.1. 数据集和训练

3.2. 主观评价

3.3. 客观评价

目录

作者简介:
林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

1. 辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105

2. 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

3. 中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

作者简介:
林森(1980-)，男，副教授，博士后，主要从事图像处理、机器视觉、模式识别等方面的研究。Email：lin_sen6@126.com

1.2. 卷积