留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于深度学习的序列图像深度估计技术

梁欣凯 宋闯 赵佳佳

梁欣凯, 宋闯, 赵佳佳. 基于深度学习的序列图像深度估计技术[J]. 红外与激光工程, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002
引用本文: 梁欣凯, 宋闯, 赵佳佳. 基于深度学习的序列图像深度估计技术[J]. 红外与激光工程, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002
Liang Xinkai, Song Chuang, Zhao Jiajia. Depth estimation technique of sequence image based on deep learning[J]. Infrared and Laser Engineering, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002
Citation: Liang Xinkai, Song Chuang, Zhao Jiajia. Depth estimation technique of sequence image based on deep learning[J]. Infrared and Laser Engineering, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002

基于深度学习的序列图像深度估计技术

doi: 10.3788/IRLA201948.S226002
基金项目: 

国防基础科研计划(JCKY2017204B064);国家自然科学基金(61803356)

详细信息
    作者简介:

    梁欣凯(1992-),男,工程师,硕士,主要从事视觉定位与深度估计方面的研究。Email:lxk820@126.com

  • 中图分类号: V557+.4

Depth estimation technique of sequence image based on deep learning

  • 摘要: 针对单帧图像深度估计的弱泛化性,提出了基于深度学习的序列图像深度估计技术,利用深度卷积神经网络作为基础框架,结合对极几何约束,构建从序列图像到图像对应深度信息的端对端映射,实现仅依赖序列图像信息的无监督深度估计。同时,构建了一类基于场景三维几何信息的损失函数,舍弃原始基于图像间重投影误差的损失函数,提高算法鲁棒性。最后,通过开源数据库验证了算法的准确性和精度,同时,通过红外图像数据集验证了算法的泛化性,为军事领域应用奠定了基础。
  • [1] Lin Jinhua, Wang Yanjie. Three-dimentional reconstruction of semantic scene based on RGB-D map[J]. Optics and Precision Engineering, 2018, 26(5):1231-1241. (in Chinese)林金花, 王延杰. 三维语义场景复原网络[J]. 光学精密工程, 2018, 26(5):1231-1241.
    [2] Liu Bo, Xu Tingfa, Li Xiangmin, et al. Adaptive context-aware correlation filter tracking[J]. Chinese Optics, 2019, 12(2):265-273. (in Chinese)刘波, 许廷发, 李相民, 等. 自适应上下文感知相关滤波跟踪[J]. 中国光学, 2019, 12(2):265-273.
    [3] Li Yu, Liu Xueying, Zhang Hongqun, et al. Optical remote sensing image retrieval based on convolutional neural networks[J]. Optics and Precision Engineering, 2018, 26(1):200-207. (in Chinese)李宇, 刘雪莹, 张洪群, 等. 基于卷积神经网络的光学遥感图像检索[J]. 光学精密工程, 2018, 26(1):200-207.
    [4] Fan Xiaoting, Li Yi, Luo Xiaowei, et al. Depth estimation based on light field structure characteristic and multiview matching[J]. Infrared and Laser Engineering, 2019, 48(5):0524001. (in Chinese)范晓婷, 李奕, 罗晓维, 等. 基于光场结构特性与多视点匹配的深度估计[J]. 红外与激光工程, 2019, 48(5):0524001.
    [5] Eigen D, Puhrsch C, Fergu R. Depth map prediction from a single image using a multi-scale deep network[C]//Proc Conf Neural Information Processing Systems, 2014.
    [6] Eigen David, Rob Fergus. Predicting depth, surface normals and semantic labels with a common multi-scale convolutional architecture[C]//The IEEE International Conference on Computer Vision, 2015.
    [7] Laina I, Rupprecht C, Belagiannis V. Deeper depth prediction with fully convolutional residual networks[C]//International Conference on 3D Vision, 2016.
    [8] Godard C, Aodha O M, Brostow G J. Unsupervised monocular depth estimation with left-right consistency[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2017.
    [9] Zhou T, Brown M, Snavely N, et al. Unsupervised learning of depth and ego-motion from video[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2017.
    [10] Ummenhofer B, Zhou H, Uhrig J, et al. DeMoN:Depth and motion network for learning monocular stereo[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2017.
    [11] Huang P, Matzen K, Kopf J, et al. DeepMVS:Learning multi-view stereopsis[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2018.
    [12] Kendall A, Martirosyan H, Dasgupta S, et al. End-to-end learning of geometry and context for deep stereo regression[C]//The IEEE International Conference on Computer Vision, 2017.
    [13] Wang Xin, Wang Xiangjun. Multiple targets sparse matching for binocular vision positioning system with large field of view[J]. Infrared and Laser Engineering, 2018, 47(7):0726001. (in Chinese)王鑫, 王向军. 大视场双目视觉定位系统中多目标稀疏匹配[J]. 红外与激光工程, 2018, 47(7):0726001.
    [14] Qiao Tieying, Cai Lihua, Li Ning, et al. Opposite target measurement based on infrared radiation characteristic system[J]. Chinese Optics, 2018, 11(5):804-811. (in Chinese)乔铁英, 蔡立华, 李宁, 等. 基于红外辐射特性系统实现对面目标测量[J]. 中国光学, 2018, 11(5):804-811.
  • [1] 石峰, 陆同希, 杨书宁, 苗壮, 杨晔, 张闻文, 何睿清.  噪声环境下基于单像素成像系统和深度学习的目标识别方法 . 红外与激光工程, 2020, 49(6): 20200010-1-20200010-8. doi: 10.3788/IRLA20200010
    [2] 张钊, 韩博文, 于浩天, 张毅, 郑东亮, 韩静.  多阶段深度学习单帧条纹投影三维测量方法 . 红外与激光工程, 2020, 49(6): 20200023-1-20200023-8. doi: 10.3788/IRLA20200023
    [3] 赵洋, 傅佳安, 于浩天, 韩静, 郑东亮.  深度学习精确相位获取的离焦投影三维测量 . 红外与激光工程, 2020, 49(7): 20200012-1-20200012-8. doi: 10.3788/IRLA20200012
    [4] 冯世杰, 左超, 尹维, 陈钱.  深度学习技术在条纹投影三维成像中的应用 . 红外与激光工程, 2020, 49(3): 0303018-0303018-17. doi: 10.3788/IRLA202049.0303018
    [5] 钟锦鑫, 尹维, 冯世杰, 陈钱, 左超.  基于深度学习的散斑投影轮廓术 . 红外与激光工程, 2020, 49(6): 20200011-1-20200011-11. doi: 10.3788/IRLA20200011
    [6] 胡善江, 贺岩, 陶邦一, 俞家勇, 陈卫标.  基于深度学习的机载激光海洋测深海陆波形分类 . 红外与激光工程, 2019, 48(11): 1113004-1113004(8). doi: 10.3788/IRLA201948.1113004
    [7] 唐聪, 凌永顺, 杨华, 杨星, 路远.  基于深度学习的红外与可见光决策级融合检测 . 红外与激光工程, 2019, 48(6): 626001-0626001(15). doi: 10.3788/IRLA201948.0626001
    [8] 周宏强, 黄玲玲, 王涌天.  深度学习算法及其在光学的应用 . 红外与激光工程, 2019, 48(12): 1226004-1226004(20). doi: 10.3788/IRLA201948.1226004
    [9] 范晓婷, 李奕, 罗晓维, 张凝, 韩梦芯, 雷建军.  基于光场结构特性与多视点匹配的深度估计 . 红外与激光工程, 2019, 48(5): 524001-0524001(8). doi: 10.3788/IRLA201948.0524001
    [10] 罗海波, 何淼, 惠斌, 常铮.  基于双模全卷积网络的行人检测算法(特邀) . 红外与激光工程, 2018, 47(2): 203001-0203001(8). doi: 10.3788/IRLA201847.0203001
    [11] 余思泉, 韩志, 唐延东, 吴成东.  基于对抗生成网络的纹理合成方法 . 红外与激光工程, 2018, 47(2): 203005-0203005(6). doi: 10.3788/IRLA201847.0203005
    [12] 郭强, 芦晓红, 谢英红, 孙鹏.  基于深度谱卷积神经网络的高效视觉目标跟踪算法 . 红外与激光工程, 2018, 47(6): 626005-0626005(6). doi: 10.3788/IRLA201847.0626005
    [13] 姚旺, 刘云鹏, 朱昌波.  基于人眼视觉特性的深度学习全参考图像质量评价方法 . 红外与激光工程, 2018, 47(7): 703004-0703004(8). doi: 10.3788/IRLA201847.0703004
    [14] 耿磊, 梁晓昱, 肖志涛, 李月龙.  基于多形态红外特征与深度学习的实时驾驶员疲劳检测 . 红外与激光工程, 2018, 47(2): 203009-0203009(9). doi: 10.3788/IRLA201847.0203009
    [15] 唐聪, 凌永顺, 杨华, 杨星, 郑超.  基于深度学习物体检测的视觉跟踪方法 . 红外与激光工程, 2018, 47(5): 526001-0526001(11). doi: 10.3788/IRLA201847.0526001
    [16] 唐聪, 凌永顺, 郑科栋, 杨星, 郑超, 杨华, 金伟.  基于深度学习的多视窗SSD目标检测方法 . 红外与激光工程, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
    [17] 张秀玲, 侯代标, 张逞逞, 周凯旋, 魏其珺.  深度学习的MPCANet火灾图像识别模型设计 . 红外与激光工程, 2018, 47(2): 203006-0203006(6). doi: 10.3788/IRLA201847.0203006
    [18] 刘天赐, 史泽林, 刘云鹏, 张英迪.  基于Grassmann流形几何深度网络的图像集识别方法 . 红外与激光工程, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002
    [19] 罗海波, 许凌云, 惠斌, 常铮.  基于深度学习的目标跟踪方法研究现状与展望 . 红外与激光工程, 2017, 46(5): 502002-0502002(7). doi: 10.3788/IRLA201746.0502002
    [20] 孙韶媛, 李琳娜, 赵海涛.  采用KPCA和BP神经网络的单目车载红外图像深度估计 . 红外与激光工程, 2013, 42(9): 2348-2352.
  • 加载中
计量
  • 文章访问数:  188
  • HTML全文浏览量:  22
  • PDF下载量:  52
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-05-12
  • 修回日期:  2019-06-20
  • 刊出日期:  2019-09-30

基于深度学习的序列图像深度估计技术

doi: 10.3788/IRLA201948.S226002
    作者简介:

    梁欣凯(1992-),男,工程师,硕士,主要从事视觉定位与深度估计方面的研究。Email:lxk820@126.com

基金项目:

国防基础科研计划(JCKY2017204B064);国家自然科学基金(61803356)

  • 中图分类号: V557+.4

摘要: 针对单帧图像深度估计的弱泛化性,提出了基于深度学习的序列图像深度估计技术,利用深度卷积神经网络作为基础框架,结合对极几何约束,构建从序列图像到图像对应深度信息的端对端映射,实现仅依赖序列图像信息的无监督深度估计。同时,构建了一类基于场景三维几何信息的损失函数,舍弃原始基于图像间重投影误差的损失函数,提高算法鲁棒性。最后,通过开源数据库验证了算法的准确性和精度,同时,通过红外图像数据集验证了算法的泛化性,为军事领域应用奠定了基础。

English Abstract

参考文献 (14)

目录

    /

    返回文章
    返回