留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于Grassmann流形几何深度网络的图像集识别方法

刘天赐 史泽林 刘云鹏 张英迪

刘天赐, 史泽林, 刘云鹏, 张英迪. 基于Grassmann流形几何深度网络的图像集识别方法[J]. 红外与激光工程, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002
引用本文: 刘天赐, 史泽林, 刘云鹏, 张英迪. 基于Grassmann流形几何深度网络的图像集识别方法[J]. 红外与激光工程, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002
Liu Tianci, Shi Zelin, Liu Yunpeng, Zhang Yingdi. Geometry deep network image-set recognition method based on Grassmann manifolds[J]. Infrared and Laser Engineering, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002
Citation: Liu Tianci, Shi Zelin, Liu Yunpeng, Zhang Yingdi. Geometry deep network image-set recognition method based on Grassmann manifolds[J]. Infrared and Laser Engineering, 2018, 47(7): 703002-0703002(7). doi: 10.3788/IRLA201847.0703002

基于Grassmann流形几何深度网络的图像集识别方法

doi: 10.3788/IRLA201847.0703002
基金项目: 

中国科学院重点创新基金(Y6K4250401)

详细信息
    作者简介:

    刘天赐(1993-),男,博士生,主要从事目标检测与目标识别方面的研究。Email:liutianci@sia.cn

  • 中图分类号: TP391

Geometry deep network image-set recognition method based on Grassmann manifolds

  • 摘要: 近年来,深度学习以其强大的非线性计算能力在目标检测和识别任务中取得了巨大的突破。现有的深度学习网络几乎都是以数据的欧氏结构为前提,而在计算机视觉中许多数据都具有严格的流形结构,如图像集可表示为Grassmann流形。基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于Grassmann流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的黎曼优化问题。实验结果表明:该方法不仅在结果上识别准确率得到了提高,同时在训练和测试速度上也有一个数量级的提升。
  • [1] Luo Haibo, Xu Lingyun, Hui Bin, et al. Status and prospect of target tracking based on deep learning[J]. Infrared and Laser Engineering, 2017, 46(5):0502002. (in Chinese)罗海波, 许凌云, 惠斌, 等. 基于深度学习的目标跟踪方法研究现状与展望[J]. 红外与激光工程, 2017, 46(5):0502002.
    [2] Luo Haibo, He Miao, Hui Bin, et al. Pedestrian detection algorithm based on dual-model fused fully convolutional networks(Invited)[J]. Infrared and Laser Engineering, 2018, 47(2):0203001. (in Chinese)罗海波, 何淼, 惠斌, 等. 基于双模全卷积网络的行人检测算法(特邀)[J]. 红外与激光工程, 2018, 47(2):0203001.
    [3] Pei Xiaomin, Fan Huijie, Tang Yandong. Action recognition method of spatio-temporal feature fusion deep learning network[J]. Infrared and Laser Engineering, 2018, 47(2):0203007. (in Chinese)裴晓敏, 范慧杰, 唐延东. 时空特征融合深度学习网络人体行为识别方法[J]. 红外与激光工程, 2018, 47(2):0203007.
    [4] Ke Yuyang, Yang Xunzheng, Xiong Yan, et al. Power generation dispatching for environmental protection based on recursive neural network and ant colony optimization algorithm[J]. Information and Control, 2017, 46(4):415-421. (in Chinese)柯余洋, 杨训政, 熊焰, 等. 基于递归神经网络和蚁群优化算法的发电环保调度[J]. 信息与控制, 2017, 46(4):415-421.
    [5] Wu Peiliang, Li Ya'nan, Yang Fang, et al. A CLM-based method of indoor affordance areas classification for service robots[J]. Robot, 2018, 40(2):188-194. (in Chinese)吴培良, 李亚南, 杨芳, 等. 一种基于CLM的服务机器人室内功能区分类方法[J]. 机器人, 2018, 40(2):188-194.
    [6] Xu Peng, Zhao Dongbiao, Cheng Jinxiang, et al. Multi-objective optimization for inverse kinematics solution manifoldsof redundant robots[J]. Robot, 2016, 38(6):704-710. (in Chinese)徐朋, 赵东标, 程锦翔, 等. 冗余机器人逆运动学解流形的多目标优化[J]. 机器人, 2016, 38(6):704-710.
    [7] Xu Tao, Jia Songmin, Zhang Guoliang. Fast spatial object location method for service robot based on co-saliency[J]. Robot, 2017, 39(3):307-315. (in Chinese)徐涛, 贾松敏, 张国梁. 基于协同显著性的服务机器人空间物体快速定位方法[J]. 机器人, 2017, 39(3):307-315.
    [8] Huang Z, Gool L V. A Riemannian network for SPD matrix learning[J]. Association for the Advancement of Artificial Intelligence, 2017, 2(4):2036-2042.
    [9] Huang Z, Wu J, Gool L V. Building deep networks on Grassmann manifolds[J]. Association for the Advancement of Artificial Intelligence, 2018:3279-3286.
    [10] Huang Z, Wang R, Shan S, et al. Projection metric learning on Grassmann manifold with application to video based face recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015:140-149.
    [11] Harandi M, Sanderson C, Shirazi S, et al. Graph embedding discriminant analysis on grassmannian manifolds for improved image set matching[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2011:2705-2712.
    [12] Hamm J, Lee D D. Grassmann discriminant analysis:a unifying view on subspace-based learning[C]//Proceedings of the 25th international conference on Machine learning, ACM, 2008:376-383.
    [13] Liu T, Shi Z, Liu Y. Kernel sparse representation on grassmann manifolds for visual clustering[J]. Optical Engineering, 2018, 57(5):053104.
    [14] Dhall A, Goecke R, Joshi R, et al. Emotion recognition in the wild challenge 2014:Baseline, data and protocol[C]//Proceedings of the 16th International Conference on Multimodal Interaction, ACM, 2014:461-466.
    [15] Kim T K, Kittler J, Cipolla R. Discriminative learning and recognition of image set classes using canonical correlations[J]. IEEE T-PAMI, 2007, 29(6):1005-1018.
    [16] Liu M, Shan S, Wang R, et al. Learning expressionlets on spatio-temporal manifold for dynamic facial expression recognition[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition, 2014:4321-4328.
    [17] Ionescu C, Vantzos O, Sminchisescu C. Matrix backpropagation for deep networks with structured layers[C]//Proceedings of the IEEE International Conference on Computer Vision, 2015:2965-2973.
  • [1] 陈寒梅, 于春荣, 刘智超.  基于深度学习的室内照明智能调节系统 . 红外与激光工程, 2022, 51(7): 20210829-1-20210829-6. doi: 10.3788/IRLA20210829
    [2] 熊子涵, 宋良峰, 刘欣, 左超, 郜鹏.  基于深度学习的荧光显微性能提升(特邀) . 红外与激光工程, 2022, 51(11): 20220536-1-20220536-18. doi: 10.3788/IRLA20220536
    [3] 王嘉业, 李艺璇, 张玉珍.  基于学习的光栅图像噪声抑制方法 . 红外与激光工程, 2022, 51(2): 20220006-1-20220006-10. doi: 10.3788/IRLA20220006
    [4] 郭恩来, 师瑛杰, 朱硕, 程倩倩, 韦一, 苗金烨, 韩静.  深度学习下的散射成像:物理与数据联合建模优化(特邀) . 红外与激光工程, 2022, 51(8): 20220563-1-20220563-13. doi: 10.3788/IRLA20220563
    [5] 王志远, 赖雪恬, 林惠川, 陈福昌, 曾峻, 陈子阳, 蒲继雄.  基于深度学习实现透过浑浊介质图像重构(特邀) . 红外与激光工程, 2022, 51(8): 20220215-1-20220215-10. doi: 10.3788/IRLA20220215
    [6] 范有臣, 马旭, 马淑丽, 钱克昌, 郝红星.  基于深度学习的激光干扰效果评价方法 . 红外与激光工程, 2021, 50(S2): 20210323-1-20210323-7. doi: 10.3788/IRLA20210323
    [7] 邓人隽, 史坦, 李向平, 邓子岚.  基于全局拓扑优化深度学习模型的超构光栅分束器 . 红外与激光工程, 2021, 50(5): 20211028-1-20211028-4. doi: 10.3788/IRLA20211028
    [8] 赵洋, 傅佳安, 于浩天, 韩静, 郑东亮.  深度学习精确相位获取的离焦投影三维测量 . 红外与激光工程, 2020, 49(7): 20200012-1-20200012-8. doi: 10.3788/IRLA20200012
    [9] 杨程, 鄢秋荣, 祝志太, 王逸凡, 王明, 戴伟辉.  基于深度学习的压缩光子计数激光雷达 . 红外与激光工程, 2020, 49(S2): 20200380-20200380. doi: 10.3788/IRLA20200380
    [10] 钟锦鑫, 尹维, 冯世杰, 陈钱, 左超.  基于深度学习的散斑投影轮廓术 . 红外与激光工程, 2020, 49(6): 20200011-1-20200011-11. doi: 10.3788/IRLA20200011
    [11] 张旭, 于明鑫, 祝连庆, 何彦霖, 孙广开.  基于全光衍射深度神经网络的矿物拉曼光谱识别方法 . 红外与激光工程, 2020, 49(10): 20200221-1-20200221-8. doi: 10.3788/IRLA20200221
    [12] 石峰, 陆同希, 杨书宁, 苗壮, 杨晔, 张闻文, 何睿清.  噪声环境下基于单像素成像系统和深度学习的目标识别方法 . 红外与激光工程, 2020, 49(6): 20200010-1-20200010-8. doi: 10.3788/IRLA20200010
    [13] 周宏强, 黄玲玲, 王涌天.  深度学习算法及其在光学的应用 . 红外与激光工程, 2019, 48(12): 1226004-1226004(20). doi: 10.3788/IRLA201948.1226004
    [14] 梁欣凯, 宋闯, 赵佳佳.  基于深度学习的序列图像深度估计技术 . 红外与激光工程, 2019, 48(S2): 134-141. doi: 10.3788/IRLA201948.S226002
    [15] 耿磊, 梁晓昱, 肖志涛, 李月龙.  基于多形态红外特征与深度学习的实时驾驶员疲劳检测 . 红外与激光工程, 2018, 47(2): 203009-0203009(9). doi: 10.3788/IRLA201847.0203009
    [16] 唐聪, 凌永顺, 杨华, 杨星, 郑超.  基于深度学习物体检测的视觉跟踪方法 . 红外与激光工程, 2018, 47(5): 526001-0526001(11). doi: 10.3788/IRLA201847.0526001
    [17] 唐聪, 凌永顺, 郑科栋, 杨星, 郑超, 杨华, 金伟.  基于深度学习的多视窗SSD目标检测方法 . 红外与激光工程, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
    [18] 姚旺, 刘云鹏, 朱昌波.  基于人眼视觉特性的深度学习全参考图像质量评价方法 . 红外与激光工程, 2018, 47(7): 703004-0703004(8). doi: 10.3788/IRLA201847.0703004
    [19] 张秀玲, 侯代标, 张逞逞, 周凯旋, 魏其珺.  深度学习的MPCANet火灾图像识别模型设计 . 红外与激光工程, 2018, 47(2): 203006-0203006(6). doi: 10.3788/IRLA201847.0203006
    [20] 罗海波, 许凌云, 惠斌, 常铮.  基于深度学习的目标跟踪方法研究现状与展望 . 红外与激光工程, 2017, 46(5): 502002-0502002(7). doi: 10.3788/IRLA201746.0502002
  • 加载中
计量
  • 文章访问数:  524
  • HTML全文浏览量:  67
  • PDF下载量:  57
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-02-10
  • 修回日期:  2018-03-20
  • 刊出日期:  2018-07-25

基于Grassmann流形几何深度网络的图像集识别方法

doi: 10.3788/IRLA201847.0703002
    作者简介:

    刘天赐(1993-),男,博士生,主要从事目标检测与目标识别方面的研究。Email:liutianci@sia.cn

基金项目:

中国科学院重点创新基金(Y6K4250401)

  • 中图分类号: TP391

摘要: 近年来,深度学习以其强大的非线性计算能力在目标检测和识别任务中取得了巨大的突破。现有的深度学习网络几乎都是以数据的欧氏结构为前提,而在计算机视觉中许多数据都具有严格的流形结构,如图像集可表示为Grassmann流形。基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于Grassmann流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的黎曼优化问题。实验结果表明:该方法不仅在结果上识别准确率得到了提高,同时在训练和测试速度上也有一个数量级的提升。

English Abstract

参考文献 (17)

目录

    /

    返回文章
    返回