留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于深度学习的多视窗SSD目标检测方法

唐聪 凌永顺 郑科栋 杨星 郑超 杨华 金伟

唐聪, 凌永顺, 郑科栋, 杨星, 郑超, 杨华, 金伟. 基于深度学习的多视窗SSD目标检测方法[J]. 红外与激光工程, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
引用本文: 唐聪, 凌永顺, 郑科栋, 杨星, 郑超, 杨华, 金伟. 基于深度学习的多视窗SSD目标检测方法[J]. 红外与激光工程, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
Tang Cong, Ling Yongshun, Zheng Kedong, Yang Xing, Zheng Chao, Yang Hua, Jin Wei. Object detection method of multi-view SSD based on deep learning[J]. Infrared and Laser Engineering, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003
Citation: Tang Cong, Ling Yongshun, Zheng Kedong, Yang Xing, Zheng Chao, Yang Hua, Jin Wei. Object detection method of multi-view SSD based on deep learning[J]. Infrared and Laser Engineering, 2018, 47(1): 126003-0126003(9). doi: 10.3788/IRLA201847.0126003

基于深度学习的多视窗SSD目标检测方法

doi: 10.3788/IRLA201847.0126003
基金项目: 

国家自然科学基金(61503394,61405248);安徽省自然科学基金(1508085QF121)

详细信息
    作者简介:

    唐聪(1989-),男,博士生,主要从事计算机视觉、深度学习、模式识别等方面的研究。Email:tangcong_eei@163.com

  • 中图分类号: TP391.4

Object detection method of multi-view SSD based on deep learning

  • 摘要: 提出了一种基于深度学习的多视窗SSD (Single Shot multibox Detector)目标检测方法。首先阐述了经典SSD方法的模型与工作原理,并根据卷积感受野的概念和模型特征层与原始图像的映射关系,分析了各层级卷积感受野大小和特征层上默认框在原始图像上的映射区域尺寸,揭示了经典SSD方法在小目标检测上不足的原因。基于此,提出了一种多视窗SSD模型,阐述了其模型结构与工作原理,并通过106张小目标图像数据集测试,评估和对比了多视窗SSD方法与经典SSD方法在小目标检测上的物体检索能力与物体检测精度。结果表明:在置信度阈值为0.4的条件下,多视窗SSD方法的AF (Average F-measure)为0.729,mAP (mean Average Precision)为0.644,相比于经典SSD方法分别提高了0.169和0.131,验证了所提出算法的有效性。
  • [1] Borji A, Cheng M M, Jiang H, et al. Salient object detection:A benchmark[J]. IEEE Transactions on Image Processing, 2015, 24(12):5706-5722.
    [2] Erhan D, Szegedy C, Toshev A, et al. Scalable object detection using deep neural networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014:2147-2154.
    [3] Luo Haibo, Xu Lingyun, Hui Bin, et al. Status and prospect of target tracking based on deep learning[J]. Infrared and Laser Engineering, 2017, 46(5):0502002. (in Chinese)
    [4] He Sihua, Yang Shaoqing, Shao Xiaofang, et al. Ship target detection on the sea surface based on natural measure feature of image block[J]. Infrared and Laser Engineering, 2011, 40(9):1812-1817. (in Chinese)
    [5] Merlin P M, Farber D J. A parallel mechanism for detecting curves in pictures[J]. IEEE Transactions on Computers, 1975, 100(1):96-98.
    [6] Singla N. Motion detection based on frame difference method[J]. International Journal of Information Computation Technology, 2014, 4(15):1559-1565.
    [7] Lee D S. Effective Gaussian mixture learning for video background subtraction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(5):827-832.
    [8] Horn B K P, Schunck B G. Determining optical flow[J]. Artificial Intelligence, 1981, 17(1-3):185-203.
    [9] Viola P, Jones M. Rapid object detection using a boosted cascade of simple features[C]//IEE Conference on Computer Vision and Pattern Recognition, 2003, 1:I-511-I-518.
    [10] Felzenszwalb P F, Girshick R B, McAllester D, et al. Object detection with discriminatively trained part-based models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1627-1645.
    [11] Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60(2):91-110.
    [12] Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, IEEE, 2005, 1:886-893.
    [13] Panning A, Al-Hamadi A K, Niese R, et al. Facial expression recognition based on Haar-like feature detection[J]. Pattern Recognition Image Analysis, 2008, 18(3):447-452.
    [14] Burges C J C. A tutorial on support vector machines for pattern recognition[J]. Data Mining and Knowledge Discovery, 1998, 2(2):121-167.
    [15] Zhu J, Zou H, Rosset S, et al. Multi-class adaboost[J]. Statistics and its Interface, 2009, 2(3):349-360.
    [16] Kong T, Yao A, Chen Y, et al. HyperNet:towards accurate region proposal generation and joint object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016:845-853.
    [17] Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014:580-587.
    [18] He K, Zhang X, Ren S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[C]//European Conference on Computer Vision, 2014:346-361.
    [19] Girshick R. Fast r-cnn[C]//Proceedings of the IEEE International Conference on Computer Vision, 2015:1440-1448.
    [20] Ren S, He K, Girshick R, et al. Faster r-cnn:Towards real-time object detection with region proposal networks[C]//Advances in Neural Information Processing Systems, 2015:91-99.
    [21] Li Y, He K, Sun J. R-fcn:Object detection via region-based fully convolutional networks[C]//Advances in Neural Information Processing Systems, 2016:379-387.
    [22] Redmon J, Divvala S, Girshick R, et al. You only look once:Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016:779-788.
    [23] Liu W, Anguelov D, Erhan D, et al. SSD:Single shot multibox detector[C]//European Conference on Computer Vision, 2016:21-37.
    [24] Cai Z, Fan Q, Feris R S, et al. A unified multi-scale deep convolutional neural network for fast object detection[C]//European Conference on Computer Vision, 2016:354-370.
    [25] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[C]//ICLR, 2015.
  • [1] 石峰, 陆同希, 杨书宁, 苗壮, 杨晔, 张闻文, 何睿清.  噪声环境下基于单像素成像系统和深度学习的目标识别方法 . 红外与激光工程, 2020, 49(6): 20200010-1-20200010-8. doi: 10.3788/IRLA20200010
    [2] 南天章, 耿建君, 陈旭, 陈颖.  基于邻域特征的红外低慢小目标检测 . 红外与激光工程, 2019, 48(S1): 174-180. doi: 10.3788/IRLA201948.S128002
    [3] 唐聪, 凌永顺, 杨华, 杨星, 路远.  基于深度学习的红外与可见光决策级融合检测 . 红外与激光工程, 2019, 48(6): 626001-0626001(15). doi: 10.3788/IRLA201948.0626001
    [4] 赵晓枫, 徐明扬, 王聃漂, 杨佳星, 张志利.  基于改进SSD的特种车辆红外伪装检测方法 . 红外与激光工程, 2019, 48(11): 1104003-1104003(10). doi: 10.3788/IRLA201948.1104003
    [5] 唐聪, 凌永顺, 杨华, 杨星, 郑超.  基于深度学习物体检测的视觉跟踪方法 . 红外与激光工程, 2018, 47(5): 526001-0526001(11). doi: 10.3788/IRLA201847.0526001
    [6] 郭强, 芦晓红, 谢英红, 孙鹏.  基于深度谱卷积神经网络的高效视觉目标跟踪算法 . 红外与激光工程, 2018, 47(6): 626005-0626005(6). doi: 10.3788/IRLA201847.0626005
    [7] 吴天舒, 张志佳, 刘云鹏, 裴文慧, 陈红叶.  基于改进SSD的轻量化小目标检测算法 . 红外与激光工程, 2018, 47(7): 703005-0703005(7). doi: 10.3788/IRLA201847.0703005
    [8] 耿磊, 梁晓昱, 肖志涛, 李月龙.  基于多形态红外特征与深度学习的实时驾驶员疲劳检测 . 红外与激光工程, 2018, 47(2): 203009-0203009(9). doi: 10.3788/IRLA201847.0203009
    [9] 陈卫, 孙晓兵, 乔延利, 陈震庭, 殷玉龙.  海面耀光背景下的目标偏振检测 . 红外与激光工程, 2017, 46(S1): 63-68. doi: 10.3788/IRLA201746.S117001
    [10] 罗海波, 许凌云, 惠斌, 常铮.  基于深度学习的目标跟踪方法研究现状与展望 . 红外与激光工程, 2017, 46(5): 502002-0502002(7). doi: 10.3788/IRLA201746.0502002
    [11] 刘峰, 奚晓梁, 沈同圣.  基于最大值投影和快速配准的空间小目标检测 . 红外与激光工程, 2016, 45(11): 1104002-1104002(6). doi: 10.3788/IRLA201645.1104002
    [12] 孙照蕾, 惠斌, 秦莫凡, 常铮, 罗海波, 夏仁波.  红外图像显著目标检测算法 . 红外与激光工程, 2015, 44(9): 2633-2637.
    [13] 彭志勇, 王向军, 卢进.  窗口热辐射下基于视觉显著性的红外目标检测方法 . 红外与激光工程, 2014, 43(6): 1772-1776.
    [14] 韩艳丽, 刘峰.  基于三角形匹配的空间小目标检测算法 . 红外与激光工程, 2014, 43(9): 3134-3140.
    [15] 王恩国, 高印寒, 苏成志, 刘妍妍.  小目标图像局部极值收敛提取算法 . 红外与激光工程, 2014, 43(4): 1352-1358.
    [16] 吴明军, 许建铮, 周桢, 张亚涛.  针对运动摄像机的快速低存储开销运动目标检测算法 . 红外与激光工程, 2013, 42(8): 2275-2280.
    [17] 黎志华, 李新国.  基于OpenCV的红外弱小运动目标检测与跟踪 . 红外与激光工程, 2013, 42(9): 2561-2565.
    [18] 刘志刚, 卢云龙, 魏一苇.  有监督的高光谱图像伪装目标检测方法 . 红外与激光工程, 2013, 42(11): 3076-3081.
    [19] 何莲, 蔡敬菊, 张启衡.  改进的基于弦切变换的目标检测方法 . 红外与激光工程, 2012, 41(1): 239-247.
    [20] 杨亚威, 李俊山, 杨威, 赵方舟.  利用稀疏化生物视觉特征的多类多视角目标检测方法 . 红外与激光工程, 2012, 41(1): 267-272.
  • 加载中
计量
  • 文章访问数:  372
  • HTML全文浏览量:  48
  • PDF下载量:  457
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-06-11
  • 修回日期:  2017-08-12
  • 刊出日期:  2018-01-25

基于深度学习的多视窗SSD目标检测方法

doi: 10.3788/IRLA201847.0126003
    作者简介:

    唐聪(1989-),男,博士生,主要从事计算机视觉、深度学习、模式识别等方面的研究。Email:tangcong_eei@163.com

基金项目:

国家自然科学基金(61503394,61405248);安徽省自然科学基金(1508085QF121)

  • 中图分类号: TP391.4

摘要: 提出了一种基于深度学习的多视窗SSD (Single Shot multibox Detector)目标检测方法。首先阐述了经典SSD方法的模型与工作原理,并根据卷积感受野的概念和模型特征层与原始图像的映射关系,分析了各层级卷积感受野大小和特征层上默认框在原始图像上的映射区域尺寸,揭示了经典SSD方法在小目标检测上不足的原因。基于此,提出了一种多视窗SSD模型,阐述了其模型结构与工作原理,并通过106张小目标图像数据集测试,评估和对比了多视窗SSD方法与经典SSD方法在小目标检测上的物体检索能力与物体检测精度。结果表明:在置信度阈值为0.4的条件下,多视窗SSD方法的AF (Average F-measure)为0.729,mAP (mean Average Precision)为0.644,相比于经典SSD方法分别提高了0.169和0.131,验证了所提出算法的有效性。

English Abstract

参考文献 (25)

目录

    /

    返回文章
    返回