HTML
-
随着无人机的普及,无人机的无证飞行和随意飞行也越来越威胁到公共安全。如何解决无人机的“黑飞”问题成为研究热点。反无人机系统是检测无人机,反制无人机的系统。在反无人机系统中,图像识别是无人机识别的方法之一,而图像识别的关键在于图像特征的提取,使用显著对象作为图像内容表示。根据特征提取的方式不同,分为传统图像特征手动提取方法和神经网络自动提取特征两种图像识别方法,传统图像识别主要依靠手动提取图像中的颜色特征、形状特征、纹理特征等特征参数来对图像进行分类,但是由于传统图像识别方法本身的局限性,使得分类的精度不高。在基于神经网络的图像识别方法发展过程中,有许多模型被提来。付旻等设计的基于多分类支持向量机(SVM)的公交换乘识别方法取得了不错的效果[1]。在20世纪80年代,Le Cun等提出了基于卷积神经网络的手写数字识别网络Le Net-5[2]。2012年Krizhevsky等提出Alex Net模型,并在Image Net竞赛中取得了冠军。2016年Inception- v4被提出[3],它是基于Inception-v3的改进,模型简洁,计算量小。卷积神经网络具有自动提取特征和权值共享的特点,使得卷积神经网络也可用于图像识别。
文中提出了一种基于卷积神经网络的无人机识别方法。设计了适合无人机数据集的卷积神经网络。为验证提出的识别方法的可行性,分别对无人机和鸟的图片运用支持向量机和设计的卷积神经网络进行识别;并运用设计的卷积神经网络在MNIST数据集上进行测试[4]。
-
根据百强网和买购网的数据显示“低慢小”无人机排名前5为大疆、派诺特、AEE—电科技、零度智控等品牌,同时根据各个品牌无人机的销售情况,选取了以下5种型号的无人机进行采集,分别是大疆-御MAVIC 2,派诺特- Bebop 2.0,AEE—电科技AP10 Pro,零度智控- XPLORER V,极飞XAG-C2000。在拍摄过程中,拍摄条件没有任何限制,在自然光的照射下用自制光学系统对飞行中的无人机进行拍摄,如表1和图1所示。
UAV type Number of shots Number after amplification MAVIC 2 176 704 Bebop 2.0 176 704 AP10 Pro 176 704 XPLORER V 176 704 C2000 176 704 Total 880 3520 Table 1. 5 number of UAV pictures
-
对采集的无人机样本首先进行预处理,即将图片缩放。将图片缩放至卷积神经网络要求的大小(100×100)。由于原始拍摄的图片宽高比不是1:1的,而且无人机所占图片的比例过小,所以不能直接把图片缩放至100×100,这样会使无人机发生形变,丢失原来的特征信息,导致识别的准确率降低。为此,对图片进行边缘检测,把图片中的无人机检测出来,去除大部分无关背景;然后,对裁剪下来的无人机图片进行缩放,缩放时保持原图片的宽高比,空白信息填充像素“0”(即为黑色),缩放过程如图2所示。
-
由于采集的样本数量较少,所以要对原始数据集进行扩增,常见的数据扩增方法有图像平移、图像旋转、图像镜像、图像亮度变化、图像裁剪、图像缩放、图像模糊等。为最大限度地保持原始图片的特征信息,采用图像旋转的方法来进行数据扩增,分别对图片进行顺时针90°、180°、270°的旋转(如图3所示),数据扩增后的数量如表1第3列所示。
-
由于数据集图像中目标的相似度较高,所以在对卷积神经网络进行训练前,要对数据集进行主成分分析(Principal Component Analysis,PCA)的白化处理,来降低输入的冗余性[5],并且使得属性自身的方差尽可能大,而属性之间的协方差尽可能小,从而加快神经网络的学习速率。PCA作为一种典型的降维方法,它不仅能够搜索主要成分,还能够降低数据中的噪声,被广泛应用于识别领域。PCA算法的主要步骤如下:
计算样本的协方差矩阵如下式所示:
式中:n为样本个数;
${{{x}}}^{\left({{i}}\right)}$ 为经过零均值化的样本。计算协方差矩阵
${\rm{\varphi }}$ 的特征值及对应的特征向量,组成矩阵V如下式所示:式中:p为特征向量的总数;
${{{v}}}_{11}$ 为矩阵中向量对应的最大特征值;${{{v}}}_{22}$ 是次特征向量对应的最大特征值,依次类推。主成分个数的选择,选取主成分的个数q时,q的取值可以由保留的方差百分比
${{\alpha }}$ 来决定,${{\alpha }}$ 由下式所得:据以往的经验,应该保留99%以上的方差,即q的取值应为
${{\alpha }}$ ≥0.99的最小值。白化PCA白化后的数据如下式所示:
式中:
${{{x}}}_{rot,{{i}}}={{{{v}}}_{{{i}}}}^{{\rm{T}}}{{{x}}}_{{{i}}}$ ;${{\rm{\lambda }}}_{{{i}}}$ 为协方差矩阵${\rm{\varphi }}$ 的特征值;${{\rm{\beta }}}_{{\rm{P}}{\rm{C}}{\rm{A}}{{\rm{white}}}{,{{i}}}}$ 为经过PCA白化后的数据。 -
无人机样本图片是在长春理工大学操场运用自制光学系统(如图6所示)进行采集的(如图7所示),自制光学系统主要包括2轴伺服转台,反射式天文望远镜,彩色高清CMOS相机。此光学系统可以采集1000 m范围内的无人机图像,并将图片传给上位机进行处理。
-
文中实验采用的计算机环境是Windows 7系统Intel(R) Core(TM) i7-5500U CPU@2.40 GHz,16G内存,基于开源深度学习框架Tensorflow,采用Python3.7编写,代码运行平台Sublime。
-
神经网络的识别的好坏不仅与网络的参数结构有关,而且与训练的次数有很大的关系;随着次数的增多,损失函数不断降低(如图8所示)[11-12],直到达到最优,同时识别的准确率不断地提升(如图9所示),经过2 000次的训练模型的准确率达到了95.9%。
-
为防止数据集训练时出现过拟合,在最后一层池化层后,加入了Dropout层。Dropout层设置的参数会很大程度上影响训练的结果,因此将参数分别设置为0.4、0.5、0.6、0.7,比较这四种参数,结果表明当参数设置为0.5时(如表2所示),训练的准确率达到95.9%,较其他三种参数有了很大提高。
Parameter setting Recognition accuracy 0.4 90.2% 0.5 95.9% 0.6 93.3% 0.7 88.4% Table 2. Results of different parameters of Dropout layer
-
为验证文中所设计的卷积神经网络可行性,除在自行建立的数据集上进行测试外,还在MNIST数据集进行测试,MNIST数据集作为一个非常有名的手写体数字识别数据集,许多神经网络训练都会使用它[13]。实验结果表明(如图10所示),设计的卷积神经网络具有很高的可行性和较强的鲁棒性。
-
文中除使用设计的卷积神经网络模型外[14],还使用支持向量机(SVM)识别方法进行识别。由于在小样本的情况下,文中设计的卷积神经网络识别准确率为95.9%,支持向量机识别准确率为88.4%(如图11所示),经过对比(如图12所示)表明文中设计的卷积神经网络模型优于支持向量机。