-
该研究采用的图像数据获取系统是传统的偏振多光谱成像系统,其结构如图1所示,该系统由光学滤波片、偏振片、镜头、工业CCD相机等组成。其原理是入射光通过滤波片,成为中心波长为特定值的窄带光;通过旋转滤波轮更换光学通道中的滤波片,可以获得目标在不同谱段内的光强度;入射光到达偏振片,只有振动方向与偏振片透光方向相同的光分量可以完全透过,其他光分量将被部分或全部阻挡,在四次成像的过程中,通过光机结构控制偏振片的透光方向依次旋转45°,获取四幅透射光分量互成45°夹角的偏振光谱强度图像,利用斯托克斯矢量法逐个像元地解算偏振度与偏振角,合成偏振度图像与偏振角图像,从而实现对静态目标的偏振多光谱成像探测。
Figure 1. (a) Structure diagram of polarized multispectral imaging system; (b) Physical system image
斯托克斯矢量可以由通过上述偏振片的光强分量计算得到,如公式(1)所示:
由公式(2)、(3)可计算线偏振度与偏振角:
偏振多光谱图像数据获取系统的6片通带带宽为10 nm的滤波片安装在转轮上,中心波长分别为:441、488、532、610、676、808 nm。偏振片透偏角度分别为0°、45°、90°、135°,安装在另一个转轮上。系统的视场光阑位于外壳上且大小固定。这样设计的原因是转轮切换滤波片和偏振片时,保证系统的视场不会发生变化。CCD传感器选用大恒图像水星二代MER2-502-79 U3 M/C型号相机,可以实现实时刷新,通过USB3.0数据接口向PC端进行图像数据传输。系统主要参数如表1所示。实验期间,采用该系统采集了多组偏振多光谱图像数据。
Device Performance Parameter Specifications of CCD sensor Type MER2-502-79 U3 M/C Port USB3.0 Resolution 2 448(H) × 2 048(V) Frame rate 79.1 fps Sensor 2/3", Sony IMX250
Global shutter CMOSPixel size 3.45 μm×3.45 μm Specifications of lens Lens mount Port C Specifications of polarizer Type GSP-25 Extinction ratio >1000:1 Specifications of filter Half bandwidth 10 nm Peak transmittance 50% Mechanical specifications Weight 1.5 kg Size 18(L) cm×10(W) cm×13(H) cm Table 1. Main device parameters of polarized multispectral imaging system
在获得原始的图像数据之后,需要对其进行预处理。由于采用了逐次采集的准静止成像方式,实际采集过程中会因相机微小振动、风力等原因使得被摄目标在图像中出现位移,这是设备正常使用过程中产生的随机误差。通过测量发现,位移一般在10个像素以内,因此需要对偏振多光谱图像进行配准。
设r和s是两幅只有位移差距的图像,位移大小为(x0,y0),r与s的关系可用公式(4)表示:
设R和S分别为r和s的傅里叶变换,由位移定理,有:
其互功率谱有:
式中:S*为S的复共轭。
对公式(6)进行傅里叶反变换,会得到一个冲激函数,这个函数在匹配点,即(x0,y0)处取得最大值,其他位置的值很小。利用这个原理,可以在频率域中对图像的平移进行检测。此算法的配准精度能够达到0.1 pixel[12-13],满足了偏振多光谱图像解析目标偏振信息的要求,进行亚像素级别配准的算法流程如图2所示。
该研究使用6个滤波片和4个偏振片,每组偏振多光谱图像数据包括24幅灰度图像,对这24幅图像进行互功率谱配准和中值滤波以后,得到了包含目标区域多光谱信息和偏振信息的数据立方体,使之可以在程序脚本中以元胞数组格式来进行储存和显示,每一个元胞中存储一幅灰度图像,经过配准的图像消除了彼此间的微小位移,使得每幅图像相同坐标处的像点对应同一个物点。
-
网络训练完毕后,需要对网络的分类效果进行评价。首先可以通过目视解译的方法大致判断分类的效果。获得一组图像数据的预测结果比较简单。首先将经过预处理的数据导入,然后调用已保存的神经网络模型并进行编译,再对导入的数据逐像素进行预测。神经网络会自动预测该像素归类为每一类的概率,并输出这个预测的结果。将预测结果恢复至原输入图片大小,就获得了输出图像。图6(a)展示了获取一组偏振多光谱图像时的实验场景,图6(a)为这个场景下的一幅原始图像,图6(c)展示了神经网络对该组图像的分类结果。
由于引用的偏振多光谱成像系统中添加了光阑,导致获取到的图像四角有较为明显的渐晕,因此通过圆角截去了这部分像素。从图6可以看出,总体的分类效果较为良好,基本完成了土壤、塑料假叶片、植被叶片的分类。
-
精度评价是图像分类后必须进行的重要任务。通过对分类结果的定量化评价,可以评估神经网络模型分类的效果,指示神经网络结构或参数进行优化的方向,进而对网络结构或参数进行针对性的改善。
评价某种分类方法精度时,可以采用的主要指标包括以下几种[15]:
(1) 总体分类精度。总体分类精度即分类的总体分类精度,计算方法为正确分类的像素数量与总像素数量之比。
(2) 混淆矩阵。混淆矩阵又称误差矩阵,主要用于比较分类结果与真实情况之间的差异性,可以用混淆矩阵的格式的形式表示分类精度。在混淆矩阵中,错分类的样本数目分布在非对角线上,而正确分类的样本分布在对角线上,因此可以借助混淆矩阵方便地查看多种类别的混淆情况。
(3) Kappa系数。Kappa系数是一个更加客观描述分类精度的量。其计算方法为:
式中:N表示总像素数量,表示第i类像素归类为第i类地物的数量,和表示第i类像素归类为非第i类地物的数量和非第i类像素归类为第i类地物的数量。
综上所述,在不同分类方法之间定量化评价分类精度时,选择总体分类精度、混淆矩阵、Kappa系数这三项指标。
在神经网络方法实现后,项目基于MATLAB平台实现了最小距离分类器、最大似然分类器、支持向量机三种典型分类方法,并对比神经网络分类方法与这些典型分类方法在处理偏振多光谱图像中的效果,如表2所示。可以看出,神经网络分类方法效果最好,其次是最大似然分类方法。使用RBF内核的支持向量机方法和最小距离分类方法的分类效果最差。总体上看,神经网络分类方法相比其他分类方法,虽然需要较长时间进行训练,但训练完毕的神经网络可以快速地调用,训练好的网络处理一组24幅2448×2 048分辨率的图像数据用时约3~5 s,使用的计算机搭载一片NVIDIA GTX 1050显卡和一片Intel i5-7300 HQ处理器,与最大似然分类方法和最小距离分类方法相比耗时差距不大,二者较为接近。训练完毕的神经网络可以在保证快速性的同时,取得更佳的分类效果。
Classification method Training set accuracy Validation set accuracy Accuracy ranking Kappa coefficient Kappa coefficient ranking Network 97.3% 94.2% 1 0.898 1 MLC 95.3% 91.7% 3 0.851 3 MDC 76.5% 76.5% 5 0.584 5 SVM-RBF 71.9% 73.6% 6 0.456 6 SVM-linear 88.9% 85.5% 4 0.725 4 Table 2. Comparison of different classification methods
Polarized multispectral image classification of typical ground objects based on neural network (Invited)
doi: 10.3788/IRLA20220249
- Received Date: 2022-04-10
- Rev Recd Date: 2022-05-10
- Publish Date: 2022-07-05
-
Key words:
- polarized multispectral image /
- image classification /
- BP neural network
Abstract: Compared with the traditional multispectral imaging detection, polarized multispectral imaging detection can detect more information of the detected object surface such as roughness and moisture content, which brings great convenience to target detection. However, at present, it is mainly used for target detection and not widely used in target classification. BP neural network is a typical neural network commonly used at present. Neural network can establish the start-to-end mapping. On the premise that the training sample set is large enough, the trained neural network with good consequences is an efficient, accurate and high-speed tool. Firstly, the polarized multispectral images of typical ground objects were obtained by using the polarized multispectral imaging detection system based on rotating polarizer and filter, and after the images were preprocessed, the data set could be established; Secondly, the neural network was trained on this data set. The trained neural network could process the unknown polarized spectrum images and realize the classification of several typical ground objects; Finally, the effect of neural network classification was evaluated and compared with several other typical classification methods. It was found that the neural network method has better classification accuracy and effect. Compared with the typical maximum likelihood classification algorithm, its overall classification accuracy could be improved from 91.7% to 94.2%, and the Kappa coefficient could be improved from 0.851 to 0.898. The results show that the polarized multispectral image classification method based on neural network has certain research significance for improving and optimizing the existing data processing methods of polarized multispectral images.