留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

机器学习结合激光诱导击穿光谱技术铁矿石分类方法

杨彦伟 张丽丽 郝晓剑 张瑞忠

杨彦伟, 张丽丽, 郝晓剑, 张瑞忠. 机器学习结合激光诱导击穿光谱技术铁矿石分类方法[J]. 红外与激光工程, 2021, 50(5): 20200490. doi: 10.3788/IRLA20200490
引用本文: 杨彦伟, 张丽丽, 郝晓剑, 张瑞忠. 机器学习结合激光诱导击穿光谱技术铁矿石分类方法[J]. 红外与激光工程, 2021, 50(5): 20200490. doi: 10.3788/IRLA20200490
Yang Yanwei, Zhang Lili, Hao Xiaojian, Zhang Ruizhong. Classification of iron ore based on machine learning and laser induced breakdown spectroscopy[J]. Infrared and Laser Engineering, 2021, 50(5): 20200490. doi: 10.3788/IRLA20200490
Citation: Yang Yanwei, Zhang Lili, Hao Xiaojian, Zhang Ruizhong. Classification of iron ore based on machine learning and laser induced breakdown spectroscopy[J]. Infrared and Laser Engineering, 2021, 50(5): 20200490. doi: 10.3788/IRLA20200490

机器学习结合激光诱导击穿光谱技术铁矿石分类方法

doi: 10.3788/IRLA20200490
基金项目: 国家自然科学基金(6147326);山西省自然科学基金(201901D111162);2020年山西省高等学校科技创新项目(2020L0677);山西省“1331工程”重点学科建设计划经费资助
详细信息
    作者简介:

    杨彦伟,男,博士生,研究方向为激光诱导击穿光谱、光谱分析

  • 中图分类号: O433.4

Classification of iron ore based on machine learning and laser induced breakdown spectroscopy

  • 摘要: 铁矿石是非常重要的矿产资源,它的开发利用对钢铁产业的发展有很大的影响,铁矿石的选检与分类是冶金行业必不可少的环节,不同种类的铁矿石及其品质会直接影响与其他物质的配比,因此对铁矿石的选检分类研究在冶金行业具有重要意义。激光诱导击穿光谱技术(LIBS)是近年来发展起来的一项成分检测技术,具有无损、快速、原位在线检测等优点,在化学成分检测及样品分类领域有一定的优势。为了提高铁矿石的分类精度,提出将激光诱导击穿光谱技术与机器学习相结合对赤铁矿、褐铁矿、菱铁矿、云母赤铁矿、磁铁矿、磁赤铁矿、鲕状赤铁矿、黄铁矿、钴磁铁矿、磁黄铁矿等10种天然铁矿石进行分类研究。在研究中,首先通过激光诱导击穿光谱技术烧蚀10种天然铁矿石样品获得其对应的光谱数据;然后通过设定阈值的方法选定最大光谱强度对应的10个光谱特征;最后通过KNN、RF、SVM机器学习模型对选定的特征光谱进行分类训练及测试。结果表明:KNN、RF、SVM三种机器学习模型的分类准确度分别为83.0%、80.7%、90.3%。从分类准确度可以看出,激光诱导击穿光谱技术与机器学习相结合可以实现对铁矿石的快速、精确分类,这将为冶金行业的铁矿石选检分类提供一种全新的方法。
  • 图  1  实验装置的示意图

    Figure  1.  Schematic diagram of the experimental setup

    图  2  TM特征提取图

    Figure  2.  TM feature extraction diagram

    图  3  KNN原理图

    Figure  3.  Schematic diagram of KNN

    图  4  RF结构示意图

    Figure  4.  Structure of the RF

    图  5  二维线性分类超平面

    Figure  5.  Hyperplane of 2D linear classification

    图  6  (a)黄铁矿特征;(b) 10种矿石光谱特征

    Figure  6.  (a) Characteristic plot of pyrite; (b) Spectral characteristics of 10 ores

    图  7  分类模型混淆矩阵。(a) KNN;(b) RF;(c) SVM

    Figure  7.  Confusion matrix of classification model. (a) KNN; (b) RF; (c) SVM

  • [1] Zhang Bo, Min Hong, Liu Shu, et al. X-Ray fluorescence spectroscopy combined with discriminant analysis to identify imported iron ore origin and brand: Application development [J]. Spectroscopy and Spectral Analysis, 2020, 41(1): 258-291. (in Chinese)
    [2] Chen Jinzhong, Ma Ruiling, Chen Zhenyu, et al. Enhancement effect of carbon chamber confinement on laser plasma radiation [J]. Optics and Precision Engineering, 2013, 21(8): 1942-1948. (in Chinese) doi:  10.3788/OPE.20132108.1942
    [3] Choi S U, Han S C, Yun J I. Hydrogen isotopic analysis using molecular emission from laser-induced plasma on liquid and frozen water [J]. Spectrochimica Acta Part B: Atomic Spectroscopy, 2019, 162: 105716. doi:  10.1016/j.sab.2019.105716
    [4] Vanselow C, Stöbener D, Kiefer J, et al. Revealing the impact of laser-induced breakdown on a gas flow [J]. Measurement Science and Technology, 2019, 31(2): 027001.
    [5] Mei Yaguang, Cheng Yuxin, Cheng Shusen, et al. Simultaneous analysis of Si, Mn and Ti segregation in pig iron by laser-induced breakdown spectroscopy [J]. Infrared and Laser Engineering, 2018, 47(8): 0806003. (in Chinese) doi:  10.3788/IRLA201847.0806003
    [6] Wang Xianshuang, Guo Shuai, Xu Xiangjun, et al. Fast recognition and classification of tetrazole compounds based on laser-induced breakdown spectroscopy and raman spectroscopy [J]. Chinese Optics, 2019, 12(4): 888-895. (in Chinese) doi:  10.3788/co.20191204.0888
    [7] Li Ang'ze, Wang Xianshuang, Xu Xiangjun, et al. Fast classi-fication of tobacco based on laser-induced breakdown spectroscopy [J]. Chinese Optics, 2019, 12(5): 1139-1146. (in Chinese) doi:  10.3788/co.20191205.1139
    [8] Li Yeqiu, Sun Chenglin, Li Qian, et al. Analysis of the heavy metals in atmospheric particulate matter using dual-pulsed laser-induced breakdown spectroscopy [J]. Infrared and Laser Engineering, 2019, 48(10): 1005006. (in Chinese) doi:  10.3788/IRLA201948.1005006
    [9] Gazeli O, Bellou E, Stefas D, et al. Laser-based classification of olive oils assisted by machine learning [J]. Food Chemistry, 2020, 302(1): 1-7.
    [10] Peng Haobin, Chen Guohua, Chen Xiaoxian, et al. Hybrid classification of coal and biomass by laser-induced breakdown spectroscopy combined with K-means and SVM [J]. Plasma Science and Technology, 2019, 21(3): 64-72.
    [11] Diaz D, Hahn D W, Molina A, et al. Evaluation of Laser-Induced Breakdown Spectroscopy (LIBS) as a measurement technique for evaluation of total elemental concentration in soils [J]. Applied Spectroscopy, 2012, 66(1): 99-106. doi:  10.1366/11-06349
    [12] Li Xiaohui, Yang Sibo, Fan Rongwei, et al. Discrimination of soft tissues using laser-induced breakdown spectroscopy in combination with k nearest neighbors (kNN) and support vector machine (SVM) classifiers [J]. Optics and Laser Technology, 2018, 102: 233-239. doi:  10.1016/j.optlastec.2018.01.028
    [13] Wang P, Li N, Yan C, et al. Rapid quantitative analysis of the acidity of iron ore by laser-induced breakdown spectroscopy (LIBS) technique coupled with variable importance measurement-random forest (VIM-RF) [J]. Analytical Methods, 2019, 11(27): 1-10.
    [14] Zhao Yun, Guindo M L, Xu Xing, et al. Deep learning associated with laser-induced breakdown spectroscopy (LIBS) for the prediction of lead in soil [J]. Applied Spectroscopy, 2019, 73(5): 565-573. doi:  10.1177/0003702819826283
  • [1] 吴鹏飞, 邓植中, 雷思琛, 谭振坤, 王姣.  基于激光散斑图像多特征参数的表面粗糙度建模研究 . 红外与激光工程, 2023, 52(12): 20230348-1-20230348-11. doi: 10.3788/IRLA20230348
    [2] 李欣, 吕正一, 崔博伦, 张家铭, 刘紫莹, 黄荀, 赵天卓.  共轴变焦激光诱导击穿光谱定量分析 . 红外与激光工程, 2023, 52(12): 20230310-1-20230310-12. doi: 10.3788/IRLA20230310
    [3] 杨彦伟, 郝晓剑, 潘保武, 张瑞忠, 刘烨坤, 孙鹏, 郝文渊.  基于腔体约束激光诱导击穿铝土矿光谱的参数优化 . 红外与激光工程, 2022, 51(3): 20210661-1-20210661-7. doi: 10.3788/IRLA20210661
    [4] 王文君, 徐娜.  一种面向光纤网络路径优化的机器学习改进算法 . 红外与激光工程, 2021, 50(10): 20210185-1-20210185-6. doi: 10.3788/IRLA20210185
    [5] 马维喆, 董美蓉, 黄泳如, 童琪, 韦丽萍, 陆继东.  激光诱导击穿光谱的飞灰碳含量定量分析方法 . 红外与激光工程, 2021, 50(9): 20200441-1-20200441-10. doi: 10.3788/IRLA20200441
    [6] 李彬彬, 谢欢, 童小华, 叶丹, 孙凯鹏, 李铭.  基于随机森林的ICESat-2卫星数据地表覆盖分类 . 红外与激光工程, 2020, 49(11): 20200292-1-20200292-7. doi: 10.3788/IRLA20200292
    [7] 余熠, 孔令豹, 张海涛, 徐敏, 王丽萍.  基于神经网络的机器人抛光材料去除提升模型 . 红外与激光工程, 2019, 48(3): 317005-0317005(8). doi: 10.3788/IRLA201948.0317005
    [8] 王金梅, 颜海英, 郑培超, 薛淑文.  激光诱导土壤等离子体光谱辐射实验参数优化 . 红外与激光工程, 2018, 47(12): 1206011-1206011(7). doi: 10.3788/IRLA201847.1206011
    [9] 张东阁, 傅雨田.  基于一类支持向量机的盲元检测方法 . 红外与激光工程, 2018, 47(4): 404001-0404001(7). doi: 10.3788/IRLA201847.0404001
    [10] 梅亚光, 程宇心, 程树森, 郝中骐, 郭连波, 李祥友, 曾晓雁.  基于激光诱导击穿光谱技术的生铁中硅锰钛偏析的同步分析 . 红外与激光工程, 2018, 47(8): 806003-0806003(8). doi: 10.3788/IRLA201847.0806003
    [11] 吴军伟, 缪玲娟, 李福胜, 沈军.  改进支持向量机的光纤陀螺温度漂移补偿方法 . 红外与激光工程, 2018, 47(5): 522003-0522003(6). doi: 10.3788/IRLA201847.0522003
    [12] 张文涛, 李跃文, 占平平, 熊显名.  基于太赫兹时域光谱技术与PCA-SVM的转基因大豆油鉴别研究 . 红外与激光工程, 2017, 46(11): 1125004-1125004(6). doi: 10.3788/IRLA201746.1125004
    [13] 李雄威, 王哲, 刘汉强, 郭桦.  基于激光诱导击穿光谱的燃煤热值定量分析 . 红外与激光工程, 2017, 46(7): 734001-0734001(5). doi: 10.3788/IRLA201746.0734001
    [14] 刘源, 谢睿达, 赵琳, 郝勇.  基于机器学习的大视场星敏感器畸变在轨标定技术 . 红外与激光工程, 2016, 45(12): 1217004-1217004(9). doi: 10.3788/IRLA201645.1217004
    [15] 张东阁, 傅雨田.  基于在线最小二乘支持向量机的变形镜建模与控制 . 红外与激光工程, 2016, 45(11): 1118007-1118007(7). doi: 10.3788/IRLA201645.1118007
    [16] 李文宏, 尚丽平, 武志翔, 王芮雯, 周强.  水泥中Al 和Fe 的激光诱导击穿光谱测量分析 . 红外与激光工程, 2015, 44(2): 508-512.
    [17] 韩军, 常波, 路邵军, 吴玲玲, 占春连.  SVM 的光栅成像光谱仪图像畸变校准方法 . 红外与激光工程, 2014, 43(9): 3099-3104.
    [18] 卞春江, 余翔宇, 侯晴宇, 张伟.  最小化支持向量数分类器的云检测 . 红外与激光工程, 2014, 43(6): 1818-1822.
    [19] 陈金忠, 白津宁, 宋广聚, 孙江, 魏艳红.  激光诱导击穿光谱技术测定土壤中元素Cr和Pb . 红外与激光工程, 2013, 42(4): 947-950.
    [20] 秦玉华, 丁香乾, 宫会丽.  高维特征选择方法在近红外光谱分类中的应用 . 红外与激光工程, 2013, 42(5): 1355-1359.
  • 加载中
图(7)
计量
  • 文章访问数:  655
  • HTML全文浏览量:  152
  • PDF下载量:  97
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-12-10
  • 修回日期:  2021-01-25
  • 刊出日期:  2021-05-21

机器学习结合激光诱导击穿光谱技术铁矿石分类方法

doi: 10.3788/IRLA20200490
    作者简介:

    杨彦伟,男,博士生,研究方向为激光诱导击穿光谱、光谱分析

基金项目:  国家自然科学基金(6147326);山西省自然科学基金(201901D111162);2020年山西省高等学校科技创新项目(2020L0677);山西省“1331工程”重点学科建设计划经费资助
  • 中图分类号: O433.4

摘要: 铁矿石是非常重要的矿产资源,它的开发利用对钢铁产业的发展有很大的影响,铁矿石的选检与分类是冶金行业必不可少的环节,不同种类的铁矿石及其品质会直接影响与其他物质的配比,因此对铁矿石的选检分类研究在冶金行业具有重要意义。激光诱导击穿光谱技术(LIBS)是近年来发展起来的一项成分检测技术,具有无损、快速、原位在线检测等优点,在化学成分检测及样品分类领域有一定的优势。为了提高铁矿石的分类精度,提出将激光诱导击穿光谱技术与机器学习相结合对赤铁矿、褐铁矿、菱铁矿、云母赤铁矿、磁铁矿、磁赤铁矿、鲕状赤铁矿、黄铁矿、钴磁铁矿、磁黄铁矿等10种天然铁矿石进行分类研究。在研究中,首先通过激光诱导击穿光谱技术烧蚀10种天然铁矿石样品获得其对应的光谱数据;然后通过设定阈值的方法选定最大光谱强度对应的10个光谱特征;最后通过KNN、RF、SVM机器学习模型对选定的特征光谱进行分类训练及测试。结果表明:KNN、RF、SVM三种机器学习模型的分类准确度分别为83.0%、80.7%、90.3%。从分类准确度可以看出,激光诱导击穿光谱技术与机器学习相结合可以实现对铁矿石的快速、精确分类,这将为冶金行业的铁矿石选检分类提供一种全新的方法。

English Abstract

    • 铁矿石是钢铁冶金行行业的主要原料,近年来,我国钢铁工业发展迅速,对铁矿石需求也增长迅速,国内铁矿石不足以满足需求,导致铁矿石进口量大幅增加,我国成为世界铁矿石最大的进口国[1]。铁矿石的质量和类型与冶金工艺和技术经济指标密切相关。决定铁矿石质量的主要因素是化学成分,铁矿石的准确分类对冶金行业原料的获取具有重要意义。

      激光诱导击穿光谱法(LIBS)是一种原子发射光谱法,在过去的20年里发展迅速。众所周知,它在定性和定量分析中显示出巨大的潜力。它具有许多优点,例如原位测量,无需样品制备,灵敏度高,对样品几乎无损。无论样品是固体[2]、液体[3]还是气体[4],都可以进行元素检测。因此,LIBS技术已广泛应用于钢铁[5]、医学[6]、烟草[7]和环境[8]等各个领域。

      当前,越来越多的机器学习算法与LIBS结合使用,以对样本进行更准确的分类、回归、聚类等。Odhisea Gazeli等人[9]提出了一种高效、快速的橄榄油分类方法,该方法将LIBS与机器学习算法相结合来检测光谱信息,当使用线性判别分析(LDA)算法建立预测模型时,准确率高达99.2%。彭浩斌等人[10]提供了一种能够处理煤、城市污泥和生物质等物质分类的新技术,结果表明,当K均值和支持向量机(SVM)协同工作时,混合分类模型的准确度超过98%。Daniel Diaz等人[11]将LIBS和主成分分析(PCA)应用于金矿石的分类,结果表明:PCA识别Au发射谱线的能力与LIBS光谱宽度有很大关系,当以Au发射谱线为中心,光谱范围为0.15 nm时,PCA的性能最佳。同时,Au颗粒的大小对原始光谱数据的采集也有很大的影响。李晓慧等人[12]提出了结合LIBS的多元统计方法来完成对脂肪、皮肤、肌肉等软组织的判别,使用K最近邻(KNN)和SVM建立模型,并使用10倍交叉验证评估模型的鲁棒性和准确性,结果表明,使用KNN和SVM分类器时,准确率超过99.83%,灵敏度超过0.995,采用SVM核函数时,高度相似的火腿、腰肉和里脊肉的鉴别性能是可以接受的。王平等人[13]提出了一种LIBS技术结合可变重要性保证随机森林(VIM-RF)来完成铁矿石酸度分析的方法,所得结果表明,VIM-RF模型的性能优于偏最小二乘(PLS)。最小二乘支持向量机(LS-SVM),均方根误差(RMSE)=0.055 4 wt%,R2=0.910 3。类似的方法也用于检测聚丙烯中的有毒元素,并可以实现塑料垃圾的实时监控。赵云等人[14]开发了一种基于LIBS和深度信念网络(DBN)的方法来检测被Pb污染的土壤,结果表明:深度学习可以处理LIBS数据并强调使用样本的重要性,样本的总准确度值为98.47% (训练集)和90.625% (测试集)。

      在文中,LIBS技术与不同的机器学习算法相结合,用于完成不同铁矿石的快速、精确分类。首先,利用TM特征选取法降低了原始数据的维数,获得了10种铁矿石的10维光谱数据。然后使用KNN、RF和SVM算法对铁矿石进行分类。最后,评估了这三个模型的准确性和鲁棒性。

    • LIBS实验装置的示意图如图1所示。文中使用的激光器是法国Quantel公司的Nd:YAG激光器,最大频率10 Hz,最大脉冲能量200 mJ,波长1 064 nm,脉冲持续时间10 ns;光谱仪采用的是荷兰Avantes公司的七通道宽幅光谱仪,光谱范围为190~950 nm,光谱分辨率为0.1 nm,可以由外部TTL电平或输出电平来触发外部设备。样品台为可自由控制的XYZ轴的样品台,样品台的行程为5 cm,可以实现微米级(<1 μm)的高精度定位控制。

      图  1  实验装置的示意图

      Figure 1.  Schematic diagram of the experimental setup

      文中实验中使用的10种铁矿石样品来自地质研究所,分别是赤铁矿、褐铁矿、菱铁矿、云母赤铁矿、磁铁矿、磁赤铁矿、鲕状赤铁矿、黄铁矿、钴磁铁矿、磁黄铁矿。它们都是未经任何化学处理的天然矿石,因此可以认为它们具有独特的地理特性。

      选择矿石相对平坦的一侧将其固定在三维样品台上。将激光能量设定为50 mJ,波长1 064 nm,聚焦后的光斑大小为75 μm,重复频率2 Hz,采集光谱延迟时间1 μs。在每个矿石5个不同的位置进行烧蚀,每个位置以矩阵形式烧蚀9个点,每个样品收集45组独立的光谱数据,10种矿石样品共计450组光谱数据用于后续分析。

    • 特征选择即从原始数据获得相关特征的子集。在文中收集的LIBS数据具有12 248个变量,其中大多数是低强度和无信息的变量。适当的特征选择有助于减少训练时间,克服维数的冗余并提高预测性能。阈值方法(Threshold Method,TM)是一种简单的功能选择方法。它保留所有值大于给定阈值(T)的变量。考虑到LIBS数据的峰值具有最重要的信息,设置阈值以提取强度大于T的变量,以达到降维目的。在文中,采用TM从LIBS数据中提取特征,计算一种矿石的每一维数据平均值,依据平均值大小,选取10维数据作为相应矿石的特征数据。这样可以获得10种矿石的10维特征数据,作为后续算法的特征输入,特征提取如图2所示。

      图  2  TM特征提取图

      Figure 2.  TM feature extraction diagram

    • K-近邻(K-Nearest Neighbor, KNN)分类算法是通过不同特征值之间的距离值进行分类的机器学习算法,属于有监督学习的一种,训练数据都有相应的标签类别。算法的基本思想是根据欧几里得距离判定未知数据特征与哪一类数据特征最接近,进而确定分类归属,原理如图3所示。红色圆点属于一类,蓝色三角型属于另一类,绿色正方形属于测试样本,当K=2时,绿色正方形属于红色圆点一类,当K=3时,绿色正方形属于蓝色三角形一类,KNN分类算法精度与K值的选取有关。

      图  3  KNN原理图

      Figure 3.  Schematic diagram of KNN

      根据训练样本类别来决策测试样本的类别。KNN算法可以用于分类,通过找出一个样本的K个最近邻居,将这些邻居属性的平均值赋给该样本,就可以得到该样本的属性。欧几里得距离公式为:

      $$d(x,y) = \sqrt {\sum\limits_{i = 1}^n {{{({x_i} - {y_i})}^2}} } $$ (1)

      式中:${x_i}$为训练样本集中第i类样本;${y_i}$为测试样本的第i类样本;n为空间维数。KNN分类算法主要步骤如下:

      (1)确定K值,计算未知对象与训练集中样本对象的距离;

      (2)找到K个最近距离对象;

      (3) K个近邻中出现类别最多的即为未知对象的类别属性。

    • 随机森林(Random Forest, RF)是机器学习的先进算法。它是一个分类器,由树型分类器的集合组成。每个树型分类器都使用自主抽样法构造唯一训练集。基于自主抽样技术可用来连续生成训练和测试集。训练集生成带有RF的多分类树。基于该组合的最终预测结果通过单个分类树的简单多数表决获得。RF中类信息定义如下:

      $$ I(X = {x_i}) = - {\log _2}p({x_i}) $$

      式中:$I(x)$为随机变量;$p({x_i})$为概率。RF通过组合多个分类器进行预测,示意图如图4所示。

      RF算法步骤如下:

      (1)利用自主抽样方法从原始光谱数据中选取n个样品构成训练集;

      (2)重复步骤(1),得到T1个训练集,产生一片“森林”;

      (3)利用“森林”中的T1颗树对样本进行测试;

      (4)针对T1个分类结果,采用投票方式决定分类归属。

      图  4  RF结构示意图

      Figure 4.  Structure of the RF

    • 支持向量机(Support Vector Machine,SVM)是一种基于统计学理论的强大的学习方法。SVM最初的目的是解决二进制分类问题,为了促使数据类别更好地分离,它在多维空间中使用了线性函数的假设平面。SVM与传统的学习算法不同,传统的学习算法旨在降低经验风险,SVM是基于结构风险进行算法构建,因此SVM更具普及性。SVM解决分类问题关键在于找一个超平面,使两不同的特征的样品分开,如图5中二维特征,对于特定数据集${({x}_{i},{y}_{i})\;,} \; i= {1}{,} $$ {2},\cdots n,x\in {R}^{n},y\in {{}+{1},{-1}}$,存在一条直线使特征样品分布在其两侧,标准支持向量分类器为:

      $$\begin{split} &\\ y_i[w \cdot x_i + b] - 1 \geqslant 0,i = 1,2 \cdots ,N \end{split}$$ (2)

      实际应用中分类样本是非线性的,需要将训练样本映射到高维空间,在其高维空间中进行超平面构造,这种映射关系通过设计核函数来实现。在分类中常用的核函数有以下四种类型:

      (1)线性核函数:$K(x,x') = (x \cdot x')$

      (2)多项式核函数$K(x,x') = {((x \cdot x') + 1)^q}$

      (3) RBF核函数$K(x,x') = \exp { \Bigg(}\dfrac{{{{\left\| {x - x'} \right\|}^2}}}{{2{\sigma ^2}}}{{ \Bigg)}}$

      (4) sigmoid函数$K(x,x') = \tanh (x \cdot x') + c)$

      对于高维的LIBS数据,传统的化学计量算法(例如PLS、PCA等)无法有效处理高维特征向量。但是,由于SVM具有良好的全局收敛性,因此能够灵活地确定高维特征空间中的边界,因为SVM在处理非线性、高维和小样本数据等方面具有出色的性能和便利性,因此在化学计量学中被广泛用于解决各种问题。SVM算法主要步骤如下:

      (1)对于不同的矿石样品数据,任意两样本数据构造一个SVM,k类需建立K (K−1)/2个分类器;

      (2)通过分类器表决决定分类结果。

      文中上述算法均在python3.8.2b版本、jupyter notebook开发环境实现。将LIBS特征数据随机分成两部分,分别以占总数据70%的训练集和占总数据30%的测试集来检验模型的准确率。

      图  5  二维线性分类超平面

      Figure 5.  Hyperplane of 2D linear classification

    • 由于其他矿石的光谱太稠密,因此黄铁矿的光谱用于表示矿石中的一般元素,如图6(a)所示。根据美国国家标准技术研究院(NIST)的数据,从光谱数据中观察到了非金属元素(C、H、O、N、S)和金属元素(Mg、Ca、Mo、Fe),从元素的强度来看,近似地表达了矿石的元素组成含量。图6(b)显示了10种矿石的所有光谱线。可以看到,不同矿石之间的光谱强度存在明显差异。例如,在含钴磁铁矿中激发的铁元素的强度比在磁铁矿中激发的铁元素强度大得多,但是可以清楚地检测到磁铁矿中碳的存在。对于赤铁矿、橄榄岩赤铁矿、云母赤铁矿和磁赤铁矿,它们的元素类型大致相同,应注意的是,Al 308.702 nm和Na 589.592 nm处的云母赤铁矿光谱强度明显高于其他三个。对于其余四种矿石,它们的光谱线不像以前那么稠密,尤其是黄铁矿,激发的光谱线非常稀疏。在Mg 278.141 nm处,黄铁矿谱线的强度远大于磁黄铁矿谱线的强度,在K 766.489 nm处,黄铁矿谱图和褐铁矿谱图的强度基本上都检测不到,表明没有钾。总而言之,这么多光谱数据特征的存在使矿石分类更易操作。

      图  6  (a)黄铁矿特征;(b) 10种矿石光谱特征

      Figure 6.  (a) Characteristic plot of pyrite; (b) Spectral characteristics of 10 ores

      文中将实验部分获得的450组12228维全光谱数据利用TM方法进行特征选择,首先对12228维数据中每一维数据强度进行平均值计算,然后选取强度平均值最大的前10维数据作为文中分类模型的特征数据。450组10维数据按照70%与30%分为训练集与测试集。将这些特征数据输入分类模型进行分类。

      通过以上TM方法对全光谱数据进行强度特征值选取后,10个最大强度特征信息可以大致代表光谱的所有信息,这些成分被用作分类的输入特征。首先,在训练数据集上实施KNN算法,计算从5个最近点到测试点的距离并将其存储在数组中,选择数组的多数类并将其作为测试点的类别。KNN模型的相应混淆矩阵如图7(a)所示,模型的准确性为83.0%;然后用RF模型进行分类,准确性为80.7%,对应的混淆矩阵如图7(b)所示。最后,采用线性核支持向量机模型进行分类,该模型的判别精度为90.3%,判别性能优于上述两个模型。SVM模型的相应混淆矩阵如图7(c)所示。文中影响分类准确度的因素主要来自两方面,一方面是对TM进行降维,TM仅从光谱强度单一因素进行了降维,在忽略低强度光谱信息的同时,忽略掉了特征维数之间的关联信息;另一方面是样本与算法本身属性,样品光谱数据有其自身独特的多维特征,SVM算法引入核函数建立超平面后,能够更细地区分不同类属的特征,因此较前两者,具有很好的分类效果。

      图  7  分类模型混淆矩阵。(a) KNN;(b) RF;(c) SVM

      Figure 7.  Confusion matrix of classification model. (a) KNN; (b) RF; (c) SVM

      结果表明,LIBS和机器学习算法的结合可以更好地完成铁矿石的分类。具有相似外观但实际元素组成差异较大的铁矿石可以被很好地区分。该技术可用于工业冶炼,不同的铁矿石具有不同的功能。例如,赤铁矿被用于制造颜料,黄铁矿是制造硫酸的重要原材料,磁铁矿被用于炼钢。因此,精确分类可以最大程度地提高利用率。在实验过程中,笔者没有对铁矿石进行复杂的预处理,如压碎、磨碎等。矿石表面的粗糙度会在一定程度上影响实验结果,但是未经预处理的数据也保留了矿石的原始特征,这表明该技术可用于快速实时检测。

    • 利用激光诱导击穿光谱技术与机器学习结合对铁矿石进行分类是可行的。铁矿石光谱信息包含了铁矿石的元素组成及含量信息。文中利用设置强度阈值方法对全光谱数据进行了降维处理,建立KNN、RF、SVM三种分类模型。分类结果表明,光谱强度值是铁矿石的主要特征,应用最大强度值方法获得特征光谱进行分类,得到了比较好的分类结果。KNN、RF、SVM三种分类模型的准确度分别为83.0%、80.7%、90.3%。对于天然铁矿石分类,支持向量机分类模型准确率最高。激光诱导击穿光谱技术与机器学习相结合可以实现对铁矿石的快速、精确分类,这将为冶金行业的铁矿石选检分类提供一种全新的方法。

参考文献 (14)

目录

    /

    返回文章
    返回