留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于时序Sentinel-2影像的现代农业园区作物分类研究

张东彦 戴震 徐新刚 杨贵军 孟炀 冯海宽 洪琪 姜飞

张东彦, 戴震, 徐新刚, 杨贵军, 孟炀, 冯海宽, 洪琪, 姜飞. 基于时序Sentinel-2影像的现代农业园区作物分类研究[J]. 红外与激光工程, 2021, 50(5): 20200318. doi: 10.3788/IRLA20200318
引用本文: 张东彦, 戴震, 徐新刚, 杨贵军, 孟炀, 冯海宽, 洪琪, 姜飞. 基于时序Sentinel-2影像的现代农业园区作物分类研究[J]. 红外与激光工程, 2021, 50(5): 20200318. doi: 10.3788/IRLA20200318
Zhang Dongyan, Dai Zhen, Xu Xingang, Yang Guijun, Meng Yang, Feng Haikuan, Hong Qi, Jiang Fei. Crop classification of modern agricultural park based on time-series Sentinel-2 images[J]. Infrared and Laser Engineering, 2021, 50(5): 20200318. doi: 10.3788/IRLA20200318
Citation: Zhang Dongyan, Dai Zhen, Xu Xingang, Yang Guijun, Meng Yang, Feng Haikuan, Hong Qi, Jiang Fei. Crop classification of modern agricultural park based on time-series Sentinel-2 images[J]. Infrared and Laser Engineering, 2021, 50(5): 20200318. doi: 10.3788/IRLA20200318

基于时序Sentinel-2影像的现代农业园区作物分类研究

doi: 10.3788/IRLA20200318
基金项目: 安徽省科技重大专项(18030701209);国家重点研发计划(2017YFD0201501);现代农业产业技术体系建设专项(CARS-03);农业生态大数据分析与应用技术国家地方联合工程研究中心开放课题(AE2019011)
详细信息
    作者简介:

    张东彦,男,教授,博士生导师,博士,主要从事计算机视觉、机器/深度学习、光谱信息处理及大数据、物联网等技术在农业和环境监测上的应用研究

    戴震,男,硕士生,主要从事农业遥感与信息技术方面的研究

    通讯作者: 徐新刚,男,研究员,博士,主要从事农业定量遥感应用基础方面的研究。
  • 中图分类号: TP79; S127

Crop classification of modern agricultural park based on time-series Sentinel-2 images

  • 摘要: 快速、准确地掌握作物空间分布,估算不同作物种植面积及范围,这对制定宏观农业政策并指导农民进行农业生产具有重要意义。以我国内蒙古自治区扎赉特旗现代农业示范园区为研究区域,基于2019年5月至10月共9景多时相Sentinel-2卫星遥感影像,通过计算并分析不同作物归一化差值植被指数(NDVI)、比值植被指数(RVI)、增强型植被指数(EVI)等多种典型植被指数和近红外波段Ref(NIR)的时序变化特征,采用随机森林(Random Forest, RF)、决策树(Decision Tree, DT)、支持向量机(Support Vector Machine, SVM)和最大似然法(Maximum Likelihood, ML)4种分类方法对研究区多种作物进行分类识别,成功提取园区内主要作物(水稻、玉米、甜叶菊、旱稻和大豆等)空间分布情况。将RF结果与DT、SVM和ML分类结果对比,结果显示,RF总体分类精度最高,达到95.8%,Kappa系数为0.944;DT、SVM和ML分类精度分别为92.2%、91.6%和86.5%。上述研究结果表明,多时相Sentinel-2遥感影像经过光谱指数时序变化特征提取后,利用随机森林算法进行作物分类可得到精度较高的结果,这为精细指导规模化园区农业生产提供了有效的技术支持。
  • 图  1  研究区地理位置及样本分布示意图

    Figure  1.  Geographical location and sample distributions of the study area

    图  2  各作物NDVI (a)、RVI (b)、EVI (c)、Ref (NIR) (d)时序变化

    Figure  2.  Temporal changes of NDVI (a), RVI (b), EVI (c) and Ref (NIR) (d) for main crops

    图  3  作物分类提取流程图

    Figure  3.  Flow chart of crop classification extraction

    图  4  采用决策树(a)、随机森林(b)、支持向量机(c)、最大似然法(d)的作物分类结果

    Figure  4.  Crop classification results using Decision Tree (a), Random Forest (b), Support Vector Machine (c), Maximum Likelihood (d)

    表  1  研究区5种主要作物生育期

    Table  1.   Growth period of five crops in the study area

    TypeMayJuneJulyAugustSeptemberOctober
    EMLEMLEMLEMLEMLEM
    RiceSowingTilleringHeadingFillingMaturity
    SoybeanSowingSeedingFloweringPoddingFillingMaturity
    SteviaTransplantingBranchingFloweringMaturity
    CornSowingSeedingJointingTasselingFillingMaturity
    Dry riceSowingTilleringHeadingFillingMaturity
    Note: E means the early 10 days of a month,M is the middle 10 days,and L represents the lately 10 days.
    下载: 导出CSV

    表  2  Sentinel-2影像数据列表

    Table  2.   Data lists of Sentinel-2 images

    Data timeSensorQuality
    2019-05-22 Sentinel-2A Best
    2019-06-11 Sentinel-2A Good
    2019-06-21 Sentinel-2A Best
    2019-07-01 Sentinel-2A Good
    2019-08-15 Sentinel-2B Best
    2019-08-30 Sentinel-2A Best
    2019-09-14 Sentinel-2B Best
    2019-09-24 Sentinel-2B Best
    2019-10-04 Sentinel-2B Best
    下载: 导出CSV

    表  3  Sentinel-2传感器光谱波段(S2A和S2B)

    Table  3.   Spectral bands of the Sentinel-2 sensors (S2A & S2B)

    Sentinel-2 bandsWavelength/μmReflection/m
    Band1-Coastal aerosol 0.443 60
    Band2-Blue 0.490 10
    Band3-Green 0.560 10
    Band4-Red 0.665 10
    Band5-Vegetation red edge 0.705 20
    Band6-Vegetation red edge 0.740 20
    Band7-Vegetation red edge 0.783 20
    Band8-NIR 0.842 10
    Band8A-Vegetation red edge 0.865 20
    Band9-Water vapour 0.945 60
    Band10-SWIR-Cirrus 1.375 60
    Band11-SWIR1 1.610 20
    Band12-SWIR2 2.190 20
    下载: 导出CSV

    表  4  笔者研究中分类指标列表

    Table  4.   Classification indicators used in the study

    IndicatorDescriptionSource
    Normalized Difference Vegetation Index(NDVI) ${\rm NDVI} = \dfrac{ { {\rho _{\rm NIR} } - {\rho _{\rm RED} } } }{ { {\rho _{\rm NIR} } + {\rho _{\rm RED} } } }$ Ref.[15]
    Ratio Vegetation Index(RVI) ${\rm RVI} = \dfrac{ { {\rho _{\rm NIR} } } }{ { {\rho _{\rm RED} } } }$ Ref. [16]
    Enhanced Vegetation Index(EVI) ${\rm EVI} = 2.5×\dfrac{ { {\rho _{\rm NIR} } - {\rho _{\rm RED} } } }{ { {\rho _{\rm NIR} } + 6.0×{\rho _{\rm RED} } - 7.5×{\rho _{\rm BLUE} } + L} }$ Ref. [17-18]
    Near Infrared Ray(Ref(NIR)) The reflection of Band-8 in Tab.3 Ref. [19]
    Notes: In the formula, $ {\mathrm{\rho }}_{\mathrm{N}\mathrm{I}\mathrm{R}} $ is the near-infrared band reflectivity, $ {\mathrm{\rho }}_{\mathrm{R}\mathrm{E}\mathrm{D}} $ is the red band reflectivity, $ {\mathrm{\rho }}_{\mathrm{B}\mathrm{L}\mathrm{U}\mathrm{E}} $ is the blue band reflectivity and L is the soil adjustment coefficient of 1.
    下载: 导出CSV

    表  5  精度验证的计算公式

    Table  5.   Formulas of accuracy evaluation

    TypeCalculation formula
    Mapping accuracy $\mathrm{P}\mathrm{A}=\dfrac{ {X}_{ii} }{ {X}_{j} }×100\%$
    User accuracy $\mathrm{U}\mathrm{A}=\dfrac{ {X}_{ii} }{ {X}_{i} }×100\%$
    Overall accuracy $\mathrm{O}\mathrm{A}=\displaystyle\sum _{i=1}^{k}\dfrac{ {X}_{ii} }{N}×100\%$
    Kappa coefficient ${{K} } = \dfrac{ {N\displaystyle\sum\nolimits_{i = 1}^k { {X_{ii} } } - \sum\nolimits_{i = 1}^k { {X_i}{X_j} } } }{ { {N^2} - \displaystyle\sum\nolimits_{i = 1}^k { {X_i}{X_j} } } }$
    Notes: where k represents the number of rows and columns of the confusion matrix, Xii represents the value on the diagonal of the confusion matrix that is the number of pixels correctly classified, N represents the total number of pixels verified, Xi represents the i row of the confusion matrix. The sum of elements, Xj represents the sum of elements in the j column of the confusion matrix.
    下载: 导出CSV

    表  6  决策树混淆矩阵结果

    Table  6.   Confusion matrix result of Decision Tree

    TypeSoybeanRiceSteviaCornDry riceTotalUser accuracy
    Soybean3288400320361291.03%
    Rice056801633176590596.19%
    Stevia002039059209897.19%
    Corn0108451221867397.44%
    Dry rice8914710554820603979.81%
    Mapping accuracy99.76%99.75%92.60%88.57%86.13%
    下载: 导出CSV

    表  7  随机森林混淆矩阵结果

    Table  7.   Confusion matrix result of Random Forest

    TypeSoybeanRiceSteviaCornDry riceTotalUser accuracy
    Soybean3294000393368789.34%
    Rice0569219183216611093.16%
    Stevia00199308200199.60%
    Corn002930141934499.54%
    Dry rice421421024938518895.18%
    Mapping accuracy99.88%99.96%92.44%97.03%88.24%
    下载: 导出CSV

    表  8  各方法的分类总体精度和Kappa系数

    Table  8.   Overall accuracy estimation and Kappa coefficient of classification based on each method

    Classification methodOverall accuracyKappa coefficient
    Maximum Likelihood86.5%0.823
    Support Vector Machine91.6%0.890
    Decision Tree92.2%0.897
    Random Forest95.8%0.944
    下载: 导出CSV
  • [1] Zhao Chunjiang. Advances of research and application in remote sensing for agriculture [J]. Transactions of the Chinese Society for Agricultural Machinery, 2014, 45(12): 277-293. (in Chinese) doi:  10.6041/j.issn.1000-1298.2014.12.041
    [2] Zhao Zijuan, Liu Dong, Hang Zhongqiao. Research status and prospects of crop remote sensing recognition methods [J]. Jiangsu Agricultural Sciences, 2019, 47(16): 45-51. (in Chinese)
    [3] Yang Chenghai, James H Everitt, Dale Murden. Evaluating high resolution SPOT 5 satellite imagery for crop identification [J]. Computers and Electronics in Agriculture, 2010, 75(2): 347-354.
    [4] Shen Wenming, Wang Wenjie, Luo Haijiang, et al. Classification methods of remote sensing image based on decision tree technologies [J]. Remote Sensing Technology and Application, 2007, 22(3): 333-338. (in Chinese) doi:  10.3969/j.issn.1004-0323.2007.03.006
    [5] Tian Jing, Wang Juanle, Li Yifan, et al. Land cover classification in mongolian plateau based on decision tree method: A case study in Tov Province, Mongolia [J]. Journal of Geo-information Science, 2014, 16(3): 460-469. (in Chinese)
    [6] Friedl M A, Brodley C E, Strahler A H. Maximizing land cover classification accuracies produced by decision trees at continental to global scales [J]. IEEE Transactions on Geoscience & Remote Sensing, 1999, 37(2): 969-977.
    [7] Xu Xingang, Li Qiangzi, Zhou Wancun, et al. Classification application of quick bird imagery to obtain crop planting area [J]. Remote Sensing Technology and Application, 2008, 23(1): 17-23. (in Chinese)
    [8] Tan Kun, Du Peijun. Hyperspectral remote sensing images classification based on support vector machine [J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 123-128. (in Chinese) doi:  10.3321/j.issn:1001-9014.2008.02.010
    [9] Gu Xiaohe, Han Lijian, Zhang Jinshui, et al. Monitoring of paddy rice plant area based on similar index by multi-resolution remote sensing data [J]. Scientia Agricultura Sinica, 2008, 41(4): 978-985. (in Chinese) doi:  10.3864/j.issn.0578-1752.2008.04.006
    [10] Pan Chen, Du Peijun, Zhang Hairong. Decision tree classification and application in remote sensing image processing [J]. Science of Surveying and Mapping, 2008, 33(1): 208-211. (in Chinese) doi:  10.3771/j.issn.1009-2307.2008.01.065
    [11] Brfiman L. Random forests [J]. Machine Learning, 2001, 45(1): 5-32. doi:  10.1023/A:1010933404324
    [12] Li Cunjun, Wang Jihua, Liu Liangyun, et al. Land cover mapping of winter wheat and clover using muti-temporal Landsat NIR band in a growing season [J]. Transactions of the Chinese Society of Agricultural Engineering, 2005, 21(2): 96-101. (in Chinese) doi:  10.3321/j.issn:1002-6819.2005.02.021
    [13] Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop classification recognition based on time-series images from HJ satellite [J]. Transactions of the Chinese Society of Agricultural Engineering, 2013, 29(2): 169-176. (in Chinese)
    [14] Wei Pengfei, Xu Xingang, Yang Guijun, et al. Remote sensing classification of crops based on the change characteristics of multi-phase vegetation index [J]. Journal of Agricultural Science and Technology, 2019, 21(2): 54-61. (in Chinese)
    [15] Xu Qingyun, Yang Guijun, Long Huiling, et al. Crop information identification based on MODIS NDVI time-series data [J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(11): 134-144. (in Chinese) doi:  10.3969/j.issn.1002-6819.2014.11.017
    [16] An Qin, Chen Shengbo, Sun Shichao, et al. Study on corn yield estimation based on multi-temporal MODIS-RVI [J]. Geospatial Information, 2018, 16(3): 14-16, 8. (in Chinese) doi:  10.3969/j.issn.1672-4623.2018.03.004
    [17] Zhang Xia, Jiao Quanjun, Zhang Bing, et al. Preliminary study on cropping pattern mapping using MODIS_EVI image time series [J]. Transactions of the Chinese Society of Agricultural Engineering, 2008, 24(5): 161-165. (in Chinese) doi:  10.3321/j.issn:1002-6819.2008.05.035
    [18] Pan Yaozhong, Li Le, Zhang Jinshui, et al. Winter wheat area estimation from MODIS-EVI time series data using the Crop Proportion Phenology Index [J]. Remote Sensing of Environment, 2012, 119(3): 232-242.
    [19] Wang Limin, Liu Jia, Yang Fugui, et al. Rice recognition ability basing on GF-1 multi-temporal phases combined with near infrared data [J]. Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(23): 196-202. (in Chinese) doi:  10.11975/j.issn.1002-6819.2017.23.025
    [20] Liu Yi, Du Peijun, Zheng Hui, et al. Classification of China small satellite remote sensing image based on random forests [J]. Science of Surveying and Mapping, 2012, 37(4): 194-196. (in Chinese)
    [21] Balogun A L, Yekeen S T, Pradhan B, et al. Spatio-temporal analysis of oil spill impact and recovery pattern of coastal vegetation and wetland using multispectral Satellite Landsat 8-OLI Imagery and Machine Learning Models [J]. Remote Sensing, 2020, 12(7): 1225-1225. doi:  10.3390/rs12071225
    [22] Yu Haiyang, Zhao Gengxing, Chang Chunyan, et al. Random forest classifier in remote sensing information extraction: A review of applications and future development [J]. Remote Sensing Information, 2019, 34(2): 8-14. (in Chinese) doi:  10.3969/j.issn.1000-3177.2019.02.002
    [23] Sebastian van der Linden, Andreas Rabe, Matthias Held, et al. The en MAP-Box—A toolbox and application programming interface for en MAP data processing [J]. Remote Sensing, 2015, 7(9): 11249-11266. doi:  10.3390/rs70911249
  • [1] 郝建新, 王力.  基于红外温度序列的电路板故障诊断研究 . 红外与激光工程, 2023, 52(4): 20220492-1-20220492-12. doi: 10.3788/IRLA20220492
    [2] 李恒宽, 朴亨, 王鹏, 姜炎坤, 李峥, 陈晨, 曲娜, 白晖峰, 王彪, 李美萱.  基于近红外吸收光谱技术的高精度CO2检测系统的研制 . 红外与激光工程, 2023, 52(3): 20210828-1-20210828-7. doi: 10.3788/IRLA20210828
    [3] 蒋连军, 方余强, 余超, 徐起, 王雪峰, 马睿, 杜先常, 刘酩, 韦塔, 黄传成, 赵于康, 梁君生, 尚祥, 申屠国樑, 于林, 唐世彪, 张军.  微型化自由运行InGaAs/InP单光子探测器(特邀) . 红外与激光工程, 2023, 52(3): 20230017-1-20230017-8. doi: 10.3788/IRLA20230017
    [4] 苏晏园, 范广宇, 龚海梅, 李雪, 陈永平.  InGaAs近红外人脸图像检测超轻量算法研究 . 红外与激光工程, 2022, 51(10): 20220078-1-20220078-10. doi: 10.3788/IRLA20220078
    [5] 李安琦, 马丽, 于合龙, 张涵博.  改进的U-Net算法在遥感图像典型农作物分类研究 . 红外与激光工程, 2022, 51(9): 20210868-1-20210868-7. doi: 10.3788/IRLA20210868
    [6] 王雷光, 耿若筝, 代沁伶, 王军, 郑晨, 付志涛.  高光谱-LiDAR 融合的条件随机场分类方法 . 红外与激光工程, 2021, 50(12): 20210112-1-20210112-12. doi: 10.3788/IRLA20210112
    [7] 杨雷, 禹定峰, 高皜, 卞晓东, 刘晓燕, 盖颖颖, 安德玉, 周燕, 唐世林.  Sentinel-2的胶州湾水体透明度遥感反演 . 红外与激光工程, 2021, 50(12): 20210080-1-20210080-7. doi: 10.3788/IRLA20210080
    [8] 万李涛, 熊楠菲, 王栋, 汪子君.  信赖域方法在红外图像序列处理中的应用 . 红外与激光工程, 2020, 49(7): 20190505-1-20190505-7. doi: 10.3788/IRLA20190505
    [9] 李彬彬, 谢欢, 童小华, 叶丹, 孙凯鹏, 李铭.  基于随机森林的ICESat-2卫星数据地表覆盖分类 . 红外与激光工程, 2020, 49(11): 20200292-1-20200292-7. doi: 10.3788/IRLA20200292
    [10] 王静, 丁香乾, 王晓东, 韩凤, 韩冬, 曲晓娜.  基于深度信念网络的烟叶部位近红外光谱分类方法研究 . 红外与激光工程, 2019, 48(4): 404001-0404001(7). doi: 10.3788/IRLA201948.0404001
    [11] 邓学松, 方明, 吴博, 黄志祥.  倒梯形双层金属光栅式偏振分束器 . 红外与激光工程, 2019, 48(3): 320002-0320002(7). doi: 10.3788/IRLA201948.0320002
    [12] 荆滢, 齐乃新, 杨小冈, 卢瑞涛.  基于LK和FAST的时间序列图像快速配准算法 . 红外与激光工程, 2018, 47(11): 1126006-1126006(9). doi: 10.3788/IRLA201847.1126006
    [13] 潘洪涛, 王轩, 王晓飞.  训练样本对农作物遥感分类的精度影响研究 . 红外与激光工程, 2017, 46(S1): 143-150. doi: 10.3788/IRLA201746.S126003
    [14] 杨新锋, 胡旭诺, 粘永健.  基于分类的高光谱图像压缩算法 . 红外与激光工程, 2016, 45(2): 228003-0228003(4). doi: 10.3788/IRLA201645.0228003
    [15] 张采芳, 田岩, 李江.  基于几何特征分析的路面裂缝分类算法研究 . 红外与激光工程, 2015, 44(4): 1359-1364.
    [16] 杨磊, 傅俏燕, 潘志强, 张学文, 韩启金, 刘李.  高分一号卫星相机的辐射交叉定标研究 . 红外与激光工程, 2015, 44(8): 2456-2460.
    [17] 梁栋, 谢巧云, 黄文江, 彭代亮, 杨晓华, 黄林生, 胡勇.  最小二乘支持向量机用于时间序列叶面积指数预测 . 红外与激光工程, 2014, 43(1): 243-248.
    [18] 李亮, 顾国华, 钱惟贤, 陈钱, 任建乐.  基于特征点和泊松融合的红外序列图像拼接 . 红外与激光工程, 2013, 42(9): 2584-2588.
    [19] 王保平, 郭俊杰, 孙超, 方阳.  基于SRMF和序列CLEAN的空间碎片ISAR成像算法 . 红外与激光工程, 2013, 42(12): 3410-3416.
    [20] 秦玉华, 丁香乾, 宫会丽.  高维特征选择方法在近红外光谱分类中的应用 . 红外与激光工程, 2013, 42(5): 1355-1359.
  • 加载中
图(4) / 表(8)
计量
  • 文章访问数:  446
  • HTML全文浏览量:  199
  • PDF下载量:  65
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-12-07
  • 修回日期:  2021-01-19
  • 刊出日期:  2021-05-21

基于时序Sentinel-2影像的现代农业园区作物分类研究

doi: 10.3788/IRLA20200318
    作者简介:

    张东彦,男,教授,博士生导师,博士,主要从事计算机视觉、机器/深度学习、光谱信息处理及大数据、物联网等技术在农业和环境监测上的应用研究

    戴震,男,硕士生,主要从事农业遥感与信息技术方面的研究

    通讯作者: 徐新刚,男,研究员,博士,主要从事农业定量遥感应用基础方面的研究。
基金项目:  安徽省科技重大专项(18030701209);国家重点研发计划(2017YFD0201501);现代农业产业技术体系建设专项(CARS-03);农业生态大数据分析与应用技术国家地方联合工程研究中心开放课题(AE2019011)
  • 中图分类号: TP79; S127

摘要: 快速、准确地掌握作物空间分布,估算不同作物种植面积及范围,这对制定宏观农业政策并指导农民进行农业生产具有重要意义。以我国内蒙古自治区扎赉特旗现代农业示范园区为研究区域,基于2019年5月至10月共9景多时相Sentinel-2卫星遥感影像,通过计算并分析不同作物归一化差值植被指数(NDVI)、比值植被指数(RVI)、增强型植被指数(EVI)等多种典型植被指数和近红外波段Ref(NIR)的时序变化特征,采用随机森林(Random Forest, RF)、决策树(Decision Tree, DT)、支持向量机(Support Vector Machine, SVM)和最大似然法(Maximum Likelihood, ML)4种分类方法对研究区多种作物进行分类识别,成功提取园区内主要作物(水稻、玉米、甜叶菊、旱稻和大豆等)空间分布情况。将RF结果与DT、SVM和ML分类结果对比,结果显示,RF总体分类精度最高,达到95.8%,Kappa系数为0.944;DT、SVM和ML分类精度分别为92.2%、91.6%和86.5%。上述研究结果表明,多时相Sentinel-2遥感影像经过光谱指数时序变化特征提取后,利用随机森林算法进行作物分类可得到精度较高的结果,这为精细指导规模化园区农业生产提供了有效的技术支持。

English Abstract

    • 粮食安全问题一直是国内外关注的热点。作物的种植范围、粮食产量等数据是农业生产的重要指标,是国家制定粮食政策和国民经济发展计划的重要依据。作物遥感分类识别是提取作物种植面积分布、监测作物长势和进行作物估产的前提和基础[1-3]

      目前,作物遥感分类方法众多,优势各异,应用性不同。近年来,卫星遥感数据结合机器学习算法进行作物分类识别成为国内外学者的研究热点,常用的分类算法,如决策树(Decision Tree, DT)[4-6]、最大似然法(Maximum Likelihood, ML)[7]、支持向量机(Support Vector Machine, SVM)[8-9]等,被诸多学者使用。潘琛[10]等阐述了决策树分类器的结构与理论基础,对决策树算法的发展趋势进行归纳总结,并使用TM数据对徐州市地物、地貌色彩的差异进行分类实验,依据感兴趣区类别进行图像分类且分类效果较好。徐新刚[7]等使用Quick Bird高分辨率多光谱遥感影像,采用最大似然法和监督分类方法并结合多尺度遥感影像信息提取原理,对绵阳实验区的冬小麦与油菜等作物进行分类实验,获得较高精度的作物分类结果。谭琨[8]等在分析SVM分类方法的基础上构建了一种基于SVM的高光谱遥感图像分类模型,实验结果表明:这种分类器简单高效且分类精度高,是一种有效的遥感图像分类方法。然而,随着土地利用范围不断拓展深化以及区域资源环境实时变化,使得传统分类方法难以满足高精度作物分类的需求。随机森林算法[11]自2001年提出伊始,就以其优越的性能在国外诸多领域得到广泛应用,相比而言,国内采用该方法对农业耕种区作物分类识别的研究较少。而且,传统的分类方法更多是针对单一时相影像进行分类。鉴于不同作物在同一生育期下容易出现“同物异谱、同谱异物”现象,导致上述方法的分类效果较差。经文献调研,利用多时相影像结合物候信息,可以有效提高作物的分类精度[12-14]。魏鹏飞[14]等利用多时相时间序列的高分一号GF1/WFV遥感影像数据,结合作物植被指数特征,采用决策树分类方法进行作物提取,相比较传统利用单一时相分类方法有效提高作物分类精度。

      综上,笔者所在团队以作物种植种类较为复杂的内蒙古自治区扎赉特旗现代农业示范园为研究区域,探讨多时相Sentinel-2卫星影像和随机森林分类的机器学习模型对研究区作物分类效果。评估基于时间序列Sentinel-2影像的随机森林算法对农耕区作物分类的适用性,从而为作物精细遥感分类提供可用的技术方法参考。

    • 研究区位于我国内蒙古自治区兴安盟扎赉特旗现代农业示范园区(122.85°~123.35°E,46.59~46.81°N),该区域地处大兴安岭南麓向松嫩平原延伸的过度地带,位于黑龙江、吉林、内蒙古三省交接处。该区地势多为平原丘陵,平均海拔130 m,总面积约为493.61 km2,研究区概况如图1所示。园区所在位置属典型的温带大陆性气候,年平均气温3.24 ℃,年平均降水量400 mm,无霜期105~135天。园区内种植连片的水稻、玉米、甜叶菊、旱稻和大豆,此外还零散分布裸露的田块、林地和居民点等。对于玉米、水稻和大豆等秋季作物,其播种和插秧的时间一般在五月底进行。水稻在插秧前要对田块进行灌溉,然后再将秧苗移植到田块中,这使得水稻地块在生长早期具有水田特征。表1为水稻、玉米、甜叶菊、旱稻和大豆等五种主要农作物的生育期时间表。

      图  1  研究区地理位置及样本分布示意图

      Figure 1.  Geographical location and sample distributions of the study area

      表 1  研究区5种主要作物生育期

      Table 1.  Growth period of five crops in the study area

      TypeMayJuneJulyAugustSeptemberOctober
      EMLEMLEMLEMLEMLEM
      RiceSowingTilleringHeadingFillingMaturity
      SoybeanSowingSeedingFloweringPoddingFillingMaturity
      SteviaTransplantingBranchingFloweringMaturity
      CornSowingSeedingJointingTasselingFillingMaturity
      Dry riceSowingTilleringHeadingFillingMaturity
      Note: E means the early 10 days of a month,M is the middle 10 days,and L represents the lately 10 days.
    • Sentinel-2遥感卫星于2015年6月由欧空局成功发射,该系列卫星具有时空分辨率高、光谱信息丰富,且获取成本低廉的优点。为农耕区作物分类提供了新的数据源。此研究中Sentinel-2遥感影像是通过ESA数据共享网站(https://scihub.copernicus.eu/)免费下载。研究区种植作物结构多样化,为了充分覆盖作物生长周期,获取作物有效信息,选取成像时间为2019年5月22日至2019年10月4日,共9景影像,影像数据列表如表2所示。

      表 2  Sentinel-2影像数据列表

      Table 2.  Data lists of Sentinel-2 images

      Data timeSensorQuality
      2019-05-22 Sentinel-2A Best
      2019-06-11 Sentinel-2A Good
      2019-06-21 Sentinel-2A Best
      2019-07-01 Sentinel-2A Good
      2019-08-15 Sentinel-2B Best
      2019-08-30 Sentinel-2A Best
      2019-09-14 Sentinel-2B Best
      2019-09-24 Sentinel-2B Best
      2019-10-04 Sentinel-2B Best

      为确保研究区影像质量,所选取影像云量控制在30%以内。为了更好地观察研究区作物光谱指数时序变化趋势,保持影像时序性效果,所选取的影像成像时间间隔尽量保持一致。Sentinel-2遥感卫星搭载的多光谱传感器(MSI)可以提供从可见光、近红外到短波红外等13个波段的光谱信息,如表3所示。包含10 m、20 m和60 m中、高空间分辨率的遥感影像。此研究选取10 m分辨率的红(Red)、绿(Green)、蓝(Blue)和近红外(NIR) 4个波段的影像数据进行分析。

      表 3  Sentinel-2传感器光谱波段(S2A和S2B)

      Table 3.  Spectral bands of the Sentinel-2 sensors (S2A & S2B)

      Sentinel-2 bandsWavelength/μmReflection/m
      Band1-Coastal aerosol 0.443 60
      Band2-Blue 0.490 10
      Band3-Green 0.560 10
      Band4-Red 0.665 10
      Band5-Vegetation red edge 0.705 20
      Band6-Vegetation red edge 0.740 20
      Band7-Vegetation red edge 0.783 20
      Band8-NIR 0.842 10
      Band8A-Vegetation red edge 0.865 20
      Band9-Water vapour 0.945 60
      Band10-SWIR-Cirrus 1.375 60
      Band11-SWIR1 1.610 20
      Band12-SWIR2 2.190 20
    • 外业调查数据:2019年6月和8月在研究区进行野外实地调查,利用手持GPS采集研究区主要作物的样本点坐标。前后共获取样本点84个,其中水稻11个、大豆8个、甜叶菊38个、玉米2个以及旱稻25个。采集的样本点数据通过软件制作矢量图层,为后续选取样本区提供地面数据支持。

    • 为了提高卫星影像质量,保证分类精度,需要对下载的Sentinel-2影像进行预处理。下载的Level-1C数据是经过正射校正和几何精校正的大气表观反射率产品,并没有进行大气校正处理。此研究利用ESA发布的大气校正处理器插件Sen2Cor进行大气校正,L1C级数据大气校正之后最终得到L2A级数据,处理后的数据包括水蒸汽图像(Water vapor)、大气底层反射率图像(Bottom of Atmosphere,BOA)等。大气校正后的L2A级数据,使用SNAP软件对分辨率为10 m的红、绿、蓝和近红波段进行导出,并保存为ENVI格式,完成波段融合、影像拼接和研究区裁剪等步骤后,最终得到研究区范围内的Sentinel-2影像数据集。

      利用野外采集的作物样本点,通过目视解译的方法,随机选择作物感兴趣区域,作为样本集,样本集分布如图1所示。通过对样本区域进行统计,总共获取了样本点像元83279个,并随机抽取训练样本集(总样本点70%),用来对研究区作物进行分类识别,随机抽取验证样本集(总样本点30%),用来做分类后的精度验证。

    • 遥感影像数据中像元光谱值的大小会因为地物类型的改变而产生变化,地物间光谱值的差异性和其独特的光谱特性构成了遥感识别地物的基础[1]。植被指数根据植被的光谱特性,将卫星可见光和近红外波段进行组合,它在一定条件下能用来定量说明植被的生长状况[2]。经实验观察,研究区内的作物在不同生长时期,其光谱曲线有明显的变化,为研究分类模型构建提供了有效的理论支持。

      此研究通过对比同一时期不同作物的光谱指数特征,找出差异最明显时期,确定作物划分的阈值区间,利用决策树分类模型提取研究区不同作物地块。再选取光谱特征差异性明显的时期,构建光谱指数时序特征影像集,采用随机森林、支持向量机和最大似然法对研究区作物进行分类识别。

      此研究选取归一化差值植被指数[15](Normalized Difference Vegetation Index, NDVI)、比值植被指数[16](Ratio Vegetation Index, RVI)、增强型植被指[17-18](Enhanced Vegetation Index, EVI)和近红外波段[19] Ref(NIR)作为分类指标。其中NDVI和EVI在植被信息提取和地物识别方面应用最为广泛和有效。水稻的Ref (NIR)波段与其他作物光谱差异性最为明显,可以有效区分水稻地块,故引用Ref (NIR)波段。旱稻、玉米的NDVI、EVI和Ref (NIR)时序特征曲线差异性不明显,为更好地识别研究区旱稻、玉米的种植区域,引入RVI指数补充。各类指标描述如表4所示。

      表 4  笔者研究中分类指标列表

      Table 4.  Classification indicators used in the study

      IndicatorDescriptionSource
      Normalized Difference Vegetation Index(NDVI) ${\rm NDVI} = \dfrac{ { {\rho _{\rm NIR} } - {\rho _{\rm RED} } } }{ { {\rho _{\rm NIR} } + {\rho _{\rm RED} } } }$ Ref.[15]
      Ratio Vegetation Index(RVI) ${\rm RVI} = \dfrac{ { {\rho _{\rm NIR} } } }{ { {\rho _{\rm RED} } } }$ Ref. [16]
      Enhanced Vegetation Index(EVI) ${\rm EVI} = 2.5×\dfrac{ { {\rho _{\rm NIR} } - {\rho _{\rm RED} } } }{ { {\rho _{\rm NIR} } + 6.0×{\rho _{\rm RED} } - 7.5×{\rho _{\rm BLUE} } + L} }$ Ref. [17-18]
      Near Infrared Ray(Ref(NIR)) The reflection of Band-8 in Tab.3 Ref. [19]
      Notes: In the formula, $ {\mathrm{\rho }}_{\mathrm{N}\mathrm{I}\mathrm{R}} $ is the near-infrared band reflectivity, $ {\mathrm{\rho }}_{\mathrm{R}\mathrm{E}\mathrm{D}} $ is the red band reflectivity, $ {\mathrm{\rho }}_{\mathrm{B}\mathrm{L}\mathrm{U}\mathrm{E}} $ is the blue band reflectivity and L is the soil adjustment coefficient of 1.
    • 此研究使用到的分类方法有随机森林(Random Forest, RF)、决策树、支持向量机和最大似然法4种。

      基于决策树算法改进的随机森林算法拥有广阔的应用前景[20-22]。它是利用多个决策树对样本进行训练、分类并预测的一种算法,主要应用于回归和分类场景。它的基本单元是决策树,而它的本质属于机器学习的一大分支—集成学习(Ensemble Learning)方法。随机森林中随机是核心,通过随机选择样本,降低了决策树之间的相关性。随机在原始训练数据中有放回的选取等量的数据作为训练样本,建立决策树时,随机选取一部分特征建立决策树。从另一个角度解释,每棵决策树都是一个分类器,随机森林生成N棵树会有N个分类结果。对所有分类器的结果进行投票,投票次数最多的类别为最终结果。

      决策树是一种归纳推理的分类方法,通过建立树形结构,在其中每个内部节点表示属性测试,对图像各类信息值进行比较,得出新的分支当作新的节点更新规则,继续分类直到最终得到想要的分类结果。适合于分层分样的样本分类统计工作,而且在一定范围内分类精度很高。

      支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,解决复杂数据分类问题,它适用于高维特征空间、小样本统计学习。

      最大似然法也称为最大概似估计或最大似然估计,是求估计的另一种方法。该方法通过对感兴趣区域里需分类像元的统计,得出均值等参数后,确定一个专门分类的函数,将图像中待分类的像元点带入该分类函数后进行扫描,把函数返回值最大的类别作为被归属类别,通过统计分类像元,得到分类的效果。

      此研究采用的随机森林分类模型、决策树、支持向量机和最大似然法4种分类方法都是基于ENVI5.3来实现。通过对比4种方法的分类结果,突出随机森林分类的优势。对研究区作物分类识别后,利用随机选取的验证样本集,通过计算混淆矩阵,得出每种作物的制图精度和用户精度,并将4种分类方法的总体分类精度和Kappa系数作为分类结果的精度评价指标,精度验证的计算公式如表5所示。

      表 5  精度验证的计算公式

      Table 5.  Formulas of accuracy evaluation

      TypeCalculation formula
      Mapping accuracy $\mathrm{P}\mathrm{A}=\dfrac{ {X}_{ii} }{ {X}_{j} }×100\%$
      User accuracy $\mathrm{U}\mathrm{A}=\dfrac{ {X}_{ii} }{ {X}_{i} }×100\%$
      Overall accuracy $\mathrm{O}\mathrm{A}=\displaystyle\sum _{i=1}^{k}\dfrac{ {X}_{ii} }{N}×100\%$
      Kappa coefficient ${{K} } = \dfrac{ {N\displaystyle\sum\nolimits_{i = 1}^k { {X_{ii} } } - \sum\nolimits_{i = 1}^k { {X_i}{X_j} } } }{ { {N^2} - \displaystyle\sum\nolimits_{i = 1}^k { {X_i}{X_j} } } }$
      Notes: where k represents the number of rows and columns of the confusion matrix, Xii represents the value on the diagonal of the confusion matrix that is the number of pixels correctly classified, N represents the total number of pixels verified, Xi represents the i row of the confusion matrix. The sum of elements, Xj represents the sum of elements in the j column of the confusion matrix.
    • 研究区主要作物的NDVI、EVI、RVI和Ref (NIR)时序特征曲线如图2所示。由图2(a)可以看出水体、道路和居民区等非耕地的NDVI时间序列曲线处于稳定状态,平均值在0.10~0.20之间,在8月和9月与其他作物的值差异最为明显,通过实验发现8月15日影像的NDVI值区分非耕地效果较好,此时非耕地的NDVI最大、最小值分别为0.75和−0.20,通过与其他作物相同时期NDVI最值对比,最后设置阈值NDVI8/15>0.48将水体、道路及居民区剔除掉。5月份研究区作物处于幼苗阶段,植物地表覆盖度低,此时林地生长较为茂盛,其NDVI值明显高于其他作物,可以利用林地NDVI值,将其剔除。5月22日林地NDVI最小值为0.63,大于同时期其他作物NDVI值,因此设置阈值NDVI5/22≥0.63,可以将林地剔除。将识别出的水体、道路、居民区和林地地块进行掩膜,方便后续进行研究区主要作物的分类识别。

      图  2  各作物NDVI (a)、RVI (b)、EVI (c)、Ref (NIR) (d)时序变化

      Figure 2.  Temporal changes of NDVI (a), RVI (b), EVI (c) and Ref (NIR) (d) for main crops

    • 图2可以看出,作物前期生长较为缓慢,光谱指数特征差异不明显。进入6月下旬,作物对叶绿素吸收能力开始增强,生长迅速,Ref (NIR)逐渐增加,作物长势明显,植被指数快速增长且光谱指数特征增长趋势较为一致。玉米、水稻和大豆在7、8月份,4种光谱指数达到饱和状态,并保持稳定。8月份除了旱稻,其余作物的Ref (NIR)达到峰值。甜叶菊在这一时期仍处于生长阶段,EVI和Ref (NIR)变化规律相似,上升到峰值后,保持稳定状态。8月下旬开始,作物进入灌浆期,营养器官能量吸收衰减,吸收的能量更多向生殖器官转移。作物的NDVI、EVI和Ref (NIR)开始降低。随着水稻、旱稻、玉米进入开花期,大豆进入结痂期,这4种作物的EVI和RVI值达到最大。9月中上旬甜叶菊的RVI和NDVI时间序列曲线出现峰值,这是因为此时甜叶菊处于开花期,导致甜叶菊RVI和NDVI峰值出现的时间较为靠后。9月后,各作物的指数特征都出现明显下降的趋势。

    • 通过对比作物的光谱时间序列曲线变化特征,发现Ref (NIR)可以用来区分大豆和水稻,并且对水稻区分效果较好。Ref (NIR)结合EVI,可以提高大豆识别精度。甜叶菊9月14日和8月15日的NDVI、RVI值做差作为筛选条件,可以较好地识别出甜叶菊地块。玉米和旱稻地块混种现象严重,区分难度较大,用到了NDVI、RVI、EVI和Ref (NIR) 4种光谱特征指数来识别玉米和旱稻地块。此研究选取基于时间序列影像的多种特征指数,采用决策树方法进行主要作物分类提取过程如图3所示。

      图  3  作物分类提取流程图

      Figure 3.  Flow chart of crop classification extraction

      通过NDVI8/15<0.48剔除水体、道路和建筑等,利用NDVI5/22≥0.63剔除林地,将这些区域统一划分为非作物区域进行剔除,然后进行主要作物的分类。

      大豆在整个生育期内,除了NDVI生长曲线相比较其他作物差异性不明显外,其他光谱指数特征曲线生长趋势明显高于其它作物。大豆的EVI和Ref(NIR)整体趋势相似,与其他作物有一定的区分度,因此选取EVI和Ref (NIR)对大豆地块进行提取。图2(c)、(d)中可以看出大豆的EVI和Ref(NIR)数值在8月15日明显高于甜叶菊、旱稻、水稻和玉米,因此选取Ref (NIR)8/15和EVI8/15用来提取大豆种植区域。大豆Ref (NIR)8/15最大值为0.65,最小值为0.40,根据样本地块统计Ref(NIR)和EVI数值,经反复实验最终设定满足0.47≤Ref (NIR)8/15≤0.65的像元为大豆,0.76≤EVI8/15≤0.97的像元作为补充。

      水稻、玉米、旱稻生长趋势基本吻合,尤其是水稻和旱稻的差异性不明显。在6月份前后,水稻刚开始插秧,水稻田块里有水体存在,使水稻的Ref (NIR)数值高于其他地物同时期Ref (NIR)数值,因此选择6月11日的水稻Ref (NIR)提取水稻地块。受6月11日影像质量影响,选取5月22日水稻的Ref (NIR)作为补充。将水稻样本地块在这两个时期的Ref (NIR)统计值,与其他地物统计的Ref (NIR)最值进行比较,反复实验,最终确定满足0.05≤Ref (NIR)6/11≤0.13的像元为水稻,并满足0.03≤Ref (NIR)5/22≤0.09的像元为补充。

      从甜叶菊的NDVI和RVI时间序列曲线可以看出,在8月至9月其他作物植被指数缓慢降低时,甜叶菊出现了增长。通过对比不同时期的指数差值,提取甜叶菊种植区域。经过反复试验,最终确定满足NDVI9/14- NDVI8/15≥0.03和RVI9/14-RVI8/15≥4的像元为甜叶菊。在剔除大豆、水稻、甜叶菊后,剩下玉米和旱稻两种作物,两种作物的光谱特征曲线的变化趋势相似,但在9月14日玉米的RVI值大于旱稻,9月24日玉米的NDVI值明显大于旱稻,而在10月4日玉米的Ref (NIR)值小于旱稻,经过反复试验,最终确定满足6.62≤RVI9/14≤16.40和0.49≤ NDVI9/24≤0.83以及0.20≤Ref (NIR)10/04≤0.30的像元为玉米。最后剩下旱稻,选取旱稻关键生育期8月15日的NDVI和EVI指数进行提取,经过反复试验,最终选定满足0.56≤NDVI8/15≤0.94和0.38≤EVI8/15≤0.83的像元为旱稻。决策树分类结果如图4(a)所示。

      图  4  采用决策树(a)、随机森林(b)、支持向量机(c)、最大似然法(d)的作物分类结果

      Figure 4.  Crop classification results using Decision Tree (a), Random Forest (b), Support Vector Machine (c), Maximum Likelihood (d)

    • 选取作物分类提取过程中关键时期的植被指数和近红外光谱影像,其中包括NDVI:5月22日、8月15日、9月14日和9月24日 4个时期影像,Ref(NIR):5月22日、6月11日、8月15日和10月4日 4个时期影像,RVI:8月15日、9月14日 2个时期影像,EVI:8月15日1个时期影像。将上述11个时期影像叠加。通过En MAP-BOX[23]工具,将合成的影像与训练样本集输入到随机森林分类器中进行分类,对于Random Forest分类参数设置,一般保持默认即可,随机森林树的数量设置为100,特征数量默认使用“Square Root”方法,最小节点样本选择1,设置好参数后,直接运行分类器,获得最终分类结果如图4(b)所示。

    • 此研究采用随机森林分类模型对研究区主要农作物进行分类识别并对比决策树、支持向量机和最大似然法分类结果。各方法分类结果展示如图4所示。从图4中可以看出,在研究区范围内主要种植玉米和水稻2种作物,且地块较大,较为集中。其中水稻主要分布在园区东南、东北地带,玉米主要分布在研究区中部及西南部。大豆和甜叶菊种植区域主要集中在研究区中部,并且地块较小。旱稻种植区域零星分布,地块较小,与玉米的间种现象比较严重。4种分类方法对水稻、大豆和甜叶菊的分类效果较好,对于玉米旱稻混种区域,随机森林分类效果最好,决策树次之,最大似然法的分类效果最差。

      决策树分类效果较好,是因为增加了对不同作物间光谱指数阈值选取,并逐步分层识别提取作物,作物光谱信息被更加深入的挖掘,分类具有针对性,解决单一生育期,不同作物光谱特征差异性不大的问题,而随机森林算法建立多支决策树,并对分类器的结果进行投票,投票次数最多的类别为最终结果,通过增加分类器数量,改善了分类精度。支持向量机和最大似然法都只根据有限的样本信息进行地物分类提取,很难划分细碎地块和间种地块,从而导致它们的错分概率相对较高。

      将分类后的结果与验证样本集计算混淆矩阵,评估分类后精度。决策树和随机森林分类模型混淆矩阵结果见表6表7

      表 6  决策树混淆矩阵结果

      Table 6.  Confusion matrix result of Decision Tree

      TypeSoybeanRiceSteviaCornDry riceTotalUser accuracy
      Soybean3288400320361291.03%
      Rice056801633176590596.19%
      Stevia002039059209897.19%
      Corn0108451221867397.44%
      Dry rice8914710554820603979.81%
      Mapping accuracy99.76%99.75%92.60%88.57%86.13%

      表 7  随机森林混淆矩阵结果

      Table 7.  Confusion matrix result of Random Forest

      TypeSoybeanRiceSteviaCornDry riceTotalUser accuracy
      Soybean3294000393368789.34%
      Rice0569219183216611093.16%
      Stevia00199308200199.60%
      Corn002930141934499.54%
      Dry rice421421024938518895.18%
      Mapping accuracy99.88%99.96%92.44%97.03%88.24%

      4种分类方法总体精度和Kappa系数见表8。结合图4对研究区作物分类识别结果进行分析,随机森林分类总体精度最好为95.8%,Kappa系数为0.944。决策树分类总体精度为92.3%,Kappa系数为0.897。支持向量机分类总体精度为91.6%,Kappa系数为0.890。最大似然法总体分类精度最低为86.5%,Kappa系数为0.823。

      表 8  各方法的分类总体精度和Kappa系数

      Table 8.  Overall accuracy estimation and Kappa coefficient of classification based on each method

      Classification methodOverall accuracyKappa coefficient
      Maximum Likelihood86.5%0.823
      Support Vector Machine91.6%0.890
      Decision Tree92.2%0.897
      Random Forest95.8%0.944
    • 此研究采用时间序列Sentinel-2卫星遥感影像数据集,结合研究区作物物候特点,通过NDVI、EVI以及RVI等植被指数和近红外波段Ref(NIR)的时序变化特征,选取作物关键生育期差异明显的光谱指数特征影像集,采用随机森林分类方法成功提取研究区不同作物的种植区域。相比其他传统分类方法,提高了分类精度,简化了分类流程。采用随机森林方法的作物总体分类精度为95.8%,Kappa系数达到0.944。通过该方法可以实现对扎赉特旗现代农业示范园区作物的精确提取。

      此研究还存在一些不足需要改进,尽管提出的方法在所选研究区域有较高的分类精度,其普适性还需要开展更加深入的研究。另外,随机森林算法中树的分支数带来的影响并没有考虑进去,下一步将对不同分支数对分类精度开展更加深入的分析和探讨。

参考文献 (23)

目录

    /

    返回文章
    返回