融合时序Sentinel数据多特征优选的南方丘陵区油茶种植区提取

李恒凯1 王 洁1 周艳兵2 龙北平3

(1.江西理工大学土木与测绘工程学院, 赣州 341000; 2.北京市农林科学院信息技术研究中心, 北京 100097;3.江西地质局地理信息工程大队, 南昌 330001)

摘要:油茶作为江西省经济林树种之一,也是江西省特色优势产业,准确获取其空间分布在产量估算、生产管理和政策制定等方面具有重要意义。本研究针对南方多云多雨气候导致光学影像不足,以及丘陵山区地形破碎问题,以江西省宜春市袁州区为研究区,采用时序Sentinel系列影像数据和SRTM DEM数据为数据源,构建和优选了光谱特征、植被-水体指数、红边指数、雷达特征、地形特征和纹理特征共125个特征变量,其中,纹理特征采用累计差法(Δf)对比15种不同尺度窗口,计算Sentinel-1和Sentinel-2影像最佳纹理特征。基于ReliefF特征优选算法和随机森林分类算法,设计了8种特征组合方案开展实验,探讨不同特征类型对油茶提取精度的影响。结果表明:利用累计差法计算出的Sentinel-1和Sentinel-2的最佳纹理特征窗口尺寸均为35×35,最佳纹理特征组合为均值(Mean)、方差(Variance)和对比度(Contrast);在光谱特征、植被-水体指数的基础上加入不同特征对油茶进行分类,不同类型特征对油茶提取的有利程度由大到小依次为S2纹理特征、S1纹理特征、地形特征、雷达特征、红边指数,相比于单一光谱和指数特征,纹理特征的加入可大幅度提高分类精度。多特征协同分类结果优于单特征分类结果,基于特征优选的油茶提取精度最高;基于ReliefF算法特征优选后的方案精度最高,总体精度为88.29%,Kappa系数为0.81。本研究利用时序Sentinel系列遥感影像和DEM地形数据,构建了针对多云雨南方丘陵山区的大范围油茶遥感提取方法,可为中国南方丘陵区域油茶资源调查与监测提供参考。

关键词:油茶; 种植区提取; Sentinel-1; Sentinel-2; 特征优选; 累计差; ReliefF算法

0 引言

油茶是世界四大食用木本油料之一,也是中国特有的油料树种,多分布于南方山区丘陵地带。2022年,江西省油茶林总面积1.04×106 hm2、高产油茶林面积8.3×105 hm2,其面积、产量和产值均居全国第二[1-2]。油茶产业具有巨大的发展潜力和良好的历史机遇,2023年9月江西省政府印发《江西省推动油茶产业高质量发展三年行动计划(2023—2025年)》,提出要着力扩大油茶种植规模,推动江西油茶产业高质量发展。当前,油茶产业已成为农户增收的“致富树”,快速、准确地获取油茶种植面积及空间分布对其生产管理、产量评估等方面具有重要意义。

遥感技术提供了先进、高效的手段,中高等空间分辨率图像已被广泛应用于农林业,逐步实现油茶、果园等经济林的面积提取和监测[3-5]。与传统的野外调查相比,遥感具有大范围、高频次、长时序的优点,可以及时、高效地实现大规模作物种植区域提取。遥感技术根据数据源不同,分为光学遥感[6-8]和微波遥感[9-11]。光学遥感数据易获取和处理,能有效进行识别作物。孟浩然等[5]基于GF-2号影像的植被指数、纹理特征和主成分分析(PCA)特征,采用不同分类算法开展油茶遥感提取研究,基于随机森林算法(Random forest,RF)的总体精度最高,达96.85%;严恩萍等[12]利用无人机影像结合Mask R-CNN网络进行油茶产量估算;吴炅等[13]同样利用无人机正射影像和密集匹配点云,提取波段反射率、植被指数、纹理因子等遥感变量和冠幅等冠层参数,进行了油茶产量估算。

欧洲空间局(ESA)哥白尼计划发布的Sentinel-2时间序列影像数据,为树种分类提供了具有高空间分辨率的免费数据源,其红边、近红外(NIR)和短波红外(SWIR)波段在树种识别研究中具有高价值[14-17]。然而我国油茶多分布于南方丘陵地带,属多云多雨区,光学影像数据质量难以保证。同时丘陵山区植被覆盖面积广、林分结构复杂、地形破碎,给油茶提取工作带来了困难。此外,不同树种在光学影像上通常会存在“同物异谱”或“异物同谱”的现象,容易导致错分、误分,在南方林分结构复杂的丘陵山区体现的更为明显。

微波遥感应用以合成孔径雷达(Synthetic aperture radar, SAR)为主,SAR数据不受光线和天气限制、穿透力强,能够实现全天候、全天时对地观测,且能获取植被的结构信息[18-19]。SAR数据逐渐被用于获取作物空间分布信息,如李俐等[19]基于时间序列Sentinel-1A数据监测玉米种植面积。但SAR数据不如光学影像具有丰富的光谱信息,仅能反映地物的后向散射特征,同时,SAR数据容易受到地表的湿度、粗糙度和形态等因素的影响,在植被分类中也存在一定局限性。因此,融合SAR遥感和光学遥感,发挥各自优势,提取不同特征进行分类研究,实现多源遥感互补[20-22],可有效提高作物提取与识别的精度。

地物分类研究多利用光学影像提取地物纹理特征,实际上由于SAR数据的特性,雷达影像同样含有丰富的纹理信息,利用极化信息提取地物的结构和纹理特征也可以参与到影像分类中[23]。除此之外,算法也是影响分类精度的重要因素,诸多实验证明机器学习中的随机森林算法是遥感影像分类中精度最高的算法之一[24-26]

本研究针对南方丘陵区地形复杂、多云多雨导致油茶遥感提取困难问题,选取时序Sentinel-1 SAR影像、Sentinel-2光学影像和SRTM DEM数据为数据源,提取地物光谱特征、植被指数、水体指数、红边指数、雷达特征、S1/S2纹理特征和地形特征,其中,纹理特征利用累计差(Δf)方法选择最佳提取窗口和特征组合。利用ReliefF算法进行特征优选,设计8种油茶提取方案,最后,采用随机森林分类算法提取研究区油茶信息,并进行精度评价,分析不同特征对油茶提取的适用性,筛选出最佳特征组合,最后实现大范围油茶空间分布信息提取。

1 研究区与数据

1.1 研究区概况

研究区位于江西省宜春市袁州区(27°33′~28°05′N,113°54′~114°37′E),总面积2 538 km2,区域内地貌以山地、丘陵为主,地势西高东低,是典型的南方丘陵区。袁州区土壤以红壤、黄红壤为主。气候属亚热带季风湿润性气候,雨量充沛,年平均气温17℃左右,非常适合油茶生长[27]

袁州区是国家命名的首批“油茶之乡”,是全国油茶重点产区之一,现有油茶林面积约5×104 hm2,全区24个乡镇都有油茶分布[28]。研究区地理位置如图1所示。实验采用的行政区划数据来源于全国地理信息资源目录服务系统(https:∥www.webmap.cn)。

图1 研究区地理位置

Fig.1 Location of study area

1.2 数据获取与预处理

研究使用的Sentinel-1雷达影像和Sentinel-2光学影像来自哥白尼开放存取中心(https:∥scihub.copernicus.eu/)。Sentinel-1选用干涉宽幅模式(IW)的地距多视产品(GRD),空间分辨率为10 m,极化方式为VV+VH,成像时间范围为2019年1—12月。Sentinel-2包含空间分辨率为10 m波段4个、20 m波段6个、60 m波段3个,实验选取空间分辨率10 m和20 m波段,成像时间范围为2019年9—12月。地形数据来源于空间分辨率 30 m 的SRTM DEM,源自地理空间数据云平台(http:∥www.gscloud.cn)。影像数据时间信息如表1所示。

表1 影像数据采集

Tab.1 Image data collection information

月份 Sentinel1Sentinel21月20190108、201901202月20190201、201902133月20190309、201903214月20190402、201904145月20190508、201905206月20190601、201906137月20190707、201907198月20190812、201908249月20190905、201909172019092210月20191011、201910232019100211月20191104、201911162019110112月20191210、2019122220191206

样本数据来源于2019年袁州区林地小斑数据,借助Google Earth高分辨率影像进行选取,共得到油茶样本2 275个、其它树种样本3 307个、其它地物(建筑物、水体、耕地等)样本1 397个,按照比例 7∶3 随机分为训练样本和验证样本。

Sentinel-1数据预处理过程包括轨道校正、热噪声去除、辐射定标、滤波、地形校正和分贝化,裁剪后得到研究区的VV、VH后向散射系数。Sentinel-2数据只需进行大气校正,将其从L1C级别的大气表观反射率(TOA)数据转换为L2A级别的大气底层反射率数据(BOA),裁剪后剔除分辨率60 m波段,将分辨率20 m波段重采样至10 m。地形数据拼接裁剪后重采样至10 m。

2 研究方法

2.1 技术路线

本研究技术路线如图2所示。主要包括3部分:①对Sentinel-1、Sentinel-2和DEM数据进行预处理,得到研究区雷达影像、光学影像和地形数据。②构建分类特征集。分别基于Sentinel-1、Sentinel-2和DEM数据提取雷达特征、光谱特征、植被指数、水体指数、红边指数、S1/S2纹理特征和地形特征,其中,S1/S2纹理特征利用JM距离算法选取最佳纹理特征。基于ReliefF算法进行特征优选,剔除冗余特征,构建最优特征集。最后基于不同特征构建8种特征组合。③基于8种特征组合采用随机森林分类算法进行油茶提取,并进行精度评价,选择精度最高的特征组合对油茶种植区进行提取。

图2 技术路线与特征变量组合方案

Fig.2 Technology road map and feature variable combination scheme

2.2 分类特征说明

本次实验根据研究区情况,结合先前研究,选取7种特征,利用24景Sentinel-1雷达影像、4景Sentinel-2光学影像和DEM数据,提取出125个特征变量(表2)。

表2 特征变量集

Tab.2 Feature variable set

特征类型特征变量特征说明变量描述光谱特征光谱波段B2(蓝光)、B3(绿光)、B4(红光)、B5(红边1)、B6(红边2)、B7(红边3)、B8(近红外)、B8a(狭窄近红外)、B11(短波红外1)、B12(短波红外2)提取植被光谱反射率特征比值植被指数(RVI)IRVI=B8a/B4用于检测和估算植物生物量,对植被覆盖度敏感植被指数归一化植被指数(NDVI)INDVI=(B8a-B4)/(B8a+B4)表征植被生长状态和植被覆盖度绿通道植被指数(GNDVI)IGNDVI=(B8a-B3)/(B8a+B3)与植被叶绿素含量显著相关水体指数改进归一化水体指数(MNDWI)IMNDWI=(B3-B11)/(B3+B11)减少建筑物和阴影等影响,突出水体红边近红外归一化植被指数(RedNDVI)IRedNDVI=(B8a-B5)/(B8a+B5)与植被叶绿素含量、植被生长状态和空间分布相关红边指数改良红边土壤调整植被指数(MSRre)IMSRre=B8a/B5-1B8a/B5+1减轻土壤对结果的影响红边叶绿素指数(CI-re)ICIre=B8a/B5-1与植被叶绿素含量相关纹理特征灰度共生矩阵(GL-CM)均值(Mean)、方差(Variance)、同质性(Homogeneity)、对比度(Con-trast)、差异性(Dissimilarity)、熵(Entropy)、二阶矩(Second moment)、相关性(Correlation)提取图像纹理和结构信息高程STRM DEM地形特征坡度由STRM DEM计算得到与植被分布和生长显著相关坡向由STRM DEM计算得到雷达特征VVVV极化全天候监测,提供植被覆盖度和VHVH极化结构等信息

2.3 特征优选

综合利用多种特征进行油茶提取,能够充分利用遥感数据信息,提高分类精度,但不同特征变量在分类中的贡献值存在差异,相关性较弱的特征在分类时会造成特征冗余。通过特征优选,可以减少维度灾难和降低过拟合风险,从而提高分类性能。

2.3.1 Jeffries-Matusita距离

Jeffries-Matusita(JM)距离常用于遥感图像分类中的特征选择和分类,用以改善性能和确定重要特征,取值范围为0~2,数值越大,表示类间可分性越好[29]。本文共有24景Sentinel-1雷达影像和 4景 Sentinel-2光学影像,利用JM距离算法进行类间可分性分析,选取最佳时相提取纹理特征。

2.3.2 ReliefF算法

KONONENKO[30]在KIRA等[31]的研究基础上提出了多类特征选择的ReliefF算法,与只适用于二分类问题的Relief算法相比,ReliefF算法可以处理多类特征问题。ReliefF算法是一种快速而有效的特征选择方法,并不需要假设特征之间的线性关系,适用于各种类型的数据。本实验采用ReliefF提取油茶最优特征。

2.4 纹理特征

遥感影像分类中,纹理特征提取窗口尺寸对分类结果和性能有重要影响,窗口过小,不能反映地物的整体信息,窗口过大,易与其它地物混淆。因此,选择合适的窗口尺寸提取纹理特征至关重要。本研究采用累计差(Δf)[32]来衡量地物区分度,作为选择纹理特征提取窗口尺寸和变量的指标,累计差越大,区分度越高。累计差公式为


|ui-ui+3|+…+|ui-ui+n-i|)

(1)

式中 ui——第i类地物在某特征变量上的均值

f——不同纹理特征变量,f取1,2,…,8

2.5 分类方法

对不同油茶提取特征进行组合后,利用随机森林分类器(RF)进行分类。RF算法是由BREIMAN[33]提出的基于分类回归树(Classification and regression tree,CART)的集成学习模型,由大量相互独立的决策树组合而成。RF算法在遥感影像分类中应用广泛,能够有效处理高维遥感数据集,防止过拟合,与其它机器学习算法相比更加高效和易于使用[34]。RF算法的基本构建过程为:采用bootstrap抽样方法有放回地从原始数据集中随机抽取样本,利用抽取的样本建立决策树组成随机森林,最后根据多颗决策树分类结果,采用投票方式确定分类样本类别。最终分类决策表达式为

(2)

式中 R(x)——随机森林分类结果

ri(x)——每棵决策树分类结果

n——样本子集数

Y——目标变量

I(·)——示性函数

通常情况下RF算法仅需设置2个关键参数,即决策树数量和节点分裂过程中选取的特征数,本实验将决策树数量设置为100,节点特征数设置为特征总数平方根。

2.6 分类精度评价

利用混淆矩阵对油茶种植区提取结果进行精度验证,精度评价指标为用户精度(User’s accuracy,UA)、生产者精度(Producer’s accuracy, PA)、总体精度(Overall accuracy,OA)和Kappa系数。

3 结果与分析

3.1 纹理特征提取

选取3×3、7×7、11×11、15×15、19×19、23×23、27×27、31×31、35×35、39×39、43×43、47×47、51×51、55×55、59×59共15种尺寸窗口,计算不同窗口尺寸下的累计差。

Sentinel-1数据VV、VH极化各有24景,Sentinel-2数据有4景,首先通过实验选取最佳纹理特征提取时相。根据样本统计地物的均值和标准差,计算不同时相下油茶与其它地类的JM距离,如图3所示,Sentinel-1影像所有时相下VH极化JM距离均高于VV极化,并在12月10日达到最大值,Sentinel-2影像JM距离在10月2日达到最大。因此,选取12月10日的Sentinel-1影像VH极化和10月2日Sentinel-2影像提取纹理特征。Sentinel-2共有10个波段,为了避免纹理特征过多造成特征冗余,采用PCA主成分变换方法对10个波段进行主成分分析,选取PCA 1提取纹理特征。

图3 不同日期下油茶与其它地类JM距离

Fig.3 JM distance between Camellia oleifera and other land types at different dates

计算比较最佳时相影像15种窗口尺寸下各地物(油茶、其它植被、其它地物)8个纹理特征变量的累计差,如图4a所示,随着窗口增大,Sentinel-1累计差出现两处峰值,在35×35窗口时累计差达到最大,Sentinel-2累计差随着窗口的增大,先增加后减小,同样在35×35窗口时累计差达到最大,因此选用35×35窗口为S1/S2纹理特征最佳提取窗口。

图4 不同窗口下累计差与最佳窗口(35×35)下各纹理变量的累计差

Fig.4 Accumulated differences under different windows and accumulated difference of each texture variable under optimal window (35×35)

图4b为最佳窗口下8个纹理特征变量的累计差,两种数据变化情况基本一致。其中,均值和方差累计差较高,其次是对比度,同质性、差异性、熵、二阶矩和相关性累计差较低。因此Sentinel-1和Sentinel-2纹理特征选择35×35窗口下累计差较高的均值、方差和对比度。

3.2 特征优选结果

利用Sentinel-1、Sentinel-2和DEM数据获取特征变量125个。运用ReliefF算法计算特征变量的特征权重,权重反映该特征在数据集中的重要性,根据权重从大到小排列,设置中值为阈值,筛选出相关性高的特征,最终保留特征变量41个,如图5所示。

图5 ReliefF算法特征重要性排序

Fig.5 ReliefF algorithm feature importance ranking

采用中值作为ReliefF算法阈值,解决了ReliefF算法通常需要通过实验或经验确定特征权重阈值的问题,这不仅提高了运算效率,同时一定程度上简化了算法流程。通过实验评估模型性能,可验证在特定数据集和问题背景下此方法的有效性。

3.3 分类结果与精度评价

利用RF算法对不同特征组合进行分类,分类精度如表3所示,仅使用光谱特征、植被指数和水体指数的方案1分类精度最低,在方案1基础上分别加入红边指数、雷达特征、地形特征、S1/S2纹理特征后,分类精度均有所提高。方案7融合所有特征后,总体精度提高5.31个百分点,经过特征优化后方案8取得最好分类效果,总体精度和Kappa系数均高于其它方案。结果表明,S1/S2纹理特征在油茶提取上发挥了比其它特征更好的效果,说明经过实验提取的纹理特征可以显著提高油茶提取精度。根据油茶PA和UA,不同类型特征对油茶提取的有利程度由大到小依次为S2纹理特征、S1纹理特征、地形特征、雷达特征、红边指数、植被-水体指数。

表3 不同组合分类精度

Tab.3 Classification accuracy of different combinations

方案组合方式PA/%UA/%总体精度/%Kappa系数1光谱+植被+水体油茶74.4972.47其它植被80.1482.81其它地物97.6194.6881.790.712光谱+植被+水体+红边油茶76.9877.89其它植被84.1784.86其它地物98.5794.9484.710.763光谱+植被+水体+雷达油茶73.9081.16其它植被87.3083.51其它地物98.5794.9485.190.764光谱+植被+水体+地形油茶77.7180.92其它植被86.6985.49其它地物98.5795.6086.140.785光谱+植被+水体+S1纹理油茶77.4283.68其它植被89.2185.34其它地物98.5797.1887.240.806光谱+植被+水体+S2纹理油茶79.1882.44其它植被88.1086.36其它地物98.0996.4887.200.807全部特征油茶75.3785.38其它植被90.2284.27其它地物98.8196.5087.100.798特征优选油茶76.1088.12其它植被92.3484.89其它地物98.5797.1888.290.81

通过表3对比不同分类方案各地物的PA和UA,其它地物在所有方案中都具有较高的分类精度。加入红边指数,精度提高,是由于研究区植被结构复杂,不同树种在指数特征上的差值较小,导致不同树种存在错分情况,植被红边特征的加入有助于树种分类。加入雷达特征,油茶的UA提高但PA降低,表明雷达特征的加入不一定能提升分类精度。加入地形特征,总体精度提高,是因为南方丘陵山地地形破碎且山地阴影严重,森林植被茂盛,不同树种混合分布、相互渗透,地形特征中的高程、坡度和坡向能够有效减少错分概率。

加入S1纹理特征,其它植被的PA提高,油茶的PA提升没有地形特征高,说明由雷达数据提取的纹理特征可以提升分类总体精度,但在不同类别上存在差异。加入S2纹理特征,油茶的PA和UA均有所提高。从总体精度上看,加入S1/S2纹理特征的方案5、6的分类精度相较仅有光谱、植被-水体指数的方案1分类精度有显著提升。从油茶分类精度上看,加入纹理特征后,方案5油茶的PA和UA分别提升2.93、11.21个百分点,方案6的PA和UA分别提升4.69、9.97个百分点。说明实验所提取的窗口尺寸35×35的纹理特征变量可作为油茶提取的有效特征。

图6为Sentinel-2原始影像和不同特征方案下的油茶分类结果图。从图6可以看出,油茶作为袁州区主要经济树种大面积交错分布于各地类之间。图7为3处局部细节及其对应的Google Earth高分影像。如图7所示,不同方案在油茶提取上的性能不同,其中,加入S1/S2纹理特征的方案5、方案6表现出了比其它特征更好的效果。同时,如图7第2行图像所示,油茶属于人工经济林树种,种植区存在刚开垦和植苗区域,在分类时部分区域容易与裸土和其它耕地混淆。

图6 不同方案油茶分类结果

Fig.6 Camellia oleifera classification results of different methods

图7 不同方案油茶局部细节图

Fig.7 Camellia oleifera extraction results of different methods

4 讨论

以往油茶研究主要利用无人机影像[35]和GF-2影像[5]等。Sentinel数据与其它影像数据相比具有易获取、多波段等优势,为树种分类提供了具有高空间分辨率的免费数据源。Sentinel-2光学影像的红边、近红外和短波红外等波段提供了多种光谱信息,在树种识别研究中具有巨大潜力,IMMITZER等[14]利用Sentinel-2数据证实了其红边和短波红外波段对植被分类制图具有高价值。但是在光学卫星覆盖不足区域,雷达数据可以作为补充数据源。LECHNER等[36]使用Sentinel-1和Sentinel-2数据进行实验,结果表明在没有足够光学影像的情况下,加入Sentinel-1可以提高树种分类精度。

本研究采用Sentinel数据作为油茶提取数据源,利用不同特征进行油茶种植区提取。由于光谱特征相似,不同树种间存在不同程度混淆,仅利用光谱特征、植被指数、水体指数分类,树种的识别精度较低。MOHAMMADPOUR等[37]研究表明,将光谱特征与GLCM纹理特征结合可以提高树种分类精度。加入S1/S2纹理特征后油茶提取精度均有不同程度的提高,在油茶PA上表现出了比地形特征和红边指数更好的效果。

为了选择适合研究区地物的纹理特征,本研究利用代表地物区分度的累计差作为选择标准,统计不同地物在8个纹理特征下的特征均值,计算在不同纹理窗口尺寸的累计差,累计差越大,区分度越高。姚新华等[32]、杨振兴等[38]分别基于GF-2和Sentinel-2A遥感影像进行果树提取和森林覆盖分类研究,利用累计差确定的最佳窗口尺寸分别为15×15和9×9,本研究累计差在窗口尺寸35×35时达到最大。由此可知,不同影像、地物类型和不同研究区的最佳纹理特征窗口尺寸也有所不同。

本研究仍存在一些不足之处。由表3可知,经过特征优选后的组合分类结果精度最高,最优特征组合中包含11个Sentinel-2光谱波段、12个植被指数、4个水体指数、12个红边指数和2个地形特征。经ReliefF特征优选后,S1/S2纹理特征没有包含在最优特征集中,是因为研究所使用的植被指数、水体指数和红边指数都是经过先前研究筛选后的特征,剔除冗余特征后,剩余特征都是在研究区树种分类上具有高权重的特征。S1/S2纹理特征重要性均较小,但都能对分类结果提供正面影响,可作为油茶提取研究的优选特征。后续可增加指数特征数量进行相关研究。同时,受天气影响,本研究选用的Sentinel-2时间范围为9—12月,因为油茶属于常绿树种,且宜春市油茶花期为10月中、下旬至12月初[39],所以在研究时间段内Sentinel-2光学影像下的油茶物候变化并不显著,在接下来的研究中可利用Sentinel-1 SAR数据进行油茶物候特征分析。另一方面,本研究仅采用随机森林算法进行实验,在未来的研究中可利用更有效的数据集或者采用更为先进、高效的遥感分类技术,以深入开展大范围油茶识别监测的研究,使其能够更全面地评估不同方法在油茶遥感提取中的适用性,并为该领域的技术进步提供有益参考。

5 结论

(1)依据样本统计不同时相下油茶与其它地类的JM距离,得出Sentinel-1最佳分离度时相为12月10日,Sentinel-2最佳分离度时相为10月2日,将其作为纹理特征提取时相。用累计差法确定的最佳纹理特征提取窗口尺寸为35×35,最佳纹理特征组合为均值、方差和对比度。

(2)根据不同特征组合分类结果精度,油茶在不同特征上具有一定差异性。在植被、水体指数的基础上加入不同特征,红边指数、雷达特征、地形特征和S1/S2纹理特征分别使树种分类总体精度提高2.92、3.4、4.35、5.45、5.41个百分点。

(3)不同类型特征对油茶提取的有利程度由大到小依次为S2纹理特征、S1纹理特征、地形特征、雷达特征、红边指数、植被-水体指数。通过Sentinel-1和Sentinel-2数据提取的纹理特征都可以较好地应用于油茶区提取。

参考文献

[1] 刘健,龙蔚,陈苏徽,等. 江西省油茶林资源现状与规模经营占比关系[J].福建林业科技,2022,49(4): 113-119.LIU Jian, LONG Wei, CHEN Suhui, et al. Study on the relationship between the present situation of Camellia oleifera forest resources and the proportion of scale management in Jiangxi Province[J]. Journal of Fujian Forestry Science and Technology, 2022,49(4): 113-119. (in Chinese)

[2] 施茂寅,蔡德毓,刘小虎,等. 油茶产业推动乡村振兴的新引擎——江西油茶产业高质量发展纪实[J].国土绿化,2023(7): 38-41.SHI Maoyin, CAI Deyu, LIU Xiaohu, et al. Camellia oleifera industry to promote the new engine of rural revitalization:Jiangxi Camellia oleifera industry high-quality development record[J]. Land Greening,2023(7): 38-41.(in Chinese)

[3] 周欣兴,赵林,张文杰,等. 基于Sentinel-2多时相影像的果树种植区遥感提取[J].浙江农业学报, 2022,34(12): 2767-2777.ZHOU Xinxing, ZHAO Lin, ZHANG Wenjie, et al. Remote sensing extraction of fruit tree planting area based on Sentinel-2 multi-temporal images[J]. Acta Agriculturae Zhejiangensis, 2022,34(12): 2767-2777.(in Chinese)

[4] 宋承运,曲雪杉,胡光成,等. 基于NDVI-NSSI空间与HSV变换的成熟期农作物遥感识别[J].农业机械学报,2023,54(8):193-200.SONG Chengyun,QU Xueshan,HU Guangcheng, et al. Crop identification in mature stage with remote sensing based on NDVI-NSSI space and HSV transformation[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023,54(8):193-200.(in Chinese)

[5] 孟浩然,李存军,郑翔宇,等. 综合光谱纹理和时序信息的油茶遥感提取研究[J].光谱学与光谱分析, 2023, 43(5): 1589-1597.MENG Haoran, LI Cunjun, ZHENG Xiangyu, et al. Research on extraction of Camellia oleifera by integrating spectral,texture and time sequence remote sensing information[J]. Spectroscopy and Spectral Analysis, 2023, 43(5): 1589-1597.(in Chinese)

[6] 谷祥辉,张英,桑会勇,等. 基于哨兵2时间序列组合植被指数的作物分类研究[J].遥感技术与应用, 2020, 35(3):702-711.GU Xianghui, ZHANG Ying, SANG Huiyong, et al. Research on crop classification method based on Sentinel-2 time series combined vegetation index[J]. Remote Sensing Technology and Application, 2020, 35(3):702-711.(in Chinese)

[7] 靳宁,孙林,张东彦,等.基于CBAM-U-HRNet模型和Sentinel-2数据的棉花种植地块提取[J].农业机械学报,2023,54(11):159-168.JIN Ning,SUN Lin,ZHANG Dongyan, et al.Classification of cotton planting area using CBAM-U-HRNet model and Sentinel-2 data[J].Transactions of the Chinese Society for Agricultural Machinery,2023,54(11):159-168.(in Chinese)

[8] XI Y, REN C, TIAN Q, et al. Exploitation of time series Sentinel-2 data and different machine learning algorithms for detailed tree species classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(1): 7589-7603.

[9] 赵红伟,陈仲新,姜浩,等. 基于Sentinel-1A影像和一维CNN的中国南方生长季早期作物种类识别[J].农业工程学报,2020,36(3): 169-177.ZHAO Hongwei, CHEN Zhongxin, JIANG Hao, et al. Early growing stage crop species identification in southern China based on Sentinel-1A time series imagery and one-dimensional CNN[J]. Transactions of the CSAE,2020,36(3): 169-177.(in Chinese)

[10] 解毅,王佳楠,刘钰.基于Sentinel-1/2数据特征优选的冬小麦种植区识别方法研究[J].农业机械学报,2024,55(2):231-241.XIE Yi,WANG Jia’nan,LIU Yu. Research on winter wheat planting area identification method based on Sentinel-1/2 data feature optimization[J].Transactions of the Chinese Society for Agricultural Machinery,2024,55(2):231-241.(in Chinese)

[11] 查东平,蔡海生,张学玲,等.基于多时相Sentinel-1水稻种植范围提取[J].自然资源遥感, 2022,34(3): 184-195.ZHA Dongping, CAI Haisheng, ZHANG Xueling, et al. Extraction of paddy fields using multi-temporal Sentinel-1 images[J].Remote Sensing for Natural Resources, 2022,34(3): 184-195.(in Chinese)

[12] 严恩萍,棘玉,尹显明,等.基于无人机影像自动检测冠层果的油茶快速估产方法[J]. 农业工程学报, 2021,37(16):39-46. YAN Enping,JI Yu,YIN Xianming, et al. Rapid estimation of Camellia oleifera yield based on automatic detection of canopy fruits using UAV images[J]. Transactions of the CSAE, 2021,37(16):39-46.(in Chinese)

[13] 吴炅,蒋馥根,彭邵锋,等. 结合树冠体积的油茶树高与产量估测研究[J].南京林业大学学报(自然科学版), 2022,46(2): 53-62.WU Jiong, JIANG Fugen, PENG Shaofeng, et al. Estimating the tree height and yield of Camellia oleifera by combining crown volume[J].Journal of Nanjing Forestry University(Natural Sciences Edition), 2022,46(2): 53-62.(in Chinese)

[14] IMMITZER M, VUOLO F, ATZBERGER C. First experience with Sentinel-2 data for crop and tree species classifications in central Europe[J]. Remote Sensing, 2016, 8(3): 166.

[15] WESSEL M, BRANDMEIER M, TIEDE D. Evaluation of different machine learning algorithms for scalable classification of tree types and tree species based on Sentinel-2 data[J]. Remote Sensing, 2018, 10(9): 1419.

[16] PERSSON M, LINDBERG E, REESE H. Tree species classification with multi-temporal Sentinel-2 data[J]. Remote Sensing, 2018, 10(11): 1794.

[17] 于飞,吕争,隋正伟,等. 基于特征优选的多时相SAR数据水稻信息提取方法[J].农业机械学报, 2023,54(3): 259-265, 327.YU Fei, LÜ Zheng, SUI Zhengwei, et al. Extraction of rice information using multi-temporal SAR data based on feature optimization[J].Transactions of the Chinese Society for Agricultural Machinery, 2023,54(3): 259-265, 327.(in Chinese)

[18] 唐琪,李恒凯,周艳兵,等.基于Sentinel-2与时序Sentinel-1 SAR特征的赣南柑橘种植区识别方法[J].农业机械学报,2024,55(3):193-202. TANG Qi, LI Hengkai, ZHOU Yanbing, et al. Identification of Gannan citrus planting area based on Sentinel-2 and temporal Sentinel-1 SAR features[J].Transactions of the Chinese Society for Agricultural Machinery,2024,55(3):193-202.(in Chinese)

[19] 李俐,孔庆玲,王鹏新,等. 基于时间序列Sentinel-1A数据的玉米种植面积监测研究[J].资源科学, 2018,40(8): 1608-1621.LI Li, KONG Qingling, WANG Pengxin, et al. Monitoring of maize planting area based on time-series Sentinel-1A SAR data[J].Resources Science, 2018,40(8): 1608-1621.(in Chinese)

[20] 乔树亭,叶回春,黄文江,等. 基于Sentinel-1/2影像的水稻种植面积提取方法研究——以三江平原为例[J].遥感技术与应用, 2023,38(1): 78-89.QIAO Shuting, YE Huichun, HUANG Wenjiang, et al. Study on extraction method of rice planting area based on Sentinel-1/2 image: a case study of Sanjiang Plain[J].Remote Sensing Technology and Application, 2023,38(1): 78-89.(in Chinese)

[21] SLAGTER B, TSENDBAZAR N E, VOLLRATH A, et al. Mapping wetland characteristics using temporally dense Sentinel-1 and Sentinel-2 data: a case study in the St. Lucia wetlands, South Africa[J]. International Journal of Applied Earth Observation and Geoinformation, 2020, 86: 102009.

[22] 明義森,刘启航,柏荷,等. 利用光学和SAR遥感数据的若尔盖湿地植被分类与变化监测[J].遥感学报, 2023,27(6): 1414-1425.MING Yisen, LIU Qihang, BAI He, et al. Classification and change detection of vegetation in the Ruoergai Wetland using optical and SAR remote sensing data[J].National Remote Sensing Bulletin, 2023,27(6): 1414-1425.(in Chinese)

[23] BALLING J, HEROLD M, REICHE J. How textural features can improve SAR-based tropical forest disturbance mapping[J]. International Journal of Applied Earth Observation and Geoinformation, 2023, 124: 103492.

[24] 袁培森,曹益飞,马千里,等.基于Random Forest的水稻细菌性条斑病识别方法研究[J].农业机械学报,2021,52(1):139-145, 208.YUAN Peisen,CAO Yifei,MA Qianli, et al. Identification method of rice bacterial leaf streak based on Random Forest[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021,52(1):139-145, 208.(in Chinese)

[25] WANG M, LI M, WANG F, et al. Exploring the optimal feature combination of tree species classification by fusing multi-feature and multi-temporal Sentinel-2 data in Changbai Mountain[J]. Forests, 2022, 13(7): 1058.

[26] 侯蒙京,殷建鹏,葛静,等. 基于随机森林的高寒湿地地区土地覆盖遥感分类方法[J].农业机械学报, 2020, 51(7): 220-227.HOU Mengjing, YIN Jianpeng, GE Jing, et al. Land cover remote sensing classification method of alpine wetland region based on random forest algorithm[J].Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(7): 220-227.(in Chinese)

[27] 简海燕.充分利用气候资源为发展袁州优质高产油茶服务[J].经营管理者, 2009(16): 156-157, 151.JIAN Haiyan. Making full use of climate resources for the development of high-quality and high-yield Camellia oleifera in Yuanzhou[J]. Manager’ Journal, 2009(16): 156-157, 151.(in Chinese)

[28] 刘卓.袁州区油茶产业发展对策研究[D].南昌:江西农业大学, 2012.LIU Zhuo. The research on the development countermeasure of Camellia oleifera industry in Yuanzhou District[D].Nanchang: Jiangxi Agricultural University, 2012.(in Chinese)

[29] BRUZZONE L, ROLI F. An extension of the Jeffreys-Matusita distance to multiclass cases for feature selection[J]. IEEE Transactions on Geoscience Remote Sensing, 1995, 33(6): 1318-1321.

[30] KONONENKO I. Estimating attributes: analysis and extensions of RELIEF[C]∥Proceedings of the 1994 European Conference on Machine Learning, 1994: 171-182.

[31] KIRA K, RENDELL L A. The feature selection problem: traditional methods and a new algorithm[C]∥AAAI,1992: 129-134.

[32] 姚新华,金佳,徐飞飞,等. 太湖流域果树提取的光谱和纹理特征选择研究[J].中国生态农业学报(中英文), 2019,27(10): 1596-1606.YAO Xinhua, JIN Jia, XU Feifei, et al. Research on spectral and texture feature selection for fruit tree extraction in the Taihu Lake Basin[J].Chinese Journal of Eco-Agriculture, 2019,27(10): 1596-1606.(in Chinese)

[33] BREIMAN L. Random forest[J]. Machine Learning, 2001, 45(1):5-32.

[34] LIN W Y, WANG F, CHENG M M, et al. CODE: coherence based decision boundaries for feature correspondence[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(1): 34-47.

[35] 严恩萍,棘玉,尹显明,等. 基于无人机影像自动检测冠层果的油茶快速估产方法[J].农业工程学报, 2021,37(16):39-46.YAN Enping, JI Yu, YIN Xianming, et al. Rapid estimation of Camellia oleifera yield based on automatic detection of canopy fruits using UAV images[J].Transactions of the CSAE, 2021,37(16):39-46.(in Chinese)

[36] LECHNER M, DOSTLOV A, HOLLAUS M, et al. Combination of Sentinel-1 and Sentinel-2 data for tree species classification in a central European biosphere reserve[J]. Remote Sensing, 2022, 14(11): 2687.

[37] MOHAMMADPOUR P, VIEGAS D X, VIEGAS C. Vegetation mapping with random forest using Sentinel 2 and GLCM texture feature—a case study for Lousã Region, Portugal[J]. Remote Sensing, 2022, 14(18): 4585.

[38] 杨振兴,文哲,张贵,等. 基于Sentinel-2A 数据的森林覆盖变化研究[J].中南林业科技大学学报, 2020,40(8): 53-62.YANG Zhenxing, WEN Zhe, ZHANG Gui, et al. Research on forest cover change based on Sentinel-2A data[J].Journal of Central South University of Forestry &Technology, 2020,40(8): 53-62.(in Chinese)

[39] 左继林,温强,王波,等. 赣区油茶主栽良种花期调查[J].福建林业科技, 2023,50(2): 116-122.ZUO Jilin, WEN Qiang, WANG Bo, et al. Reliminary examinationon the florescence of the main varieties of Camellia oleifera of Jiangxi Region[J].Journal of Fujian Forestry Science and Technology, 2023,50(2): 116-122.(in Chinese)

Extraction of Camellia oleifera Planting Areas in Southern Hilly Area by Combining Multi-features of Time-series Sentinel Data

LI Hengkai1 WANG Jie1 ZHOU Yanbing2 LONG Beiping3

(1.School of Civil and Surveying and Mapping Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China 2.Research Center of Information Technology, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China 3.Geographic Information Engineering Brigade, Jiangxi Provincial Bureau of Geology, Nanchang 330001, China)

AbstractAs one of the economic forest species in Jiangxi Province, Camellia oleifera is also a characteristic advantageous industry in Jiangxi Province, and it is of great significance to accurately obtain its spatial distribution in terms of yield estimation, production management and policy formulation. In response to the lack of optical images due to the cloudy and rainy climate in the south, as well as the problem of fragmented terrain in hilly and mountainous areas, Yuanzhou District, Yichun City, Jiangxi Province, was taken as the study area. Using time-series Sentinel satellite imagery and SRTM DEM data as data sources, a total of 125 feature variables were constructed and selected, including spectral features, vegetation-water indices, red edge indices, radar features, terrain features and texture features. Among them, the texture features were calculated by comparing 15 different scale windows by using the cumulative difference method to calculate the best texture features for Sentinel-1 and Sentinel-2 images. Based on ReliefF feature preference algorithm and random forest classification algorithm, eight feature combination schemes were designed to carry out experiments to explore the impact of different feature types on the extraction accuracy of Camellia oleifera. The results showed that the optimal texture feature window for both Sentinel-1 and Sentinel-2 calculated experimentally by using the cumulative difference method was 35×35, and the optimal texture feature combinations were mean, variance and contrast. Building upon spectral features and vegetation-water indices, the incorporation of different features for Camellia oleifera classification demonstrated varying degrees of effectiveness. The favorability ranking of different feature types for Camellia oleifera extraction from large to small was as follows: S2 texture features, S1 texture features, terrain features, radar features and red edge index. Compared with single-spectrum and index features, the inclusion of texture features significantly enhanced classification accuracy. The synergistic classification results of multiple features surpass those of single-feature classification, with the highest precision achieved through Camellia oleifera extraction based on feature selection. The ReliefF algorithm feature optimized scheme had the highest accuracy with overall accuracy of 88.29% and Kappa coefficient of 0.81. This study utilized time-series Sentinel satellite imagery and DEM terrain data to develop a large-scale remote sensing extraction method for Camellia oleifera in the cloudy and rainy southern hilly mountainous region. This method can serve as a reference for the investigation and monitoring of Camellia oleifera resources in the hilly areas of southern China.

Key wordsCamellia oleifera; extraction of planting area; Sentinel-1; Sentinel-2; feature optimization; cumulative difference; ReliefF algorithm

中图分类号:TP753, S127

文献标识码:A

文章编号:1000-1298(2024)07-0241-11

OSID:

doi:10.6041/j.issn.1000-1298.2024.07.023

收稿日期:2023-11-14

修回日期: 2023-12-30

基金项目:江西省自然科学基金项目(20232ACB203025)、江西省高校人文社科研究项目(JC21123)、自然资源部重点实验室开放基金项目(MEMI-2021-2022-10)和江西省自然科学基金青年项目(20224BAB213038)

作者简介:李恒凯(1980—),男,教授,博士,主要从事资源环境遥感建模与分析研究,E-mail: lihengkai@jxust.edu.cn

通信作者:周艳兵(1979—),男,副研究员,主要从事农业地理信息和农业资源管理技术研究,E-mail: zhouyb@nercita.org.cn