基于无人机多维数据集的森林地上生物量估测模型研究

孙 钊1 谢运鸿2 王宝莹2 谭 军1 王轶夫2 孙玉军2

(1.中国地质调查局军民融合地质调查中心, 成都 610036;2.北京林业大学森林资源和环境管理国家林业和草原局重点开放性实验室, 北京 100083)

摘要:森林地上生物量(Aboveground biomass,AGB)是评价森林生长情况的重要指标。基于数字航空摄影(Digital aerial photography,DAP)生成的二维和三维数据,分别计算了41个点云高度变量和16个可见光植被指数,利用6种回归算法(随机森林(RF)、袋装树(BT)、支持向量回归(SVR)、Cubist、类别型特征提升(CatBoost)、极端梯度提升(XGBoost))分别构建了单一变量集和综合变量集AGB估测模型,探索了不同变量对于AGB估测模型的贡献。研究结果表明光谱数据集和点云数据集AGB预测模型精度最高分别为Cubist和XGBoost,R2分别为0.530 9和0.639 5。 组合数据集最高精度模型为XGBoost,R2达到0.760 1, XGBoost模型具有更高的AGB估测稳定性。研究还表明6种机器学习模型的贡献主要取决于所考虑的回归方法,所选择的特征个数和特征对模型的重要性在不同的模型中并不一致。DOM光谱特征在AGB的估测中具有更高的重要性。总体来说,二维和三维数据的结合能够有效提高森林AGB估测精度,基于无人机倾斜摄影获取的RGB影像能够实现森林AGB的快速无损估计。

关键词:森林地上生物量; 估测模型; 无人机密集点云; SfM; 可见光植被指数; 机器学习

0 引言

森林是人类宝贵的自然资源,森林资源调查是林业经营管理的基础核心任务。地上生物量(Aboveground biomass,AGB)是评价森林碳储量和林业碳汇的重要指标[1-3],因此,及时、准确地获取森林AGB信息尤为重要。对森林进行破坏性采样是最准确和可靠的测量AGB的方法[4],但是大量破坏森林不现实且耗时、耗力、成本较高[5]。随着遥感技术的发展、遥感数据的积累和方法的普及,遥感技术在一定程度上解决了危险地区复杂地形下森林资源人工调查困难的问题[6],其在森林资源调查中取得了广泛的应用,如森林分布制图、生物量估测等[7],极大提高了森林资源调查的效率,满足了高效大规模森林资源调查的需求[8-10]

近年来,许多研究在森林AGB估算方面将光学卫星和雷达数据与地面测量数据相结合[11-13]。但被动光学遥感数据主要用于提供森林平面测量信息,如归一化植被指数(Normalized difference vegetation index, NDVI)等光谱信息,在提供森林垂直结构信息方面有很大的局限性[14]。作为一种主动遥感技术,激光雷达(Light detection and ranging,LiDAR)具有很强的穿透性,在提取森林垂直结构参数方面具有很大优势[15],在估计林下地形[16]、树高[17]和森林生物量[18]等参数方面发挥重要作用。然而,机载LiDAR的数据采集和处理成本太高,空间LiDAR的分辨率低,这限制了LiDAR技术在森林资源调查中的实际应用。因此,寻找一种高效、低成本的方法来估测森林AGB是非常必要和迫切的。

无人机数字摄影测量技术具有低成本、高灵活性和可重复性的优点[19-20]。利用多角度获取的无人机影像,由运动恢复结构(Structure from motion,SfM)算法和多视角立体视觉(Multi-view stereo,MVS)技术生成高分辨率数字航空摄影(Digital aerial photography, DAP)RGB图像和三维密集匹配点云在大尺度的森林生物量估算中非常有效[21-23]。其中,点云数据可以反映森林的三维结构特征,RGB光谱信息构建的可见光植被指数可以反映森林冠层信息和AGB分布特征。然而,目前的研究集中在结构简单且林分条件较好的森林中,仅使用点云变量[24]或者植被指数[25]进行AGB估计,很少有联合2种变量进行AGB估计,2种变量集对于AGB的贡献未得到充分探索。

此外,由于树冠遮挡,不可避免地会出现一些DAP点云缺失[26]。因此,有必要研究减少点云损失的方法。当使用无人机图像和DAP点云来估计AGB时,回归模型会在一定程度上影响森林参数的预测精度,有必要确定一个适当的回归算法来建立AGB模型。TIAN等[27]研究表明,机器学习算法可以更好地基于样本数据和无人机数据估计红树林的AGB。除了确定适当的回归算法外,另一个重要的步骤是为AGB估计选择贡献最大的变量集。GUYON等[28]研究表明,递归特征消除(Recursive feature elimination,RFE)可以最大化模型性能。RFE不仅降低了模型的复杂度,而且避免了过拟合,提高了泛化效率。选择少量指标通常有助于模型的解释及其在大尺度森林下的反演和适用性[29]。在使用DAP点云进行单木生物量建模时,插值的点云会对单木参数造成一定的影响,所以本文采用小样方作为生物量估测单元。

机器学习算法可以很好地处理非线性关系,无人机图像和DAP点云数据可以有效和准确地用于估计AGB。但只有少数研究关注于DAP数据带来的二维和三维数据对于AGB估测的贡献。借鉴这些研究,本文利用DAP点云数据和数字正射影像(Digital orthophoto mosaic, DOM)来评估2种变量集估计AGB的潜力。使用DAP带来的二维和三维数据进行不同回归算法建模,充分探讨DAP数据在森林参数反演中的可行性。

1 材料和方法

1.1 研究区概况

研究区位于福建省三明市将乐国有林场(北纬26°40′~26°50′,东经117°25′~117°35′)。地处福建省西北部,属亚热带季风气候,年平均温度为18.8℃。降水主要集中在夏季,年平均降水量为1 750 mm,最高海拔1 203 m,最低海拔140 m,平均海拔400~800 m, 区内森林多为人工林,以针叶林为主,少数为混交林。林区主要的针叶树种为杉木(Cunninghamia lanceolata)和马尾松(Pinus massoniana),阔叶树种主要为枫香(Liquidambar formosana)和木荷(Schima superba),杉木种植面积最大。

1.2 地面调查数据

2021年7月进行地面数据采样。无人机飞行区域内均为杉木,其中有少量阔叶和马尾松,按照10 m×10 m的网格测量该区域所有胸径大于5 cm的树木,用TruPulse220型激光测高器测量树高,林冠层以下枯死和被遮挡的小树不进行测量。同时,利用中海达D8 ProRTK型测量仪对每个样地西南角点位置进行定位,在测量时记录每个角点手簿差分固定解,水平和垂直精度在0.02 m以内。共计调查200个样方(图1),删除其中包含马尾松和阔叶的样方以及边缘样方,保留151个10 m×10 m样地(表1)。

表1 样地测量数据统计分析

Tab.1 Statistical analysis of measured field data

样本特征胸径/cm树高/m地上生物量/kg最大值最小值平均值标准差39.7010.8021.685.2724.8017.3022.071.772677.151034.201956.01338.87

图1 研究区概况及样地分布

Fig.1 Location of study site and sample plots site

根据测得的胸径和树高,根据行业标准“立木生物量模型及碳计量参数——杉木”[30]地上生物量模型计算每个样地生物量,以此作为生物量真实值。单木生物量计算式为

M=0.032 718D2.110 93H0.602 12 (D≥5 cm)

(1)

式中 M——单木生物量,kg

D——胸径,cm

H——树高,m

1.3 无人机飞行和摄影测量数据采集

大疆悟INSPIRE 2型无人机被用来获取研究区域的图像,并生成摄影测量产品作为原始数据。该无人机的质量和最大飞行高度分别为3 440 g和2 500 m,飞行时间和最高巡航速度分别为23 min和94 km/h。起飞和降落是完全自动的,在任务参数(飞行高度、任务区域、飞行重叠度等)设定后,航点信息被传送到无人机上,自动执行任务。

由于树冠遮挡和航点位置分布不可避免地会出现一些DAP点云的缺失[26,31-32]。为了提高目标区域的匹配点云密度,减少周边区域的影像冗余,利用交叉航路飞行(图2)的方法来提升密集点云数量,增加参与空三的影像数量[33],飞行任务是用DJI GO 4 APP设置的,第1条路线(航线1)考虑整个研究区域内航向和旁向80%的图像重叠率,然后第2条路线(航线2)考虑目标区域内航向和旁向85%的图像重叠率。2条路线最终共获得129幅图像,平均地面采样距离(Ground sample distance,GSD)约为4 cm,这两条路线高度均为200 m,速度为5 m/s(表2)。在航拍之前,在空旷地带用1 m×1 m的纸板(红色L标记)标记10个地面控制点(Ground control points,GCPs)。GCP的位置由中海达D8 ProRTK型测量仪测量,平均水平和垂直精度控制在±0.02 m以内,用于图像数据校准处理。这也被用作地理参考,以确保影像上各样地的位置与地面数据相匹配。由于无人机倾斜影像的离散点云在林下区域没有地面点,所以沿着等高线以10 m的间隔收集GPS高程信息,并以此创建数字高程模型(Digital elevation model,DEM),用于归一化DAP点云数据。

表2 无人机飞行参数

Tab.2 UAV flight parameters

参数航线1航线2飞行平均高度/m200200重叠度/%8085飞行速度/(m·s-1)55图像数量8445相机朝向NadirNadir平均地面采样距离/cm44面积/hm212.86

图2 交叉航路飞行

Fig.2 Cross-route flight

为了避免阴影和风的影响,确保图像质量,为无人机飞行选择一个光线充足且基本无风的环境,在2021年7月某日的中午进行无人机飞行。

1.4 倾斜摄影测量数据处理

SfM技术是一种基于大量无序图像的三维结构重建的算法。SfM按以下步骤工作,首先它从图像中提取焦点信息,然后进行特征检测和匹配。最后,它通过迭代捆绑调整自动解决相机方向和场景信息[34]。SfM技术可以在一些商业软件中执行,这使得可以快速准确地对齐图像,计算DAP三维密集点云,然后重建目标物体的纹理网格。

所有的无人机图像数据都是用SfM方法处理的。并通过Pix4D(2016)制图软件(v4.4.12, Pix4D, 瑞士)对图像进行处理,通过无人机单幅影像的拼接、地形和相机畸变校正,生成数字表面模型(Digital surface model, DSM)、数字正射影像(Digital orthophoto mosaic, DOM)以及DAP点云。三维密集化点的数量为15 429 728,研究区点云的平均密度为51.72个/m3

得到研究区域的三维模型后,利用LiDAR360 5.1软件(数字绿土科技股份有限公司,北京)处理DAP点云数据(图3)。

图3 归一化DAP点云示例

Fig.3 Examples of normalized DAP point clouds

1.5 特征提取

1.5.1 基于DOM的可见光植被指数

植被指数(Vegetation index)反映了地表植被的生长状况,是提取森林生物量、叶绿素指数等[6]的重要因子。现有的植被指数形式各样,广泛应用于植被分类、植被覆盖度监测和区域土地利用变化中[35]。研究以仅含R、G、B 3个可见光波段的航摄数据为数据源,借鉴多光谱植被指数的构造原理和形式[36],在每个小样方单元通过构建16种不同的可见光植被指数来分析植被指数因子对AGB估测的能力,使用RGB可见光波段的DN值来取代反射率构建可见光植被指数,二维植被指数可以在一定程度上反映植被生长差异。16种可见光植被指数[6,37-42]分别为:可见光差异植被指数(VDVI)、可见光大气阻抗指数(VARI)、绿红比值指数(GRRI)、绿蓝比值指数(GBRI)、红蓝比值指数(RBRI)、模拟NDVI的植被指数(VI)、超绿超红差分指数(ExGR)、超绿指数(ExG)、绿叶植被算法(GLA)、归一化绿红差分指数(NGRDI)、植被指数(VEG)、植被提取颜色指数(CIVE)、联合指数(COM)、R、G、B。

1.5.2 基于DAP点云的点云参数

目前已经提出了几种点云指标作为森林AGB的潜在预测因子[23,29],点云高度变量(如高度百分位数、平均值、中位数和标准差)可以反映林冠的垂直结构信息,点云密度变量可以反映森林冠层的水平结构信息。点云变量可以从三维角度突出森林植被信息,从而有效估计森林AGB[43]。由于DAP点云的特性,所以本文未选择冠层盖度和LAI变量,最后共计提取了41个点云变量(表3)。

表3 三维特征变量及描述

Tab.3 Feature variables and descriptions

变量类型变量描述点云高度变量H_1th, H_5th, H_10th, H_20th, H_25th, H_30th, H_40th, H_50th, H_60th, H_70th, H_75th, H_80th, H_90th, H_95th, H_99th高度百分位数(1th, 5th, 10th, 20th, 25th, 30th, 40th, 50th, 60th, 70th, 75th, 80th, 90th, 95th, 99th)H_AAD平均绝对偏差H_CRR冠层起伏率H_IQ高度百分位数4分位数间距(H_75-H_25)H_CV变异系数(H_STD/H_MEAN×100%)H_AIH_IQ累计高度百分位数4分位数间距H_KURT峰度H_MAD中位数绝对偏差H_MAX最大值H_MIN最小值H_MEAN平均值H_MEDIAN中位数H_SKE偏斜度H_STD标准差H_V方差H_SQRT2次幂平均值H_CURT3次幂平均值点云密度变量D_1, D_2, D_3, D_4, D_5, D_6, D_7, D_8, D_9, D_10将点云数据从低到高分成10个相同高度的切片,每层回波数的比例就是相应的密度变量

由于各特征变量信息非常丰富且大小差异显著,对变量进行数据归一化(Normalization)是进行机器学习或者深度学习前提高模型预测性能的一个重要步骤[44]。归一化是一种简化计算的方式,归一化使所有变量具有(或缩放到)同等权重,避免变量之间数值差异较大,影响机器学习算法性能,从而提高数据关键信息的挖掘能力。本研究中,提取光谱和点云变量之后对所有遥感变量采用Z-Score的方法来进行数据的归一化(或数据标准化),计算式为

(2)

式中 x*——归一化后变量

x——待归一化的特征变量

μ——特征变量均值

σ——特征变量标准差

如果x的分布接近正态分布,则归一化后的新特征变量的分布近似一个平均值为0、方差为1的标准正态分布。

1.6 生物量回归模型

本研究选择6种机器学习回归算法:随机森林(Random forest, RF)、袋装树(Bagged tree,BT)、支持向量回归(Support vector regression, SVR)、Cubist、类别型特征提升(Categorical boosting, CatBoost)、极端梯度提升(Extreme gradient boosting, XGBoost)来进行3种数据源(DOM光谱数据、DAP点云数据、组合数据源)森林AGB回归建模,比较各模型的性能以及对森林特征参数AGB的预测能力,表4对每个模型的超参数及取值范围进行了概述。

表4 使用的回归模型的描述以及超参数调整范围

Tab.4 Description of regression models used and range of hyperparameter tuning

注:超参数数值前2个值为取值范围,第3个值为步长,如C为(1, 10, 1),则C的取值范围为1~10,步长为1。

类型缩写模型超参数超参数描述R包基于核的模型SVR支持向量回归C为(1, 10, 1)gamma为(0, 0.2, 0.01)惩罚常数核函数的带宽参数caret,e1071RF随机森林mtry为k/3,k为预测值个数ntree为(100, 1000, 100)输入特征数量树的个数caret,randomForest基于树的模型BT袋装树oob_score(True/False)逻辑值caret,ipredCubistCubistcommittees为(1, 100, 10)neighbors为(0, 9, 1)回归树的个数最近邻法考虑的样本数caret,cubist基于梯度提升决策树CatBoost类别型特征提升depth为(1, 10, 1)learning_rate为(0.01, 0.1, 0.01)l2_leaf_reg为(1, 10, 1)rsm为(0.1, 1, 0.1)树的最大深度学习率L2正则项随机子样本数量caret,catboostXGBoost极端梯度提升eta为(0.01, 0.1, 0.01)max_depth为(1, 10, 1)gamma为(0, 1, 0.1)colsample_bytree为(0, 1, 0.1)min_child_weight为(1, 10, 1)subsample为(0, 1, 0.1)学习率决策树的最大深度树枝剪参数训练特征比例每个叶子节点最小样本权重用于训练样本的比例caret,xgboost

1.7 特征选择

在建模之前,先利用Pearson相关性分析删除没有相关性的变量之后,利用R语言caret包中findCorrelation函数删除高度相关的指标(相关系数大于0.98),为了比较DAP点云参数和光谱参数对于建模的贡献,基于二维和三维特征设计2种单一变量集和组合变量集的3种建模数据集。

分别采用递归特征消除(Recursive feature elimination,RFE)和Boruta进行建模特征筛选,其中RF、BT、SVR、Cubist算法在caret包中的rfeControl控制选项中有预定义函数模型,这4种机器学习算法采用RFE并选择相应的预定义模型进行特征筛选,每个样地的AGB作为响应变量,用均方根误差(Root mean squared error,RMSErfe)来评估输入特征数量对模型性能的影响,通过5倍交叉验证重复10次进行量化[28-29]。而CatBoost和XGBoost算法本身具有特征筛选的能力,即使不进行特征筛选,模型也会进行特征的筛选,从而得到较好的结果,但是文献[45]的研究使用Boruta进行特征变量筛选之后再进行2种算法的建模,在降低算法冗余减少运算时间的同时,往往会取得更好的拟合效果。

1.8 精度验证

为了验证模型的准确性,采用十折交叉验证法来验证模型性能,以决定系数(R2)、相对均方根误差(Relative root mean squared error,rRMSE)和RMSE评价不同回归模型的准确性。

2 结果与分析

2.1 森林地上生物量建模变量选取结果

为了明确基于无人机倾斜摄影获取的森林二维和三维特征对于森林地上生物量估测的影响,分别利用DOM获取的光谱参数(二维特征)、DAP点云参数(三维特征)以及结合二者进行森林地上生物量反演。在进行建模特征选择之前,先通过Pearson相关性分析,分别从光谱参数、DAP点云和组合数据源中剔除了与单木特征参数在0.01水平不相关的变量,同时去除相关系数大于0.98的变量,包括点云变量9个(H_CRR、H_SKE、D1、D2、D3、D5、D6、D7、D10),光谱变量3个(GBRI、G_band、B_band),DOM光谱、DAP点云以及组合数据源分别保留13、32、45个变量,再将剩余的变量进行6种回归算法的建模特征筛选,建模之前输入特征数量的增加并不能有效地提高模型的性能,当2种数据合并时,各机器学习回归模型并不是简单的对单独的2种数据中所选择的特征进行相加(比如RF在DOM、DAP点云和组合数据中所选特征个数分别为12、16、22),而是对各特征的贡献进行了重新计算,达到预定义模型的最优性能。各机器学习回归模型的RMSErfe均低于单一数据(DOM和DAP点云),这表明各模型均很好地结合了2种数据中与响应变量更为相关的特征。最终各模型选择预定义估测精度最高的特征子集进行后续建模。结果如表5所示。

表5 3种数据源下各模型建模特征选择个数

Tab.5 Number of feature selections for each model

注:CatBoost和XGBoost均使用Boruta选择的特征变量进行建模,这2种算法没有RMSErfe结果,特征选择结果为Confirmed和Rejected数量。

数据类型模型特征选择方法特征个数RMSErfe/kgDOM光谱RFBTSVRCubistCatBoostXGBoostRFEBoruta12240.213243.013229.311225.813ConfirmedDAP点云RFBTSVRCubistCatBoostXGBoostRFEBoruta16195.613205.811199.725238.420ConfirmedDOM光谱+DAP点云RFBTSVRCubistCatBoostXGBoostRFEBoruta22163.826186.635154.235169.238Confirmed

2.2 森林地上生物量估测结果及精度分析

图4、表6展示了3种数据集利用不同回归算法估计森林AGB的结果,可以看出,单一数据源建模精度在6种回归算法中精度均较低,除了Cubist算法,仅利用光谱参数建模精度均低于点云的预测结果。2种单一数据集的最优模型分别为Cubist(R2为0.530 9)和XGBoost(R2为0.639 5)。结合光谱和点云参数进行AGB预测时,6种模型预测精度均有了较大提升,十折交叉验证得到的模型决定系数R2分别达到0.759 5、0.691 5、0.750 8、0.671 9、0.742 4、0.760 1,RMSE分别为163.3、187.6、165.9、196.7、172.8、158.7 kg,组合数据最优模型为XGBoost,相较于DOM光谱数据源和DAP点云数据源的最优模型,R2分别提高了0.229 2、0.120 6,RMSE降低了73.8、48.5 kg,由rRMSE可以看出,6种机器学习回归模型之间存在一定的差异,DOM光谱数据(11.89%~13.04%)、DAP点云数据(10.59%~12.80%)、组合数据(8.11%~10.06%),从3种数据集的结果可以看出,没有单一的最优模型,在输入不同的变量时,模型的性能差异较大,但是不同模型均能通过2种数据源的结合来提高AGB预测精度。

表6 不同数据集下各回归算法的性能统计

Tab.6 Performance statistics of each regression algorithm with different data sets

注:*为DOM光谱数据最优算法,**为DAP点云数据最优算法,***为组合数据最优算法。

模型数据集特征个数R2RMSE/kgrRMSE/%光谱参数120.4554252.612.91RFDAP点云参数160.6030221.611.33DAP点云参数+光谱参数220.7595163.38.35光谱参数130.4631248.112.68BTDAP点云参数130.5269237.812.16DAP点云参数+光谱参数260.6915187.69.59光谱参数130.5065235.712.05SVRDAP点云参数110.5319235.512.04DAP点云参数+光谱参数350.7508165.98.48光谱参数110.5309∗232.511.89CubistDAP点云参数250.4653250.312.80DAP点云参数+光谱参数350.6719196.710.06光谱参数130.4665249.512.76CatBoostDAP点云参数200.6130219.711.23DAP点云参数+光谱参数380.7424172.88.84光谱参数130.4432255.113.04XGBoostDAP点云参数200.6395∗∗207.210.59DAP点云参数+光谱参数380.7601∗∗∗158.78.11

图4 不同数据集下各回归算法的森林AGB估测结果(1∶1虚线仅供参考)

Fig.4 AGB estimation results for each regression algorithm with different data sets (1∶1 dotted line was for reference only)

图5展示了3种数据集最优模型的变量相对重要性,光谱指标占据最重要的位置(COM),虽然选择更多的点云变量(13个),但是光谱变量占据更为重要的位置,这些可见光植被指数所反映的光谱信息对AGB的估计十分重要,点云高度变量比点云密度变量(D1-10)更为重要,信息量最大的点云变量为高度百分位数4分位数间距(H_IQ)。

图5 3种数据集最优回归算法中变量相对重要性排名

Fig.5 Relative importance ranking of variables in optimal regression algorithm of three data sets

3 讨论

3.1 建模特征选择

在使用同一数据集进行森林AGB预测时,不同模型输入的变量不同,这与PENG等[46]的研究结果一致。杉木作为典型的用材针叶树种,其树冠基本为圆锥体,DAP点云可以将这些特征数字化,并且很好地反映林冠层的森林垂直结构信息,但是由于DAP点云是通过SfM-MVS算法生成的,DAP点云只是和LiDAR点云类似,并不具有穿透性,影像未获取的林下结构不能很好地体现,插值的点云以及密集的树冠表层,导致了点云高度百分位数反映的森林冠层信息受到了很大的限制, 同时由图5组合数据源结果可以看出,DAP点云参数在建模时的重要值并不如高分辨率无人机影像所提供的光谱信息。在综合数据集中,一些点云变量仍体现出了高重要性(H_AAD、H_IQ),这主要是由于林分的复杂性和林分密度的相关性,这些指标均能体现出点云高度,直观体现三维重建的冠体尺寸,这与生物量有着较高的相关性。利用无人机高分辨率影像构建的可见光植被指数能够有效地区分植被和其他背景特征(COM、NGRDI),并且植被指数与森林AGB有着高度的相关性[25,40]

3.2 单一数据集和综合数据集预测AGB比较

本研究证实了DAP点云参数和光谱参数的结合能够有效提高森林AGB预测精度,这与LEI等[42]的研究一致,2种单一数据集模型预测性能均较差,但光谱数据集的整体性能要高于单一点云数据集。DAP点云重建的树冠并不是完整的树冠,仅是真实树冠高出冠层的一部分,并且包含了大量插值生成的点云。同时,点云归一化所使用的DEM是地面测量的,其10 m的分辨率与真实的地形不完全相同,这影响了部分点云的归一化,也导致了点云高度信息的改变。除了点云参数外,高分辨率的无人机影像提供的光谱信息对AGB的估测做出了积极贡献,其构建的可见光植被指数能够很好地反映杉木的生长状况,模型对植被指数更加敏感,这与李丹[6]的研究结果一致。

当前有许多研究[5,15,27,29]将机器学习引入到森林AGB的估测中,但基本是单一LiDAR数据集或者光学遥感数据集,很少有多源遥感数据集进行森林AGB估测的研究,文献[5,13,14,47]已经表明了LiDAR和DAP点云均能很好地进行森林AGB的预测,DAP点云具有光谱属性是LiDAR不具备的。本研究结合二者进行森林AGB的预测,结果表明相比于直接利用单一数据集,不同的机器学习算法均能够很好地利用各自数据集的优势进行森林AGB的估算。FASSNACHT等[47]验证了在使用激光雷达数据估计生物量时,RF模型优于其他回归模型(k近邻和逐步线性回归)。此外,最近的两项研究[45,48]表明Boosting算法与其他机器学习回归算法相比在森林参数(碳密度、树高)的预测中更为有效,这与本研究的结果一致,虽然6种机器学习模型在应用于组合数据源时均获得了较高的精度,但XGBoost表现最优,这得益于XGBoost算法的出色性能,它是一种灵活的算法,可以在以前树的基础上纠正剩余的错误,生成新的树。XGBoost回归模型是一个先进的梯度提升系统。它在代价函数中加入了正则项,改善了对正则化学习目标的处理,避免了过拟合。然而,所有的机器学习算法在AGB估测时都不能完全解决低值高估和高值低估的现象。本研究中,XGBoost取得了最佳结果,但它在面对各种更加复杂地理环境时的潜力还需要进一步研究。

虽然本研究中XGBoost获得了最高的结果,但是模型的性能(R2为0.760 1)并没有达到预期的效果,这可能是SfM-MVS算法生成的点云的局限性,DAP点云只能在一定程度上代表真实的树,虽然杉木的形状极大减小了该影响,但实际林分中,树冠的重叠遮挡严重影响了单木的三维重建,这导致了点云参数的误差。并且本文中对影像的切割是按照10 m×10 m进行的,而无人机影像的像元宽高比例为4∶3,这导致了图像覆盖区域和实际测量区域的差异。在进行实际AGB运算时,采用的是胸径和树高的二元异速生长方程,测量的位置是按照树干位置测量的,这并不能代表该树在影像中的实际位置,所以部分区域会出现包含半棵树的情况(地块边缘的树是加入生物量运算还是删除),而地块的边缘效应[29,46]以及GPS定位的误差的影响,这些都导致了AGB实测数据的精度下降。当DEM的精度足够高时,归一化的点云能够接近真实环境中的单个树,由于没有高精度的DEM数据,所以复杂地形对点云归一化带来的影响是不可能避免的,这也直接影响了AGB的估测精度。本研究区域集中,不同地形、不同密度、不同郁闭度林分利用DAP点云和光谱参数进行AGB估测的结果需要后续研究探讨。

综上所述,影响森林AGB估测精度的因素很多,算法本身的优缺点是主要原因。不同数据集也是影响模型性能的一个重要因素[25,29],无人机密集匹配点云由于其密度大、光谱信息丰富,在森林冠层结构参数提取上有很大的潜力。此外,无人机飞行任务的设置,包括航线、飞行高度、航点设置对密集点云的生成影响很大。如何获取更加精准的地面调查数据,这也是一个值得探讨的问题,还应该探索不同地区、不同树种和不同林分起源的无人机倾斜摄影对AGB建模的适用性。

4 结束语

本研究利用无人机倾斜摄影获取了福建省将乐国有林场梅花谷的RGB影像,采用DAP点云特征和可见光植被指数结合进行森林AGB估测,探索了无人机RGB影像所提供的二维和三维特征进行森林AGB估测的可行性,并比较了6种回归算法在3种数据集下的性能。结果表明,单一DAP点云参数和单一光谱参数建模精度在6种机器学习回归算法中精度相对较低,除了Cubist算法,仅利用光谱参数建模精度均低于点云的预测结果,但在组合数据源时,光谱参数在模型预测中表现出了更高的重要性。没有单一的最优模型,在输入不同的变量时,模型的性能差异较大,但是不同模型均能通过DAP点云参数和光谱参数的结合来提高AGB预测精度。3种数据源构建AGB估测模型精度由大到小排序为DOM + DAP点云、DAP点云、DOM。本研究结果表明,组合数据源建模时,无人机倾斜摄影提供的二维光谱特征在AGB的估测中具有更高的重要性;XGBoost模型具有更高的AGB估测精度和稳定性;结合二维和三维特征能够有效提高AGB估测精度;利用SfM生成的无人机正射影像以及研究区三维结构,可以实现复杂林分结构和环境下森林AGB的快速无损估计,为森林资源监测的快速、低成本调查提供支持。

参考文献

[1] GOMEZ C, WHITE J C, WULDER M A, et al. Historical forest biomass dynamics modelled with Landsat spectral trajectories[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 93: 14-28.

[2] ZHU X, LIU D. Improving forest aboveground biomass estimation using seasonal Landsat NDVI time-series[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 102: 222-231.

[3] LI L, GUO Q, TAO S, et al. LiDAR with multi-temporal MODIS provide a means to upscale predictions of forest biomass[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 102: 198-208.

[4] 付晓, 张煜星, 王雪军. 2060年前我国森林生物量碳库及碳汇潜力预测[J]. 林业科学, 2022, 58(2): 32-41. FU Xiao, ZHANG Yuxing, WANG Xuejun. Prediction of forest biomass carbon pool and carbon sink potential in China before 2060[J]. Scientia Silvae Sinicae, 2022, 58(2): 32-41.(in Chinese)

[5] CAMPBELL M J, DENNISON P E, KERR K L, et al. Scaled biomass estimation in woodland ecosystems: testing the individual and combined capacities of satellite multispectral and LiDAR data[J]. Remote Sensing of Environment, 2021,262: 112511.

[6] 李丹. 基于数字航空摄影数据的森林参数反演估测研究[D]. 北京:中国科学院大学 (中国科学院遥感与数字地球研究所), 2018.LI Dan. Retrieval and estimation research of forest parameters based on digital aerial photograph data[D]. Beijing: University of Chinese Academy of Sciences (Institute of Remote Sensing and Digital Earth Chinese Academy of Sciences), 2018.(in Chinese)

[7] 吴雪琼, 覃先林, 周汝良, 等. 森林覆盖变化遥感监测方法研究进展[J].林业资源管理, 2010(4):82-87. WU Xueqiong, QIN Xianlin, ZHOU Ruliang, et al.Progress of study on forest cover change detection by using remote sensing technique[J]. Forest Resources Management, 2010(4):82-87.(in Chinese)

[8] GIBBS H K, BROWN S, NILES J O, et al. Monitoring and estimating tropical forest carbon stocks: making REDD a reality[J]. Environmental Research Letters, 2007, 2(4): 045023.

[9] SAATCHI S S, HARRIS N L, BROWNr S, et al. Benchmark map of forest carbon stocks in tropical regions across three continents[J]. Proceedings of the National Academy of Sciences, 2011, 108(24): 9899-9904.

[10] MASEK J G, HAYES D J, HUGHES M J, et al. The role of remote sensing in process-scaling studies of managed forest ecosystems[J]. Forest Ecology and Management, 2015, 355: 109-123.

[11] YANG H, LI F, WANG W, et al. Estimating above-ground biomass of potato using random forest and optimized hyperspectral indices[J]. Remote Sensing, 2021, 13(12): 2339.

[12] PROISY C, COUTERON P, FROMARD F O. Predicting and mapping mangrove biomass from canopy grain analysis using Fourier-based textural ordination (FOTO) of IKONOS images[J]. Remote Sensing of Environment, 2007, 109: 379-392.

[13] PAGAN J I, BANON L, LOPEZ I, et al. Monitoring the dune-beach system of Guardamar del Segura (Spain) using UAV, SfM and GIS techniques[J]. Science of the Total Environment, 2019, 687: 1034-1045.

[14] XU Z, SHEN X, CAO L, et al. Tree species classification using UAS-based digital aerial photogrammetry point clouds and multispectral imageries in subtropical natural forests[J]. International Journal of Applied Earth Observation and Geoinformation, 2020, 92: 102173.

[15] BOUVIER M, DURRIEU S, FOURNIER R A, et al. Generalizing predictive models of forest inventory attributes using an area-based approach with airborne LiDAR data[J]. Remote Sensing of Environment, 2015, 56: 322-334.

[16] 蔡龙涛, 邢艳秋, 岳春宇, 等. 基于ICESat-GLAS波形与LPA数据估测森林生物量[J]. 红外与激光工程, 2020, 49(增刊2): 56-63.CAI Longtao, XING Yanqiu, YUE Chunyu, et al. Estimation of AGB based on ICESat-GLAS waveform and LPA data[J]. Infrared and Laser Engineering, 2020, 49(Supp.2): 56-63.(in Chinese)

[17] KAMEYAMA S, SUGIURA K. Effects of differences in structure from motion software on image processing of unmanned aerial vehicle photography and estimation of crown area and tree height in forests[J]. Remote Sensing, 2021, 13(4): 626.

[18] SHAO G, SHAO G F, GALLION J, et al. Improving LiDAR-based aboveground biomass estimation of temperate hardwood forests with varying site productivity[J]. Remote Sensing of Environment, 2018, 204: 872-882.

[19] 孙钊, 潘磊, 孙玉军. 基于无人机影像的高郁闭度杉木纯林树冠参数提取[J]. 北京林业大学学报, 2020, 42(10): 20-26.SUN Zhao, PAN Lei, SUN Yujun. Extraction of tree crown parameters from high-density pure Chinese fir plantations based on UAV images[J]. Journal of Beijing Forestry University, 2020, 42(10): 20-26.(in Chinese)

[20] 黄华国. 林业定量遥感研究进展和展望[J]. 北京林业大学学报, 2019, 41(12): 1-14.HUANG Huaguo. Progress and perspective of quantitative remote sensing of forestry[J]. Journal of Beijing Forestry University, 2019, 41(12): 1-14.(in Chinese)

[21] LI B, XU X, ZHANG L, et al. Above-ground biomass estimation and yield prediction in potato by using UAV-based RGB and hyperspectral imaging[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 162: 161-172.

[22] FU X, ZHANG Z, CAO L, et al. Assessment of approaches for monitoring forest structure dynamics using bi-temporal digital aerial photogrammetry point clouds[J]. Remote Sensing of Environment, 2021, 255: 112300.

[23] GOODBODY T R H, COOPS N C, TOMPALSKI P, et al. Updating residual stem volume estimates using ALS- and UAV-acquired stereo-photogrammetric point clouds[J]. International Journal of Remote Sensing, 2016, 38: 2938-2953.

[24] PRICE B, WASER L T, WANG Z, et al. Predicting biomass dynamics at the national extent from digital aerial photogrammetry[J]. International Journal of Applied Earth Observation and Geoinformation, 2020, 90: 102116.

[25] ALONZOl M, DIAL R J, SCHULZ B K, et al. Mapping tall shrub biomass in Alaska at landscape scale using structure-from-motion photogrammetry and LiDAR[J]. Remote Sensing of Environment, 2020, 245: 111841.

[26] ALONZO M, ANDERSEN H E, MORTON D C, et al. Quantifying boreal forest structure and composition using UAV structure from motion[J]. Forests, 2018, 9: 119.

[27] TIAN Y, HUANG H, ZHOU G, et al. Aboveground mangrove biomass estimation in Beibu Gulf using machine learning and UAV remote sensing[J]. Science of the Total Environment, 2021, 781: 146816.

[28] GUYON I, WESTON J, BARNHILL S, et al. Gene selection for cancer classification using support vector machines[J]. Machine Learning, 2002, 46: 389-422.

[29] DE ALMEIDA C T, GALVAO L S, ARAGAO L E D E, et al. Combining LiDAR and hyperspectral data for aboveground biomass modeling in the Brazilian Amazon using different regression algorithms[J]. Remote Sensing of Environment, 2019, 232: 111323.

[30] LY/T 2264—2014 立木生物量模型及碳计量参数——杉木[S].

[31] DANDOIS J P, ELLIS E C. High spatial resolution three-dimensional mapping of vegetation spectral dynamics using computer vision[J]. Remote Sensing of Environment, 2013, 136: 259-276.

[32] OTA T, OGAWA M, SHIMIZU K, et al. Aboveground biomass estimation using structure from motion approach with aerial photographs in a seasonal tropical forest[J]. Forests, 2016, 6(11): 3882-3898.

[33] 杨全月, 董泽宇, 马振宇, 等. 基于SfM的针叶林无人机影像树冠分割算法[J]. 农业机械学报, 2020, 51(6): 181-190.YANG Quanyue, DONG Zeyu, MA Zhenyu, et al. Coniferous forest crown segmentation algorithm of UAV images based on SfM[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(6): 181-190.(in Chinese)

[34] TURNER D, LUCIEER A, WATSON C. An automated technique for generating georectified mosaics from ultra-high resolution unmanned aerial vehicle (UAV) imagery, based on structure from motion (SfM) point clouds[J]. Remote Sensing, 2012, 4: 1392-1410.

[35] 高永刚, 林悦欢, 温小乐,等. 基于无人机影像的可见光波段植被信息识别[J]. 农业工程学报, 2020, 36(3): 178-189. GAO Yonggang, LIN Yuehuan, WEN Xiaole, et al. Vegetation information recognition in visible band based on UAV images[J]. Transactions of the CSAE, 2020, 36(3): 178-189.(in Chinese)

[36] 汪小钦, 王苗苗, 王邵强, 等. 基于可见光波段无人机遥感植被信息提取[J]. 农业工程学报, 2015, 31(5): 152-159.WANG Xiaoqin, WANG Miaomiao, WANG Shaoqiang, et al. Extraction of vegetation information from visible unmanned aerial vehicle images[J]. Transactions of the CSAE, 2015, 31(5): 152-159.(in Chinese)

[37] TORRES-SANCHEZ J, PENA J M, CASTRO A I, et al. Multitemporal mapping of the vegetation fraction in early-season wheat fields using images from UAV[J]. Computers and Electronics in Agriculture, 2014, 103(2): 104-113.

[38] GITELSON A A, VINA A, ARKEBAUER T J, et al. Remote estimation of leaf area index and green leaf biomass in maize canopies[J]. Geophysical Research Letters, 2003, 30(5): 335-343.

[39] SUN Z, WANG Y, PAN L, et al. Pine wilt disease detection in high-resolution UAV images using object-oriented classification[J]. Journal of Forestry Research, 2022, 33: 1377-1389.

[40] JING R, GONG Z, ZHAO W, et al. Above-bottom biomass retrieval of aquatic plants with regression models and SfM data acquired by a UAV platform—a case study in Wild Duck Lake wetland, Beijing, China[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017,134: 122-134.

[41] 伍艳莲, 赵力, 姜海燕, 等.基于改进均值漂移算法的绿色作物图像分割方法[J]. 农业工程学报, 2014, 30(24): 161-167.WU Yanlian, ZHAO Li, JIANG Haiyan, et al. Image segmentation method for green crops using improved mean shift[J]. Transactions of the CSAE, 2014, 30(24): 161-167.(in Chinese)

[42] LEI L, CHAI G, WANG Y, et al. Estimating individual tree above-ground biomass of Chinese fir plantation: exploring the combination of multi-dimensional features from UAV oblique photos[J]. Remote Sensing, 2022, 14: 504.

[43] JARRON L R, COOPS N C, MACKENZIE W H, et al. Detection of sub-canopy forest structure using airborne LiDAR[J]. Remote Sensing of Environment, 2020, 244: 111770.

[44] XIAO Z, GANG W, YUAN J, et al. Impacts of data preprocessing and selection on energy consumption prediction model of HVAC systems based on deep learning[J]. Energy and Buildings, 2022, 258: 111832.

[45] ZHANG N, CHEN M, YANG F, et al. Forest height mapping using feature selection and machine learning by integrating multi-source satellite data in Baoding City, north China[J]. Remote Sensing, 2022, 14(18): 4434.

[46] PENG X, ZHAO A, CHEN Y, et al. Comparison of modeling algorithms for forest canopy structures based on UAV-LiDAR: a case study in tropical China[J]. Forests, 2020, 11: 1324.

[47] FASSNACHT F E, HARTIG F, LATIFI H, et al. Importance of sample size, data type and prediction method for remote sensing-based estimations of aboveground forest biomass[J]. Remote Sensing of Environment, 2014, 154: 102-114.

[48] CHEN M, QIU X, ZENG W, et al. Combining sample plot stratification and machine learning algorithms to improve forest aboveground carbon density estimation in northeast China using airborne LiDAR data[J]. Remote Sensing, 2022, 14(6): 1477.

Development of Forest Aboveground Biomass Estimation Model Based on Multidimensional Dataset of UAV

SUN Zhao1 XIE Yunhong2 WANG Baoying2 TAN Jun1 WANG Yifu2 SUN Yujun2

(1.Civil-Military Integration Center of China Geological Survey, Chengdu 610036, China 2.State Forestry and Grassland Administration Key Laboratory of Forest Resources and Environmental Management, Beijing Forestry University, Beijing 100083, China)

AbstractForest aboveground biomass (AGB) is an important indicator for evaluating forest growth. Based on the 2D and 3D data generated by digital aerial photography (DAP), totally 41 point clouds height variables and 16 visible light vegetation indices were calculated respectively, and AGB estimation models were developed with single variable set and comprehensive variable set respectively by using six regression algorithms (random forest, RF; bagged tree, BT; support vector regression, SVR;Cubist; categorical boosting,CatBoost;extreme gradient boosting,XGBoost) to explore the contribution of different variables to the AGB estimation model. The results showed that the highest accuracy AGB prediction models for spectral and point cloud datasets were Cubist and XGBoost, with R2 of 0.530 9 and 0.639 5, respectively, and the highest accuracy model for the combined dataset was XGBoost, with R2 of 0.760 1, and the XGBoost model had a higher stability of AGB estimation. The result also showed that the contribution of the six machine learning models mainly depended on the regression method considered, and the number of features chosen and the importance of the features to the model were not consistent across the models. DOM spectral features had a higher importance in the estimation of AGB. Overall, the combination of 2D and 3D data can effectively improve the accuracy of forest AGB estimation, and the RGB images acquired based on UAV tilt photography can realize the fast and nondestructive estimation of forest AGB.

Key wordsforest aboveground biomass; estimation model; UAV dense point cloud; SfM; visible vegetation index; machine learning

中图分类号:S771.8

文献标识码:A

文章编号:1000-1298(2024)06-0186-10

OSID:

doi:10.6041/j.issn.1000-1298.2024.06.019

收稿日期:2023-10-16

修回日期: 2024-01-31

基金项目:中国地质调查局地质调查项目(DD20243093)和林业科学技术推广项目([2019]06)

作者简介:孙钊(1996—),男,工程师,博士,主要从事无人机林业遥感研究,E-mail: sun_zhaosz@163.com

通信作者:孙玉军(1963—),男,教授,博士生导师,主要从事森林资源监测与模型研究,E-mail: sunyj@bjfu.edu.cn