-
噪声水平是衡量机械产品的重要环保指标,欧美国家建立了大量的相关技术标准作为市场准入的环保条件,这对国产林用机械产品的出口形成了无形的壁垒。为降低机械噪声水平,目前主要是通过声源识别定位方法进行噪声源识别定位,然后采取针对性手段降噪。波束形成法具有计算快、测量方便等优点,对静止或运动的中高频、远距离声源都有很好的识别能力[1]。传统波束形成法(delay and sum beamforming,DAS)不仅在真实声源位置输出具有一定宽度的主瓣,还在非声源位置输出旁瓣,为防止过大的旁瓣导致混淆或湮灭主瓣[2],如何控制旁瓣水平是当前国内外研究热点[3]。2004年,美国BROOKS等[4]首先提出了反卷积波束形成法(deconvolution approach for the mapping of acoustic sources method,DAMAS),此法显著控制了旁瓣水平,克服了传统波束形成法的局限性,近10 a取得了快速发展。本文从反卷积波束形成法理论原理及现有反卷积波束形成法的对比这2个方面来概述。
-
反卷积波束形成法是一种逆问题求解算法。该算法以传统波束形成作为预处理,得到所有扫描点的均方声压值。假设对流层和剪切层折射并不影响噪声传播到麦克风阵列,可以得出第n个假设声源点传播到第m个麦克风的声压信号矩阵:
$$ {P_{m:n}} = {Q_n}e_{m:n}^{ - 1}。 $$ (1) 式(1)中:m:n表示第n个声源点到第m个麦克风,e为导向因子。Qn为网格上第n个假设声源点的声压平方矩阵。首先计算:
$$ P_{mn}^*{P_{m':n}} = {\left( {{Q_n}e_{mn}^{ - 1}} \right)^*}\left( {{Q_n}e_{m':n}^{ - 1}} \right) = {Q_n}^*{Q_n}{\left( {e_{mn}^{ - 1}} \right)^*}e_{m':n}^{ - 1}。 $$ (2) 式(2)中:m′为除m以外的任意麦克风。可得第n个假设声源点的互谱矩阵:
$$ {{\hat C}_n} = {X_n}\left[ {\begin{array}{*{20}{c}} {{{\left( {e_1^{ - 1}} \right)}^*}e_1^{ - 1}}&{{{\left( {e_1^{ - 1}} \right)}^*}e_2^{ - 1}}&{{{\left( {e_1^{ - 1}} \right)}^*}e_{{m_0}}^{ - 1}}\\ {{{\left( {e_2^{ - 1}} \right)}^*}e_1^{ - 1}}&{{{\left( {e_2^{ - 1}} \right)}^*}e_2^{ - 1}}&{}\\ {}&{}&{{{\left( {e_{{m_0}}^{ - 1}} \right)}^*}e_{{m_0}}^{ - 1}} \end{array}} \right]。 $$ (3) 式(3)中:Xn=Qn*Qn,m0为总麦克风数。麦克风阵列的总互谱矩阵:
$$ C = \sum\limits_{n = 1}^N {{{\hat C}_n}} 。 $$ (4) 式(4)中:N为总的假设声源点数。可得扫描点的信号功率谱为:
$$ {Y_n}\left( {\hat e} \right) = \left[ {\frac{{{{\hat e}^T}{C_n}\hat e}}{{m_0^2}}} \right]。 $$ (5) 式(5)中:导向向量 $\hat e = {\left[ {{e_1}\; \; \; {e_2}\; \; \; \; \cdots \; \; \; \; {e_{{m_0}}}} \right]^T}$ 。将式(3)和式(4)代入式(5),可得:
$$ {Y_n}\left( {\hat e} \right) = \frac{{\hat e_n^T\sum\limits_{n'} {{X_{n'}}{{\left[ {\;} \right]}_{n'}}{{\hat e}_n}} }}{{m_0^2}} = \sum\limits_{n'} {\frac{{\hat e_n^T{{\left[ {\;} \right]}_{n'}}{{\hat e}_n}}}{{m_0^2}}} {X_{n'}}。 $$ (6) 式(6)中:[ ]n′是式(3)中的内容,n′表示聚焦的网格点,n表示假设声源点。简化后,可得:
$$ {Y_n}\left( {\hat e} \right) = \sum\limits_{n'} {{A_{nn'}}{X_{n}}} 。 $$ (7) 式(7)中: ${A_{nn'}} = \frac{{\hat e_n^T{{\left[ {\;} \right]}_{n'}}{{\hat e}_n}}}{{m_0^2}}$ 。令 ${Y_n}\left( {\hat e} \right) = {Y_n}$ ,即等于波束形成算法得出的均方声压值,可得:
$$ \hat A\hat X = \hat Y。 $$ (8) 采用高斯-赛德尔迭代法求解此线性方程得出声源分布。在求解线性方程组时,DAMAS算法能更好地考虑不同网格位置的相互影响,使旁瓣变小甚至消失,呈现更直观的结果[3],能更准确地计算出声源位置和声源强度。
-
在算法的旁瓣抑制能力方面,反卷积波束形成法相比于传统波束形成法具有更好的旁瓣抑制能力。目前,声源识别领域各主要算法都已经进行了大量研究对比[5, 7],研究结果表明:频率的提高可有效改善算法的旁瓣抑制能力,且传统DAS算法的旁瓣抑制能力弱于其他算法。当声源远离中心时,反卷积波束形成法2(DAMAS2)和基于傅里叶变化的非负最小二乘算法(FFT-NNLS)算法定位声源失效。这主要由于DAMAS2和FFT-NNLS都基于阵列点扩散函数位移不变性假设,当声源远离中心时,其声源位置已位于有效区域外,因此DAMAS2和FFT-NNLS不能对该类远离中心的声源点进行精准定位。XENAKI等[8]对这类算法的有效区域进行了深入研究,有效区域一般为Z轴18度角范围内。在相干声源情况下,基于空间相干的洁净算法(CLEAN-SC)不能准确识别声源,这是由于CLEAN-SC在迭代中删除与波峰相干的声源部分,当声源较靠近时,其中一个声源被当作旁瓣而被消除。杨洋等[6]也在研究中指出CLEAN-SC不适用于相干声源。
在算法的定位精度方面,迭代算法随着迭代次数的增加,算法的精度都有不同程度的提升,分析算法迭代次数与标准差的关系[7]。在低迭代次数时洁净算法(CLEAN)和CLEAN-SC这2种算法的精度较高,具有较高的计算精度稳定性,而DAMAS2,非负最小二乘算法(NNLS)和FFT-NNLS具有较大偏差,且对迭代次数不敏感,迭代次数的增加不能大幅提升其计算精度,DAMAS在高迭代次数下声源识别性能快速迫近CLEAN和CLEAN-SC,对于迭代次数较敏感。空间分辨率的优劣也是算法精度的重要指标, 算法分辨率越高,区分较近声源的能力就越高。通过对风机的噪声分布研究表明[9]:DAMAS具有很高的分辨率,可以获得出色的噪声源分布图,即使声源距离较近,也能够很好地将它们区分,CLEAN-SC也具有很高的分辨率,但由于其算法的理论原因,较近声源,只能识别其中一个,而DAS算法分辨率较差,无法区分较近声源,定位精度降低。
计算效率是算法能否被广泛运用的关键点,表 1是多种典型算法的计算时间,可得出DAS,DAMAS2,和CLEAN-SC具有较高的计算效率和实时性,其次为DAMAS、稀疏约束反卷积波束形成法(SC-DAMAS),但协方差矩阵拟合法(CMF)、稀疏约束的超分辨率反卷积波束形成算法(SC-RDAMAS)计算时间较长,不适用于实时测试。
表 1 算法计算时间
Table 1. Computation time of algorithms
综上所述,主要代表性反卷积算法的特点如表 2所示。
表 2 主要代表性反卷积算法
Table 2. Main representative algorithm
年份 算法名称 特点 2004 反卷积波束形成法(DAMAS)[4] 高分辨率,对迭代次数敏感,旁瓣抑制能力强,计算效率较低 2005 反卷积波束形成法2(DAMAS2)[11] 定位精度对迭代次数不敏感,计算效率高,实时性好,不适用于声源在扫描空间边缘的情况 2007 基于傅里叶变化的非负最小二乘算法(FFT-NNLS)[12] 计算速度较快,声源定位准确,定位精度对迭代次数不敏感,不适用于声源在扫描空间边缘的情况 2007 稀疏约束反卷积波束形成法(SC-DAMAS)[13] 利用稀疏性,计算效率较高,在噪声源定位中具有更好的准确性和鲁棒性 2007 基于空间相干的洁净算法(CLEAN-SC)[14] 可精确提取声源强度,提高了空间分辨率和准确性,计算精度稳定性高,计算效率高,实时性好,但不适用于声源位置相距较近的相干声源 2011 稀疏约束的超分辨率反卷积波束形成算法(SC-RDAMAS)[10] 适用于在超大分辨率下扫描大区域,计算效率低,实时性较弱,不适用于实时测试 2012 协方差矩阵拟合法(CMF)[15] 计算效率低,实时性较弱,不适用于实时测试 -
当前,反卷积波束形成算法在高频下都具有优秀的旁瓣抑制能力,且定位精度随着迭代次数的上升而提高,但这些算法也存在着各自的局限性,如在计算效率,实时性,扫描范围,适用声源类型等方面,因此在现有算法的基础上,需进一步提出更加全面的反卷积波束形成改进算法,使算法具有更好的普遍适用价值。同时,要提高声源识别的准确性,除了选择合适的算法,开发声源识别性能更优的传声器阵列也是一研究热点。布置形式更加优化、更加合理的传声器,使传声器阵列声源识别的空间分辨率更高,最大旁瓣水平更低,有效动态范围更大[16]。
Research advance on noise source identification methods of deconvolution beamforming
-
摘要: 反卷积波束形成作为一种基于波束形成的噪声源识别方法已被广泛的运用,尤其在林业机械噪声源识别中。相比于传统波束形成,该方法可有效减小主瓣宽度并消除旁瓣,提高空间分辨率。概述了近年来国内外反卷积波束形成的研究进展,从旁瓣抑制能力、定位精度、计算效率方面对多种代表性方法进行对比分析,归纳总结其特点,讨论其局限性,为今后该方法的后续改进提供新的研究思路,以期获得更全面的反卷积波束形成算法,具有更优的适用性。Abstract: Deconvolution beamforming as a noise source identification method based on beamforming has been widely used, especially in the identification of forestry machine noise. Compared with the conventional beamforming, deconvolution beamforming method is more effective to reduce the width of the main lobe and eliminate the side lobe, and improve the spatial resolution. This paper reviewed the recent research progress on deconvolution beamforming at home and abroad. A comparative analysis was made among several representative methods on the aspects of the side lobe suppression ability, positioning accuracy and computational efficiency. Then the characteristics and limitations of those typical deconvolution beamforming algorithms were discussed, which provided a new research idea for future improvement in order to obtain a more comprehensive deconvolution beamforming algorithm with better applicability.
-
Key words:
- noise source identification /
- deconvolution beamforming /
- research development /
- review
-
森林结构参数估测是森林可持续经营和生态环境监测的重要内容。森林蓄积量作为森林结构参数中的一个重要因子,是组成陆地植被生物量的重要成分之一,是评价森林资源数量与质量、反映森林经营管理水平的重要因子,也是评估森林固碳能力和森林碳收支的重要指标[1-4],因此,准确地估测森林蓄积量对森林经营管理和生态环境保护建设具有重要意义[5-6]。目前,应用遥感技术估测森林蓄积量的研究主要集中在2个方面:一是选取或结合不同遥感数据源(光学遥感、微波探测和激光雷达探测数据)构建估测模型,进行森林蓄积量估测;二是估测方法的多样性,由典型的参数方法(线性回归)向非参数方法转变(如人工神经网络、k近邻分类算法等)[2, 4, 7-10]。在森林蓄积量模型构建的过程中,自变量间的复共线性问题是亟待解决的一个问题。这些在传统的线性回归估测中无法避免[11-12]。k-最邻近(k-nearest neighbor,k-NN)方法作为一种非线性方法,可以不考虑复共线性问题,并且具有稳定的抗逆性,在欧洲和北美地区的森林资源监测中得到了广泛的应用。国内也开展了有关k-NN法估测森林蓄积及生物量的研究[10-13],但对比参数方法和非参数方法进行估测的研究不多。在以往的研究中,采用高分辨率数据进行森林蓄积量的估测多以国外数据为主。高分1号(GF-1)卫星是中国高分辨率对地观测卫星系统重大专项的第1颗卫星,它可以提供高分辨率的多光谱(8 m)和全色波段(2 m)数据,为森林资源动态监测提供了新的数据源[14]。然而,受限于GF-1卫星影像的覆盖范围等原因,针对GF-1全色和多光谱(panchromatic and multispectral,PMS)影像用于县域尺度森林蓄积量定量估测的研究较少。GF-1 PMS数据将高空间分辨率、高时间分辨率等优势集合于一体,挖掘并探讨GF-1 PMS影像数据估测森林蓄积量的潜力,对森林生理生态参数进行定量评价和GF-1 PMS影像数据的应用推广具有重要意义。本研究应用GF-1 PMS影像数据,通过挖掘影像的光谱信息,建立植被指数自变量集,并对自变量进行优选,采用k-NN方法构建森林蓄积量估测模型,并与偏最小二乘回归法构建的森林蓄积量估测模型进行对比,以此分析GF-1 PMS影像数据和2种估测方法的应用潜力,为县域尺度应用GF-1 PMS影像数据估测森林生理生态参数提供参考。
1. 研究材料
1.1 研究区概况
延庆区位于北京市的西北部(40°16'~40°47'N,115°44'~116°34'E),东邻怀柔,南接昌平,西面和北面与河北省怀来县、赤城县相接,三面环山,总面积达1 993.75 km2。该区属大陆性季风气候,是暖温带与中温带,半干旱与半湿润的过渡带。年平均温度为8.8 ℃,无霜期150~160 d。年平均降水量为467.0 mm,降水主要集中在6-8月。该区内森林植被属于针阔混交林森林植被,现存植被主要为人工林以及一些次生植被类型。区内主要森林类型有油松Pinus tabulaeformis林,侧柏Platycladus orientalis林,华北落叶松Larix principis-rupprechtii林,蒙古栎Quercus liaotungensis林,刺槐Robinia pseudoacacia林,白桦Betula platyphylla林,山杨Populus davidiana林和杂木林等。据2015年北京市公布的森林资源数据显示,延庆区森林面积为11.5万hm2,森林覆盖率为57.46%,森林蓄积量达到215.77万m3,占北京市总森林蓄积量的12.68%,具有重要的生态系统防护作用和固碳功能。
1.2 研究数据
1.2.1 地面数据及辅助数据
地面数据是延庆区2014年森林资源二类调查数据(以下简称“二调数据”),以矢量地理信息数据的形式储存。全区二类调查数据中的小班个数为2.37×104个,小班面积及蓄积的统计特征见表 1。本研究所应用到的调查因子包括小班编号、地类、小班蓄积、小班面积等因子。辅助数据包括延庆区边界矢量数据和覆盖延庆区的1: 10 000数字高程模型(DEM)数据,地面数据和辅助数据的坐标为北京54坐标系。
表 1 延庆区二类调查数据小班面积及蓄积基本统计量Table 1. Descriptive statistics of small class area and volume of forest management inventory in Yanqing District项目 小班面积/hm2 小班蓄积/m3 最大值 693.65 8 880.45 最小值 0.07 0.06 平均值 8.45 89.75 1.2.2 遥感影像
GF-1号卫星装载有2 m分辨率全色和8 m分辨率多光谱相结合的相机(PMS1~PMS2),多光谱相机包括蓝(0.45~0.52 μm),绿(0.52~0.59 μm),红(0.63~0.69 μm)和近红外(0.77~0.89 μm)4个波段,全色相机包括1个全色波段(0.45~0.89 μm),2台相机组合幅宽达60 km,重访周期为4 d。本研究选取了覆盖研究区的7景GF-1 PMS影像,由中国林业科学研究院资源信息研究所提供,其中序号2影像由于影像缺失,采用了2014年的影像进行补充,并假设对估测结果未产生影响,序号6和序号7的影像获取时间为2015年1月31号,作为补充影像,只覆盖了少部分区域,因此产生的差异可以忽略不计。GF-1 PMS影像数据详情见表 2。
表 2 覆盖延庆区的GF-1 PMS影像列表Table 2. List of GF-1 PMS images covering Yanqing District序号 影像传感器及轨道号 (多光谱/全色)/m 获取时间(年-月-日) 1 GF1_PMS1_E115.8_N40.3_20150505_L1A0000791191-MSS1 8/2 2015-05-05 2 GF1_PMS1_E115.9_N40.5_20140427_L1A0000212130-MSS1 8/2 2014-04-27 3 GF1_PMS1_E115.8_N40.5_20150505_L1A0000791190-MSS1 8/2 2015-05-05 4 GF1_PMS2_E116.2_N40.5_20150505_L1A0000791125-MSS2 8/2 2015-05-05 5 GF1_PMS2_E116.3_N40.7_20150505_L1A0000791124-MSS2 8/2 2015-05-05 6 GF1_PMS2_E116.4_N40.5_20150131_L1A0000624694-MSS2 8/2 2015-01-31 7 GF1_PMS2_E116.5_N40.7_20150131_L1A0000624693-MSS2 8/2 2015-01-31 1.2.3 地面数据处理
二类调查数据为区划调查数据,可以覆盖整个延庆区。在估测森林蓄积量前,需要计算小班内的每公顷森林蓄积量[不包括非森林地类的蓄积量(疏林地、散生木、四旁树的蓄积量),以下统称公顷蓄积量],采用Arc GIS软件中属性表中的字段计算器计算(公顷蓄积量=小班蓄积/小班面积)。本研究采用系统抽样方法在延庆区内布设抽样点,为与GF-1 PMS影像3×3窗口大小近似匹配,确定抽样点的面积大小为600 m2,形状为正方形。利用Arc GIS软件布设覆盖延庆区的格网,格网面积大小为600 m2。在布设格网时,存在单个格网覆盖多个小班的情况。本研究采用格网内小班公顷蓄积乘以对应小班的面积权重值,并求和获得覆盖多个小班的格网的蓄积量,最后计算格网内公顷蓄积量的变异系数,并取可靠水平为90%和估计精度为85%(二类规程要求)的控制标准,计算需要布设的抽样点个数及间距,并以此为基础外推估算延庆区的森林蓄积量。经计算公顷蓄积量的变异系数为2.015 3,确定样本数为489个,抽样间距为2.02 km。为与北京市一类清查样地布设间距相近,在满足抽样精度的基础上,本研究设置系统抽样间距为2 km × 2 km(图 1)。经系统布设样地后得到延庆区的抽样点共计492个,将抽样点所在的小班属性信息追加到抽样点上。处理后的样点数据包括样地号、地类、公顷蓄积量等因子,样点数据同时用于影像的分类结果验证。提取出蓄积量大于0的样点用于森林蓄积量反演,经处理后提取抽样点数据(蓄积大于0)共计156个。
1.2.4 遥感影像预处理
应用ENVI 5.1对7景GF-1 PMS影像进行辐射定标、大气校正,参照已校正好的2004年SOPT-5融合数据(2.5 m),对高分影像进行正射校正,误差控制在1个像元以内,对校正好的7景GF-1 PMS影像进行镶嵌处理,生成覆盖整个延庆区的GF-1 PMS影像,并利用延庆区边界矢量数据进行裁剪,生成延庆区范围内的GF-1影像(图 1),遥感影像校正后的坐标同地面数据和辅助数据。本研究选取应用较为广泛的最大似然分类法提取森林植被信息[12]。依据《国家森林资源连续清查主要技术规定》(2014)中的森林面积定义:森林面积等于乔木林面积、竹林面积与特殊灌木林面积之和。由延庆区二类调查数据可知,地类中无竹林地和特殊灌木林地,因此本研究中的森林面积只包括乔木林面积,森林蓄积量只包括乔木林蓄积量。按照《国家森林资源连续清查主要技术规定》(2014)地类划分标准,结合研究区实际地类情况,确定分类类别为乔木林地,其他林地(包括灌木林、疏林地、未成林造林地、苗圃地、迹地、宜林地),农地(耕地),建筑(建设用地),水域和其他土地(未利用地)等6类,对分类结果合并归类为森林和非森林2类,其中森林包括乔木林,非森林包括除乔木林之外所有的地类,最后对影像分类结果进行验证。结果表明:GF-1 PMS影像分类总精度达到87.90%,Kappa系数为0.75。分类结果见图 2。
2. 研究方法
2.1 遥感特征变量
遥感影像的植被信息是通过绿色植物叶片和植被冠层光谱特性及其变化差异反映的[14]。选择合适的植被指数可以有效地增强植被信息或抑制非植被信息,减小非植被信息如阴影对模型构建的影响[3]。因此,本研究借鉴前人的经验并结合蓄积量估测特点,选择9种植被指数作为建模变量(表 3)。
表 3 研究中用到的变量Table 3. Variables used in the study变量 计算公式 参考文献 差值植被指数DVI VI=ρ4-ρ3 [15] 重归一化植被指数RDVI $ {R_{{\rm{DVI}}}} = \sqrt {{N_{{\rm{DVI}}}} \times {D_{{\rm{VI}}}}} $ [16] 土壤植被指数SAVI $ {S_{{\rm{AVI}}}} = \frac{{1.5\left( {{\rho _4} - {\rho _3}} \right)}}{{\left( {{\rho _4} + {\rho _3} + 0.5} \right)}} $ [17] 优化土壤调整指数OSAVI $ {O_{{\rm{SAVI}}}} = \frac{{1.05\left( {{\rho _4} - {\rho _3}} \right)}}{{\left( {{\rho _4} + {\rho _3} + 1.05} \right)}} $ [18] 归一化植被指数NDVI $ {N_{{\rm{DVI}}}} = \frac{{{\rho _4} - {\rho _3}}}{{{\rho _4} + {\rho _3}}} $ [19] 归一化绿波波段差值植被指数GNDVI $ {G_{{\rm{NDVI}}}} = \frac{{{\rho _4} - {\rho _2}}}{{{\rho _4} + {\rho _2}}} $ [20] 考虑绿波波段差值植被指数GBNDVI $ {G_{{\rm{BNDVI}}}} = \frac{{{\rho _4}\left( {{\rho _1} + {\rho _2}} \right)}}{{{\rho _4} + {\rho _1} + {\rho _2}}} $ [21] 比值植被指数RVI $ {R_{{\rm{VI}}}} = {\rho _4}/{\rho _3} $ [22] 转换型植被指数TVI $ {T_{{\rm{VI}}}} = \sqrt {{N_{{\rm{DVI}}}} + 0.5} $ [23] 说明:ρ1,ρ2,ρ3,ρ4分别为蓝、绿、红、近红波段 应用布设好的抽样点提取对应位置的GF-1 PMS影像光谱信息,计算样本内的光谱平均值作为样本点的光谱值,参与模型的构建。本研究中,蓄积大于0的抽样点均落在乔木林(即有林地)范围内,不包括散生木、四旁树和疏林地部分,因此所构建的模型为乔木林蓄积量模型,参与全区的森林蓄积量估算。
2.2 自变量筛选
在建模变量中,自变量往往存在多重共线性问题,导致所构建的模型不够稳定,尤其是在变量个数较多时,会降低模型的预测精度,因此选择适宜的方法筛选自变量用于建模具有重要作用[24]。常用的变量筛选方法较多,有逐步回归法、Pearson相关系数法、平均残差平方和法等[4, 24-26]。相关研究表明:平均残差平方和法在变量筛选中具有很好的适用性[26],因此本研究选择此方法作为自变量筛选方法,平均残差平方和方法筛选变量的实现步骤参考文献[26]。
2.3 偏最小二乘回归法
偏最小二乘回归法是伍德(WOLD)和阿巴诺(ALBANO)于1983年提出的一种新型的多元统计方法。它集多元回归分析、典型相关分析和主成分分析的优点于一体,可以有效地解决多元回归分析中的变量多重相关性及噪声问题[27-29],近年来被逐渐地应用到森林参数的估计上[3, 30-31]。
以单因变量为例阐述其基本建模思想:设有因变量y和p个自变量{ x1,x2,…,xp},样本数为n,构成因变量和自变量的数据表y =[u]n×1和x[x1,x2,…,xp]n×p,对数据表x进行主成分处理,提取一个主成分t1(t1是x1,x2,…,xp的线性组合),要求t1尽可能多地携带x中的变异信息,同时与y的相关性最大,提取第1个主成分t1后,实施y和x对t1的回归,如果此时回归方程达到满意的精度,则算法停止,否则利用x和y被t1解释后的残余信息进行第2轮的主成分提取,如此反复,直到能达到较为满意的精度为止。若最终对x提取了m个主成分t1, t2,…,tm,偏最小二乘回归将实施y对t1, t2, …,tm的回归,然后表达成y对原变量x的回归方程。应用偏最小二乘回归法进行模型构建的详细过程见文献[9]。本研究应用MATLAB 2014a软件实现偏最小二乘回归模型的构建。
2.4 k-NN算法基本原理
k-NN算法是一种典型的非参数方法,基于观测点和预测点之间的空间相似性关系进行单变量或多变量预测(如蓄积量等森林参数),在欧洲和北美得到了广泛应用[32-34]。k-NN法用于森林参数估计的最大优点在于它不仅能同时估计若干个森林参数,而且它还能够维持参数之间的自然依赖结构,保持参数之间的一致性,同利用遥感自变量和森林参数建立的回归模型相比,k-NN方法更多地考虑森林参数同自变量间的非线性依赖关系[12, 35]。其基本原理为:记p为目标点,pi为参考点,并且参考点的森林参数(本研究为森林蓄积量)是已知的,Dp, pi为目标点和参考点之间的光谱距离,它是用来衡量样本参数间的相似度的。对于目标点p,找出其光谱空间最邻近的k个参考点p1,p2,…,pk,其中Dp, 1<Dp, 2<…<Dp, k。由于目标点p受其近邻的影响是不同的,通常距离越近的参考点对其影响越大,反之则影响越小。目标点p的森林参数VP可以通过k个参考点的相应的森林参数Vpi(i=1,2,…,k)的加权平均法获得[12],其中k个参考点的权重wpi, p通过光谱空间的反距离函数获得[12]。k-NN实质上是一个常用于空间插值的反距离加权平均法,当k=1时,k-NN即为最邻近距离法[35]。
$ {w_{pi, p}} = \frac{1}{{D_{pi, p}^t}}/\sum\limits_{i = 1}^k {/\frac{1}{{D_{pi, p}^t}}} ; $
(1) $ {V_p} = \sum\limits_{i = 1}^k {{w_{pi, p}}{V_{pi}}} 。 $
(2) 式(1)~式(2)中:t为距离分解因子,一般取值为0,1,2。光谱距离Dpi, p可采用多种距离进行度量,常用的有欧氏距离、马氏距离和光谱角制图等。在借鉴前人研究的基础上[12-13],选择t值为1,马氏距离作为距离度量标准,在确定最优波段的基础上,计算最优的k值用于全区森林蓄积量反演。本研究的k值是由MATLAB 2014a软件计算获得。
2.5 模型评价
选择留一交叉验证评价。模型估测精度采用均方根误差(ERMS),相对均方根误差(ERRMS),偏差(bbias)3个指标来评价,指标计算公式如下:
$ {E_{{\rm{RMS}}}} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{\left( {\hat y - {y_i}} \right)}^2}} }}{n}} ; $
(3) $ {E_{{\rm{RRMS}}}} = \frac{{{E_{{\rm{RMS}}}}}}{{{{\bar y}_i}}}; $
(4) $ {b_{{\rm{bias}}}} = \frac{{\sum\limits_{i = 1}^n {\left( {\hat y - {y_i}} \right)} }}{n}。 $
(5) 式(3)~式(5)中:yi为蓄积量实测值,$ {{{\hat y}_i}} $为蓄积量预测值,$ {{{\bar y}_i}} $为蓄积量实测值平均值,n为样本个数。
3. 研究结果
3.1 自变量筛选
利用平均残差平方和准则筛选出蓄积量估测的建模变量因子。由图 3可知:经过变量优选,提取的SAVI,OSAVI,NDVI,GNDVI,GBNDVI,DVI可以得最小的平均残差平方和,为13.71。因此选择SAVI,OSAVI,NDVI,GNDVI,GBNDVI,DVI共6个因子作为蓄积量模型构建的优选变量。
3.2 蓄积量估测模型构建
3.2.1 偏最小二乘回归模型构建
将筛选的自变量构建森林蓄积量估测模型,应用MATLAB计算模型的各个参数,最后得到基于偏最小二乘回归法构建的蓄积量估测模型,其数学表达式为V=0.809 5+0.017 5 SAVI +0.025 8 OSAVI +0.025 6 NDVI +2.034 4 GNDVI +3.545 9 GBNDVI +0.001 5 DVI。其中,V为森林蓄积量,SAVI,OSAVI,NDVI,GNDVI,GBNDVI和DVI为表 3对应的植被指数。
3.2.2 k值的确定
k-NN方法的估测精度随着k值的不同而变化。相关研究表明[12, 23, 26]:k值取1~10的范围时,对不同参数的估测效果较好。本研究将k的取值范围设置为3~10,并对不同k值的估测结果进行分析,得到最优k值。由图 4可知:当k值为7时,k-NN方法估测的均方根误差(ERMS)最小,为10.633 4 m3·hm-2。因此,本研究选取7作为蓄积量估测的最佳k值。
3.2.3 模型验证
由表 4可知:偏最小二乘回归法估测的森林蓄积量均方根误差为21.90 m3·hm-2,相对均方根误差为27.5%,偏差为17.23 m3·hm-2,基于k-NN方法的森林蓄积量估测的均方根误差为12.80 m3·hm-2,相对均方根误差为16.0%,偏差为15.02 m3·hm-2。由此可知:基于非参数方法的k-NN方法估测效果要好于基于参数方法的偏最小二乘回归法,可作为延庆区森林蓄积量估测的方法。进一步对延庆区森林总蓄积量预测结果进行精度检验。以首都园林绿化政务网(http://www.bjyl.gov.cn/zwgk/tjxx/201604/t20160401_178533.html)公布的2015年延庆区森林蓄积量数据为实际值,对比分析基于2种方法反演的蓄积量预测值的差异(表 5)。由表 5可知:应用建立的偏最小二乘回归模型反演的森林蓄积量为266.22万m3,相对误差为50.45万m3,估测精度为76.6%,应用k-NN方法反演的森林蓄积量245.98万m3,相对误差为30.21万m3,估测精度为86.0%。由此可知:基于k-NN方法反演全区森林蓄积量的估测结果要好于偏最小二乘回归法,估测结果可靠。
表 4 2种估测模型的估测精度Table 4. Estimation accuracy of two models评价指标 均方根误差/(m3·hm-2) 相对均方根误差/% 偏差/(m3·hm-2) 偏最小二乘回归法 21.90 27.5 17.23 k-NN方法 12.80 16.0 15.02 表 5 延庆区森林蓄积量(FSV)估测误差比较Table 5. Comparison of estimation error of forest stock volume in Yanqing District项目 森林蓄积量/万m3 相对误差/万m3 误差百分比/% 森林蓄积量统计(网站) 215.77 偏最小二乘回归法 266.22 50.45 23.38 k-NN法 245.98 30.21 14.00 3.3 基于k-NN法的森林蓄积量反演
依据遥感影像分类得到的森林边界数据,应用k-NN方法建立的蓄积量估测模型对研究区森林蓄积量进行反演,得到延庆区森林蓄积量空间分布等级图(图 5)。
4. 讨论
基于偏最小二乘回归法的回归统计方法可以减少多重共线性的影响,提高模型构建的稳定性,保证估测的精度。以往的研究表明[3, 27-28]:应用偏最小二乘回归法估测森林参数要好于其他常规的回归方法,可以在一定程度上提高待估参数的估测精度。k-NN方法作为一种典型的非参数方法,它不用考虑变量间的多重共线性的关系,具有一定的应用优势。本研究比较了这2种方法的估测效果,结果表明:在研究区内,基于k-NN方法的非参数方法的估测精度要好于基于偏最小二乘回归的参数方法,对全区森林蓄积量进行反演的估测精度达到86.0%。但本研究还存在以下问题:①研究应用的两景GF-1影像虽然只覆盖了很少的区域,但影像时相与其余影像时相存在差异,可能导致蓄积量估测结果产生偏差,但在本研究中忽略了其影响,此部分问题有待于进一步分析。②应用k-NN法进行蓄积量估测可以减少由影像的同物异谱和同谱异物带来的随机变化[11],但其高值低估和低值高估现象依旧是应用k-NN法基于像素级估测森林参数普遍存在的问题[11-12, 35]。在本研究的估测过程中,随着k值的增大,蓄积量估计值分布空间呈现缩小的趋势。在后续的研究中,可考虑直方图匹配方[11]来提高k-NN法估测变量的精度。③本研究中的均方根误差随k值的增加呈现不规则的变化,这与KATILA等[37]和郑刚等[12]的研究中的均方根误差随k值的增大而减小的趋势不同。向安民等[23]应用GF影像估算森林蓄积量的研究中也出现了均方根误差随k值的增加出现不规则的变化趋势。这与GF影像上的椒盐噪声有很大关系,使得光谱信息与蓄积量值出现不匹配的现象,导致了均方根误差不规则的变化。
5. 结论
本研究应用GF-1 PMS影像数据提取了9种植被指数作为建模变量,采用平均残差平方和法对变量进行筛选,最终提取的SAVI,OSAVI,NDVI,GNDVI,GBNDVI和DVI等6个变量因子可以得到最小的平均残差平方和,作为蓄积量估测模型的变量。对比了偏最小二乘回归法(参数方法)和k-NN方法(非参数方法)估测森林蓄积量的效果。结果显示:k-NN方法的估测效果(均方根误差为12.80 m3·hm-2,相对均方根误差为16.0%,偏差为15.02 m3·hm-2)要好于偏最小二乘回归法(均方根误差为21.90 m3·hm-2,相对均方根误差为27.5%,偏差为17.23 m3·hm-2),并与首都园林绿化网公布的延庆区森林蓄积量结果进行了对比分析,基于k-NN方法反演的森林蓄积量估测精度达到86.0%,最后生成了延庆区森林蓄积量空间分布图。说明应用GF-1 PMS影像估测森林蓄积量是可行的。可以进一步在不同的县域范围应用GF-1 PMS影像估测森林蓄积量及相关的森林参数,对GF-1 PMS影像的估测潜力进行挖掘,这对推广应用国产GF-1 PMS影像具有重要意义。
6. 致谢
感谢中国林业科学研究院资源信息研究所提供GF-1 PMS卫星影像数据。
-
表 1 算法计算时间
Table 1. Computation time of algorithms
表 2 主要代表性反卷积算法
Table 2. Main representative algorithm
年份 算法名称 特点 2004 反卷积波束形成法(DAMAS)[4] 高分辨率,对迭代次数敏感,旁瓣抑制能力强,计算效率较低 2005 反卷积波束形成法2(DAMAS2)[11] 定位精度对迭代次数不敏感,计算效率高,实时性好,不适用于声源在扫描空间边缘的情况 2007 基于傅里叶变化的非负最小二乘算法(FFT-NNLS)[12] 计算速度较快,声源定位准确,定位精度对迭代次数不敏感,不适用于声源在扫描空间边缘的情况 2007 稀疏约束反卷积波束形成法(SC-DAMAS)[13] 利用稀疏性,计算效率较高,在噪声源定位中具有更好的准确性和鲁棒性 2007 基于空间相干的洁净算法(CLEAN-SC)[14] 可精确提取声源强度,提高了空间分辨率和准确性,计算精度稳定性高,计算效率高,实时性好,但不适用于声源位置相距较近的相干声源 2011 稀疏约束的超分辨率反卷积波束形成算法(SC-RDAMAS)[10] 适用于在超大分辨率下扫描大区域,计算效率低,实时性较弱,不适用于实时测试 2012 协方差矩阵拟合法(CMF)[15] 计算效率低,实时性较弱,不适用于实时测试 -
[1] 陈心昭.噪声源识别技术的进展[J].合肥工业大学学报(自然科学版), 2009, 32(5):609-614. CHEN Xinzhao. Progress of techniques for noise source identification[J]. J Hefei Univ Technol Nat Sci, 2009, 32(5):609-614. [2] YARDIBI T, BAHR C, ZAWODNY N, et al. Uncertainty analysis of the standard delay-and-sum beamformer and array calibration[J]. J Sound Vibr, 2010, 329(13):2654-2682. [3] 杨洋, 褚志刚, 江洪, 等.反卷积DAMAS2波束形成声源识别研究[J].仪器仪表学报, 2013, 34(8):1779-1786. YANG Yang, CHU Zhigang, JIANG Hong, et al. Research on DAMAS2 beamforming sound source identification[J]. Chin J Sci Instrum, 2013, 34(8):1779-1786. [4] BROOKS T F, HUMPHREYS W M. A deconvolution approach for the mapping of acoustic sources (DAMAS) determined from phased microphone arrays[J]. J Sound Vibr, 2006, 294(4):856-879. [5] YARDIBI T, ZAWODNY N S, BAHR C, et al. Comparison of microphone array processing techniques for aeroacoustic measurements[J]. Int J Aeroacoust, 2010, 9(6):733-762. [6] 杨洋, 褚志刚.基于CLEAN-SC清晰化波束形成的汽车前围板隔声薄弱部位识别[J].声学技术, 2015, 34(5):449-456. YANG Yang, CHU Zhigang. Weak position identification of sound insulation for car dash panel based on CLEAN-SC clearness beamforming[J]. Tech Acoust, 2015, 34(5):449-456. [7] CHU Zhigang, YANG Yang. Comparison of deconvolution methods for the visualization of acoustic sources based on cross-spectral imaging function beamforming[J]. Mech Syst Sign Proc, 2014, 48(1/2):404-422. doi:org/10.1016/j.ymssp.2014.03.012. [8] XENAKI A, JACOBSEN F, TIANA-ROIG E, et al. Improving the resolution of beamforming measurements on wind turbines[C]//ICA. Proceedings of 20th International Congress on Acoustics. Sydney: ICA, 2010: 23-27. [9] RAMACHANDRAN R C, RAMAN G, DOUGHERTY R P. Wind turbine noise measurement using a compact microphone array with advanced deconvolution algorithms[J]. J Sound Vibr, 2014, 333(14):3058-3080. [10] CHU Ning, PICHERAL J, MOHAMMAD-DJAFARI A. A robust super-resolution approach with sparsity constraint for near-field wideband acoustic imaging[C]//IEEE Computer Socirty. ISSPIT'11 Proceedings of the 2011 IEEE International Symposium on Signal Processing and Information Technology. Washington D C: IEEE Computer Society, 2011: 310-315. doi: 10.1109/ISSPIT.2011.6151579. [11] DOUGHERTY R. Extensions of DAMAS and benefits and limitations of deconvolution in beamforming[C]//AIAA Association. 11th AIAA/CEAS Aeroacoustics Conference. Monterey: AIAA Association, 2005. doi: org/10.2514/6.2005-2961. [12] EHRENFRIED K, KOOP L. Comparison of iterative deconvolution algorithms for the mapping of acoustic sources[J]. AIAA J, 2007, 45(7):1584-1595. doi:org/10.2514/1.26320. [13] YARDIBI T, LI Jian, STOICA P, et al. Sparsity constrained deconvolution approaches for acoustic source mapping[J]. J Acoust Soc Am, 2008, 123(5):2631-2642. [14] SIJTSMA P. CLEAN based on spatial source coherence[J]. Int J Aeroacoust, 2007, 6(4):357-374. [15] RÜBSAMEN M, PESAVENTO M. Steering vector non-identifiability in covariance matrix fitting based beamforming[C]//IEEE Computer Socirty. Proceedings of the IEEE 7th Sensor Array and Multichannel Signal Processing Workshop (SAM). Hoboken: IEEE Computer Socirty, 2012: 433-436. [16] 刘鹏, 刘志红, 李贺, 等.传声器阵列可视化效果影响因素研究[J].测试技术学报, 2016, 30(3):231-235. LIU Peng, LIU Zhihong, LI He, et al. Study on the influencing factors of microphone array visualization[J]. J Test Measyr Technol, 2016, 30(3):231-235. 期刊类型引用(20)
1. 邓再春,张超,朱夏力,范金明,钱慧,李成荣. 基于无人机多光谱影像的云南松林蓄积量估测模型. 浙江农林大学学报. 2024(01): 49-56 . 本站查看
2. 贾勃,王新杰. 应用贝叶斯模型平均法建立东北云冷杉针阔混交林蓄积生长模型. 东北林业大学学报. 2023(01): 1-5 . 百度学术
3. 吴胜义,王义贵,王飞,李伟坡. 基于多距离度量kNN模型的森林蓄积量反演. 中南林业科技大学学报. 2023(02): 10-18 . 百度学术
4. 胡建锦,熊伟,方陆明,吴达胜. 基于距离相关系数和Catboost方法的森林蓄积量估测. 中南林业科技大学学报. 2023(05): 27-35 . 百度学术
5. 魏智海,张志超,李崇贵. 基于GF-1PMS影像的森林郁闭度定量估测模型研究. 西北林学院学报. 2022(04): 231-237 . 百度学术
6. 吕金城,王振锡,杨勇强,曲延斌,马琪瑶. 基于WorldView-2影像和随机森林算法的天山云杉蓄积量反演. 新疆农业科学. 2022(08): 1992-1998 . 百度学术
7. 李坤,吴达胜,方陆明,刘建超. 运用Sentinel-2遥感影像数据估测森林蓄积量. 东北林业大学学报. 2021(05): 59-66 . 百度学术
8. 庞晓燕,刘海松,年学东,张志超,李崇贵,董相军. 应用Sentinel-2A卫星遥感影像估测森林蓄积量. 东北林业大学学报. 2021(07): 72-77+90 . 百度学术
9. 肖越,许晓东,龙江平,林辉. 基于国产高分数据的森林蓄积量反演研究. 林业资源管理. 2021(03): 101-107 . 百度学术
10. 苏迪,高心丹. 基于无人机航测数据的森林郁闭度和蓄积量估测. 林业工程学报. 2020(01): 156-163 . 百度学术
11. 朱赞,袁希平,甘淑,张良洁,赵庆会. 高分1号数据用于云南文山三七种植信息提取. 浙江农林大学学报. 2020(01): 129-135 . 本站查看
12. 刘兆华,林辉,龙江平,李新宇. 基于高分二号的旺业甸林场蓄积量估测模型研究. 中南林业科技大学学报. 2020(03): 79-84+118 . 百度学术
13. 宋亚斌,邢元军,江腾宇,林辉. 基于距离相关系数和KNN回归模型的森林蓄积量估测研究. 中南林业科技大学学报. 2020(04): 22-27+33 . 百度学术
14. 黄宇玲,吴达胜,方陆明. 基于逐步回归的XGboost方法的森林蓄积量估测. 中南林业科技大学学报. 2020(06): 72-80 . 百度学术
15. 黄宇玲. 基于机器学习的森林蓄积量研究综述. 智能计算机与应用. 2020(04): 158-161 . 百度学术
16. 韩瑞,吴达胜,方陆明,黄宇玲. 基于Boruta和极端随机树方法的森林蓄积量估测. 林业资源管理. 2020(04): 127-133 . 百度学术
17. 崔立,闫保银. 基于遥感技术的森林蓄积量估测研究进展. 江苏林业科技. 2020(04): 45-49 . 百度学术
18. 蒋馥根,孙华,ZHAO Feng,林辉,龙江平. 基于方差优化k最近邻法的森林蓄积量估测. 森林与环境学报. 2019(05): 497-504 . 百度学术
19. 张沁雨,王海宾,彭道黎,夏朝宗,陈健,柳文杰. 基于基准样地法和国产高分数据的湖南省森林植被碳储量估测. 应用生态学报. 2019(10): 3385-3394 . 百度学术
20. 冯源,肖文发,朱建华,黄志霖,鄢徐欣,吴东. 林龄和气候变化对三峡库区马尾松林蓄积量的影响. 北京林业大学学报. 2019(11): 11-21 . 百度学术
其他类型引用(23)
-
-
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2018.02.024