-
高等植物成花受到自身遗传因素和外界环境因素的共同影响[1-2]。当植物完成成花诱导,花器官原基开始分化,逐渐形成花萼、花瓣、雄蕊和心皮等组织。在这期间,植物的茎尖分生组织形态发生了很大的变化,同时成花素FT(FLOWERING LOCUS T)的表达量显著增加并参与调控花芽分化[3]。在模式植物拟南芥Arabidopsis thaliana以及许多物种中已经证实,FT可以通过激活花芽分化组织特异性基因AP1(APETALA1)的表达促使植物完成开花进程[4]。过表达AP1基因,不论在长、短日照下拟南芥都会出现早花表型[5],其突变体ap1则出现明显的晚花表型[6]。在茎尖分生组织,AP1基因不仅在植物成花诱导的调控网络中起核心作用,而且也决定花器官的形成。AP1基因是植物ABCDE分化模型中的A类基因,控制第一轮花萼和第二轮花被片组织的形成[7],同时AP1也调控SEP3(SEPALLATA3)与LFY(LEAFY)基因的表达,促进花萼和花瓣的分化[8-9]。另外在拟南芥ap1突变体研究中发现,AP1突变会引起花器官的异常发育,如花萼发育成叶片、花瓣缺失等[10-11]。人们已从多种观赏植物中分离得到了AP1基因,并且对多个物种的AP1基因进行了功能验证和分析。超表达AP1及其同源基因都能促进开花,在拟南芥中异源表达百合Lilium longiflorum,蝴蝶兰Phalaenopsis aphrodite以及山茶Camellia japonica的AP1同源基因都能引起早花现象[12-14]。同时,在拟南芥AP1突变体中异源表达百合,枇杷Eriobotrya japonica以及麻疯树Jatropha curcas中的AP1基因,都可以回补其突变体花器官缺陷的性状[12, 15-16]。桂花Osmanthus fragrans是中国十大传统名花之一,也是常见的园林绿化树种。按照开花习性不同,可分为秋桂和四季桂,秋桂仅在每年秋季开花,花序常为无总梗的聚伞花序[17];关于其成花过程以及花芽分化和发育报道较少。木本植物桂花成花的机制与草本植物拟南芥等有一定差异。为深入了解桂花的成花机制,有必要分离成花相关基因并展开相关研究。本研究以秋桂品种‘堰虹桂’Osmanthus fragrans ‘Yanhonggui’为材料,克隆桂花AP1基因(OfAP1),并对其序列进行生物信息学分析,同时运用荧光定量对其组织和时空表达进行分析,以明确OfAP1基因的基本特征和表达模式,为今后桂花的开花分子机理研究提供科学依据。
-
以盆栽‘堰虹桂’为材料,选取相同株龄且生长一致的植株。取桂花不同组织的样品,包括根、茎、叶、叶芽、花芽、盛开期的花朵;同时根据桂花花芽分化进程取叶芽、花序分化期、花萼花瓣分化期、雌雄蕊分化期以及花开放不同阶段圆珠期、铃梗期、初花期、盛花期和盛花末期的样品[18],用于基因克隆、组织特异性和时空表达分析。所有材料使用液氮冷冻并于-80 ℃保存备用。
RNA提取试剂盒(RNAprep pure Plant Kit)购自天根公司(北京)。反转录试剂盒、荧光定量试剂盒、胶回收试剂盒、Premix Taq酶、pMD-18T载体和大肠埃希菌Escherichia coli DH5α均购自Takara公司(大连),运用实时荧光定量PCR(Applied Biosystems,Foster City,美国)分析OfAP1基因的组织特异性及时空表达变化。
-
按照RNAprep pure Plant Kit试剂盒说明书提取各样品的总RNA,并参照Reverse Transcriptase M-MLV反转录酶说明书合成cDNA的第一链后,储存于-20 ℃备用。
-
利用前期转录组测序获得的AP1 Unigene序列,设计特异性引物AP1-F:5′-TAGAGTGAGAAAATGGGGAGA-3′;AP1-R:5′-AATACAATCCCTGGCTACTT-3′。以花芽分化期茎尖RNA反转录的cDNA为模板进行PCR扩增,PCR反应体系为:上下游引物各1 μL,cDNA 1 μL,Premix Taq DNA 10 μL和去离子水7 μL。PCR反应条件:95 ℃预变性5 min;然后进行35个循环,每个循环包括95 ℃变性30 s,60 ℃退火30 s,72 ℃延伸1 min;最后72 ℃保温10 min,4 ℃保存。PCR反应产物经质量分数为1%的琼脂糖凝胶电泳检测后回收、纯化,与pMD18-T载体连接,转化大肠埃希菌DH5α感受态细胞,蓝白斑筛选阳性克隆,经PCR鉴定后送生工生物工程(上海)股份有限公司测序。
-
对获得的基因序列进行生物信息学分析,其中编码区分析采用美国国家生物技术信息中心(NCBI)在线网站ORFFinder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html),编码蛋白质的保守区段分析采用NCBI Conserved Domain Search软件(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi),编码区蛋白质特征分析采用在线软件ProtParam(http://web.expasy.org/protparam/)和TMHMM Server v2.0(http://www.cbs.dtu.dk/services/TMHMM/)。多序列比对采用软件DNAman,系统进化树构建采用Clustal X+MEGA 7.0软件并选择邻位连接法(neighbor joining method)用Bootstrap法检验1 000次。
-
按照SYBR® Premix Ex Taq TM Ⅱ(Tli RNaseH Plus)试剂盒的说明书,检测桂花OfAP1基因不同组织以及不同时期的表达情况。OfAP1定量引物为qAP1-F:5′-GCAGAAGTGGCTTTGATTTG-3′;qAP1-R:5′-GTTTGCTGGTGACTGAGGTT-3′。同时以OfACT为内参qACT-F:5′-CCCAAGGCAAACAGAGAAAAAAT-3′;qACT-R:5′-ACCCCATCACCAGAATCAAGAA-3′[19]。qRT-PCR反应体系:2×SYBR Premix Ex TaqⅡ(Tli RNaseH Plus)10 μL,上下游定量引物(10 μmol·L-1)各0.8 μL,cDNA 2 μL,50×ROX Reference Dye 0.4 μL,双蒸水补齐至20 μL。qRT-PCR程序如下:95 ℃预变性30 s;95 ℃变性5 s,60 ℃退火30 s,72 ℃延伸1 min,35个循环;72 ℃延伸10 min。3次生物学重复。反应后根据熔解曲线分析qRT-PCR产物的特异性,并采用2-△△CT法计算相对表达量。
-
以‘堰虹桂’花芽分化期cDNA为模板,扩增得到约750 bp片段(图 1),其开放阅读框长为720 bp,编码239个氨基酸(图 2)。该基因片段具有MADS-box基因的保守区,在NCBI上进行BLASTX在线分析,发现该序列与芝麻Sesamum indicum(AIS82596.1),葡萄Vitis vinifera(ACZ26528.1)和油橄榄Olea europaea(XP_022878350.1)等中AP1基因的同源性最高,命名为OfAP1,并在GenBank注册,登录号为MH593222。
-
OfAP1蛋白氨基酸序列运用NCBI在线CDD(Conserved Domain Datebase)分析发现,OfAP1具有典型的MEF2_like MADS结构域和K-box结构域,MADS结构域位于N端第2~74位氨基酸,K-box结构域位于第90~168位氨基酸(图 2)。OfAP1蛋白的分子式为C1199H1941N341O368S16,其相对分子质量为27 534.62,理论等电点为8.4。负电荷残基总数(天冬氨酸Asp+谷氨酸Glu)为32,正电荷残基总数(精氨酸Arg+赖氨酸Lys)为35。在组成OfAP1蛋白的20种氨基酸中,亮氨酸(Leu)所占比例最高,为11.7%,其次为谷氨酸(Glu),占10.0%,色氨酸(Trp)所占比例最低,为0.8%。预测亲水性指数(GRAVY)为-0.665,表明OfAP1具有较好的亲水性。
采用GOR4软件对OfAP1蛋白二级结构预测发现,OfAP1蛋白二级结构由α螺旋、伸展链和无规则卷曲组成,其中,α螺旋(Hh)占56.49%,β折叠(Ee)占10.46%,无规则卷曲(Cc)占33.05%。同时采用Phyre 2在线工具对OfAP1蛋白三级结构进行预测,OfAP1有3个典型的α螺旋和2个β折叠(图 3)。NetPhos 2.0 Server预测结果表明:OfAP1蛋白序列中存在11个潜在的磷酸化位点,包括6个Ser位点(22Ser,61Ser,74Ser,87Ser,110Ser,121Ser,135Ser,150Ser,216Ser)和1个Thr位点(220Thr)。NetNGlyc 1.0 Server预测结果表明:OfAP1蛋白存在1个潜在的N-糖基化位点,90Asn。
-
为了分析OfAP1基因与其他物种中AP1基因的系统进化关系,采用MEGA 7.0软件构建系统进化树(图 4)。单子叶植物(如短柄草Brachypodium distachyon,水稻Oryza sativa,玉米Zea mays)和双子叶植物可以明显地分为2个大类。桂花OfAP1与芝麻,豇豆Vigna unguiculata,枇杷,印加果Plukenetia volubilis,麻疯树,葡萄,芍药Paeonia lactiflora,柑橘Citrus sinensis以及拟南芥中的AP1基因聚在一起,说明这些基因亲缘关系较近且功能具有一定的相似性。
-
为明确OfAP1基因在桂花不同组织以及花芽分化不同时期的表达情况,对不同组织和器官(根、茎、叶、叶芽、花芽以及花)及不同发育时期的样品进行荧光定量RT-PCR分析。结果表明:OfAP1基因在花芽中的表达量最高,其次为叶,在茎中的表达比较弱,在根中几乎不表达(图 5)。同时,与叶芽时期相比,OfAP1基因在分化初期(即花原基的形成以及花萼花瓣分化期)表达量最高,随后呈下降趋势(图 6),到花开放阶段表达量均较低。
-
AP1及其同源基因已在多个物种中克隆得到,但桂花中的AP1至今没有相关报道。本研究克隆得到OfAP1基因,发现其与芝麻、葡萄以及油橄榄等AP1基因高度相似,OfAP1氨基酸序列含有高度保守的MEF2_like MADS结构域和次级保守的K-box结构域以及可变C,MADS结构域具有结合DNA、蛋白质二聚化以及与其他因子结合的功能;K-box结构域的蛋白二级结构为3个α螺旋,具有介导蛋白-蛋白之间的相互作用[20]。AP1基因C末端的变化较大,但是不同类的MADS-box基因常含有一些保守的基序(motif),这些基序在蛋白复合体的形成和转录激活中起重要作用[21]。
开花是植物重要的发育阶段,是多条基因网络共同调控的复杂过程[2]。AP1基因是植物特有的MIKCC-Type MADS-box基因,既参与花分生组织的形成,又是花器官形成的重要基因,在植物成花中起关键调控作用[3]。根据在模式植物拟南芥中的研究,AP1是花分生组织形成的标志物,成花整合基因FT和SOC1能够激活其表达并使其参与对成花抑制基因TFL1基因的拮抗,促进花分生组织的形成。在花器官发育中,AP1一方面通过促进AP3和PI的表达诱导花瓣和雄蕊的发育,另一方面受到AG基因的抑制作用控制萼片和花瓣的发育[22]。在百合中AP1的同源基因LMADS5/6转基因拟南芥后发现其能够造成早花,并且花器官中萼片变成心皮状,花瓣变成雄蕊状结构[12];同样地,在洋桔梗Eustoma grandiflorum中超表达AP1发现:转基因植株花期提前,部分花瓣出现雄蕊类似的结构,进一步突变体互补实验表明:AP1基因对花瓣形成,尤其是第2轮花被片的发育有重要作用[23]。在建兰Cymbidium ensifolium,芍药以及菊花Chrysanthemum morifolium等中,AP1基因在花芽中的表达量显著高于其他器官组织,尤其在花芽分化的初期阶段[24-26]。在桂花中,OfAP1在花芽中有较高的表达,其在花芽分化初期表达量显著上调,尤其是成花转变以及花瓣、花萼分化时期,而当完成花萼花瓣分化后,表达量则显著下调。这充分说明桂花OfAP1基因参与了桂花成花转变和花瓣、花萼等器官分化,但其具体作用机制还有待进一步通过转化实验加以验证。
cDNA cloning and expression analysis of OfAP1 in Osmanthus fragrans
-
摘要: AP1(APETALA1)基因在植物花分生组织及花器官形成过程中发挥着重要作用。以桂花品种‘堰虹桂’Osmanthus fragrans‘Yanhonggui’为材料,根据前期获得的转录组数据中AP1的序列设计引物,利用PCR技术,克隆得到约750 bp桂花AP1 cDNA序列,即OfAP1基因,其中开放阅读框长为720 bp(注册号为MH593222)。氨基酸序列比对发现,与其他物种的AP1基因的同源性高达69%~88%。荧光定量PCR结果表明:在不同组织中,桂花的OfAP1基因在花芽中的表达量显著高于其他组织,根中几乎不表达;在花芽分化过程中,OfAP1在成花转变及花芽分化初期(花瓣、花萼分化期)表达量较高,随后呈下降趋势。这说明OfAP1具有组织表达特异性,同时在桂花成花转变、花芽分化和发育中有重要作用。Abstract: Osmanthus fragrans is one of the top ten traditional flowers and a common landscaping tree in China. To better understand the function of AP1 in regulation of Osmanthus flowering, the OfAP1 gene was cloned from the Osmanthus cultivator 'Yanhonggui', and its function was analyzed through bioinformatics method and real time PCR. Our results showed that the cDNA length of OfAP1 was 750 bp (GenBank accession No. MH593222), in which the Open Reading Frame length was 720 bp, the amino acid was 239. The OfAP1 sequence alignment revealed high homology with other species ranging from 69% to 88%. Additionally, expression profiles showed that the expression of OfAP1 in flower buds was much higher than that in other tissues (root, stem, leaf, leaf bud and flower), and the expression was barely expressed in roots. During the development of flower bud, the OfAP1 showed higher expression in S1 (calyx and petal differentiation) stage than other stages. Thus, these results suggested that OfAP1 had a tissue specific expression and played an important role in flowering transformation, flower bud differentiation, and development of O. fragrans. And the results of OfAP1 can lay a foundation for further study of the molecular mechanism of O. fragrans.
-
Key words:
- forest tree breeding /
- Osmanthus fragrans /
- AP1 /
- gene cloning /
- expression analysis /
- flower bud development
-
森林结构参数估测是森林可持续经营和生态环境监测的重要内容。森林蓄积量作为森林结构参数中的一个重要因子,是组成陆地植被生物量的重要成分之一,是评价森林资源数量与质量、反映森林经营管理水平的重要因子,也是评估森林固碳能力和森林碳收支的重要指标[1-4],因此,准确地估测森林蓄积量对森林经营管理和生态环境保护建设具有重要意义[5-6]。目前,应用遥感技术估测森林蓄积量的研究主要集中在2个方面:一是选取或结合不同遥感数据源(光学遥感、微波探测和激光雷达探测数据)构建估测模型,进行森林蓄积量估测;二是估测方法的多样性,由典型的参数方法(线性回归)向非参数方法转变(如人工神经网络、k近邻分类算法等)[2, 4, 7-10]。在森林蓄积量模型构建的过程中,自变量间的复共线性问题是亟待解决的一个问题。这些在传统的线性回归估测中无法避免[11-12]。k-最邻近(k-nearest neighbor,k-NN)方法作为一种非线性方法,可以不考虑复共线性问题,并且具有稳定的抗逆性,在欧洲和北美地区的森林资源监测中得到了广泛的应用。国内也开展了有关k-NN法估测森林蓄积及生物量的研究[10-13],但对比参数方法和非参数方法进行估测的研究不多。在以往的研究中,采用高分辨率数据进行森林蓄积量的估测多以国外数据为主。高分1号(GF-1)卫星是中国高分辨率对地观测卫星系统重大专项的第1颗卫星,它可以提供高分辨率的多光谱(8 m)和全色波段(2 m)数据,为森林资源动态监测提供了新的数据源[14]。然而,受限于GF-1卫星影像的覆盖范围等原因,针对GF-1全色和多光谱(panchromatic and multispectral,PMS)影像用于县域尺度森林蓄积量定量估测的研究较少。GF-1 PMS数据将高空间分辨率、高时间分辨率等优势集合于一体,挖掘并探讨GF-1 PMS影像数据估测森林蓄积量的潜力,对森林生理生态参数进行定量评价和GF-1 PMS影像数据的应用推广具有重要意义。本研究应用GF-1 PMS影像数据,通过挖掘影像的光谱信息,建立植被指数自变量集,并对自变量进行优选,采用k-NN方法构建森林蓄积量估测模型,并与偏最小二乘回归法构建的森林蓄积量估测模型进行对比,以此分析GF-1 PMS影像数据和2种估测方法的应用潜力,为县域尺度应用GF-1 PMS影像数据估测森林生理生态参数提供参考。
1. 研究材料
1.1 研究区概况
延庆区位于北京市的西北部(40°16'~40°47'N,115°44'~116°34'E),东邻怀柔,南接昌平,西面和北面与河北省怀来县、赤城县相接,三面环山,总面积达1 993.75 km2。该区属大陆性季风气候,是暖温带与中温带,半干旱与半湿润的过渡带。年平均温度为8.8 ℃,无霜期150~160 d。年平均降水量为467.0 mm,降水主要集中在6-8月。该区内森林植被属于针阔混交林森林植被,现存植被主要为人工林以及一些次生植被类型。区内主要森林类型有油松Pinus tabulaeformis林,侧柏Platycladus orientalis林,华北落叶松Larix principis-rupprechtii林,蒙古栎Quercus liaotungensis林,刺槐Robinia pseudoacacia林,白桦Betula platyphylla林,山杨Populus davidiana林和杂木林等。据2015年北京市公布的森林资源数据显示,延庆区森林面积为11.5万hm2,森林覆盖率为57.46%,森林蓄积量达到215.77万m3,占北京市总森林蓄积量的12.68%,具有重要的生态系统防护作用和固碳功能。
1.2 研究数据
1.2.1 地面数据及辅助数据
地面数据是延庆区2014年森林资源二类调查数据(以下简称“二调数据”),以矢量地理信息数据的形式储存。全区二类调查数据中的小班个数为2.37×104个,小班面积及蓄积的统计特征见表 1。本研究所应用到的调查因子包括小班编号、地类、小班蓄积、小班面积等因子。辅助数据包括延庆区边界矢量数据和覆盖延庆区的1: 10 000数字高程模型(DEM)数据,地面数据和辅助数据的坐标为北京54坐标系。
表 1 延庆区二类调查数据小班面积及蓄积基本统计量Table 1. Descriptive statistics of small class area and volume of forest management inventory in Yanqing District项目 小班面积/hm2 小班蓄积/m3 最大值 693.65 8 880.45 最小值 0.07 0.06 平均值 8.45 89.75 1.2.2 遥感影像
GF-1号卫星装载有2 m分辨率全色和8 m分辨率多光谱相结合的相机(PMS1~PMS2),多光谱相机包括蓝(0.45~0.52 μm),绿(0.52~0.59 μm),红(0.63~0.69 μm)和近红外(0.77~0.89 μm)4个波段,全色相机包括1个全色波段(0.45~0.89 μm),2台相机组合幅宽达60 km,重访周期为4 d。本研究选取了覆盖研究区的7景GF-1 PMS影像,由中国林业科学研究院资源信息研究所提供,其中序号2影像由于影像缺失,采用了2014年的影像进行补充,并假设对估测结果未产生影响,序号6和序号7的影像获取时间为2015年1月31号,作为补充影像,只覆盖了少部分区域,因此产生的差异可以忽略不计。GF-1 PMS影像数据详情见表 2。
表 2 覆盖延庆区的GF-1 PMS影像列表Table 2. List of GF-1 PMS images covering Yanqing District序号 影像传感器及轨道号 (多光谱/全色)/m 获取时间(年-月-日) 1 GF1_PMS1_E115.8_N40.3_20150505_L1A0000791191-MSS1 8/2 2015-05-05 2 GF1_PMS1_E115.9_N40.5_20140427_L1A0000212130-MSS1 8/2 2014-04-27 3 GF1_PMS1_E115.8_N40.5_20150505_L1A0000791190-MSS1 8/2 2015-05-05 4 GF1_PMS2_E116.2_N40.5_20150505_L1A0000791125-MSS2 8/2 2015-05-05 5 GF1_PMS2_E116.3_N40.7_20150505_L1A0000791124-MSS2 8/2 2015-05-05 6 GF1_PMS2_E116.4_N40.5_20150131_L1A0000624694-MSS2 8/2 2015-01-31 7 GF1_PMS2_E116.5_N40.7_20150131_L1A0000624693-MSS2 8/2 2015-01-31 1.2.3 地面数据处理
二类调查数据为区划调查数据,可以覆盖整个延庆区。在估测森林蓄积量前,需要计算小班内的每公顷森林蓄积量[不包括非森林地类的蓄积量(疏林地、散生木、四旁树的蓄积量),以下统称公顷蓄积量],采用Arc GIS软件中属性表中的字段计算器计算(公顷蓄积量=小班蓄积/小班面积)。本研究采用系统抽样方法在延庆区内布设抽样点,为与GF-1 PMS影像3×3窗口大小近似匹配,确定抽样点的面积大小为600 m2,形状为正方形。利用Arc GIS软件布设覆盖延庆区的格网,格网面积大小为600 m2。在布设格网时,存在单个格网覆盖多个小班的情况。本研究采用格网内小班公顷蓄积乘以对应小班的面积权重值,并求和获得覆盖多个小班的格网的蓄积量,最后计算格网内公顷蓄积量的变异系数,并取可靠水平为90%和估计精度为85%(二类规程要求)的控制标准,计算需要布设的抽样点个数及间距,并以此为基础外推估算延庆区的森林蓄积量。经计算公顷蓄积量的变异系数为2.015 3,确定样本数为489个,抽样间距为2.02 km。为与北京市一类清查样地布设间距相近,在满足抽样精度的基础上,本研究设置系统抽样间距为2 km × 2 km(图 1)。经系统布设样地后得到延庆区的抽样点共计492个,将抽样点所在的小班属性信息追加到抽样点上。处理后的样点数据包括样地号、地类、公顷蓄积量等因子,样点数据同时用于影像的分类结果验证。提取出蓄积量大于0的样点用于森林蓄积量反演,经处理后提取抽样点数据(蓄积大于0)共计156个。
1.2.4 遥感影像预处理
应用ENVI 5.1对7景GF-1 PMS影像进行辐射定标、大气校正,参照已校正好的2004年SOPT-5融合数据(2.5 m),对高分影像进行正射校正,误差控制在1个像元以内,对校正好的7景GF-1 PMS影像进行镶嵌处理,生成覆盖整个延庆区的GF-1 PMS影像,并利用延庆区边界矢量数据进行裁剪,生成延庆区范围内的GF-1影像(图 1),遥感影像校正后的坐标同地面数据和辅助数据。本研究选取应用较为广泛的最大似然分类法提取森林植被信息[12]。依据《国家森林资源连续清查主要技术规定》(2014)中的森林面积定义:森林面积等于乔木林面积、竹林面积与特殊灌木林面积之和。由延庆区二类调查数据可知,地类中无竹林地和特殊灌木林地,因此本研究中的森林面积只包括乔木林面积,森林蓄积量只包括乔木林蓄积量。按照《国家森林资源连续清查主要技术规定》(2014)地类划分标准,结合研究区实际地类情况,确定分类类别为乔木林地,其他林地(包括灌木林、疏林地、未成林造林地、苗圃地、迹地、宜林地),农地(耕地),建筑(建设用地),水域和其他土地(未利用地)等6类,对分类结果合并归类为森林和非森林2类,其中森林包括乔木林,非森林包括除乔木林之外所有的地类,最后对影像分类结果进行验证。结果表明:GF-1 PMS影像分类总精度达到87.90%,Kappa系数为0.75。分类结果见图 2。
2. 研究方法
2.1 遥感特征变量
遥感影像的植被信息是通过绿色植物叶片和植被冠层光谱特性及其变化差异反映的[14]。选择合适的植被指数可以有效地增强植被信息或抑制非植被信息,减小非植被信息如阴影对模型构建的影响[3]。因此,本研究借鉴前人的经验并结合蓄积量估测特点,选择9种植被指数作为建模变量(表 3)。
表 3 研究中用到的变量Table 3. Variables used in the study变量 计算公式 参考文献 差值植被指数DVI VI=ρ4-ρ3 [15] 重归一化植被指数RDVI $ {R_{{\rm{DVI}}}} = \sqrt {{N_{{\rm{DVI}}}} \times {D_{{\rm{VI}}}}} $ [16] 土壤植被指数SAVI $ {S_{{\rm{AVI}}}} = \frac{{1.5\left( {{\rho _4} - {\rho _3}} \right)}}{{\left( {{\rho _4} + {\rho _3} + 0.5} \right)}} $ [17] 优化土壤调整指数OSAVI $ {O_{{\rm{SAVI}}}} = \frac{{1.05\left( {{\rho _4} - {\rho _3}} \right)}}{{\left( {{\rho _4} + {\rho _3} + 1.05} \right)}} $ [18] 归一化植被指数NDVI $ {N_{{\rm{DVI}}}} = \frac{{{\rho _4} - {\rho _3}}}{{{\rho _4} + {\rho _3}}} $ [19] 归一化绿波波段差值植被指数GNDVI $ {G_{{\rm{NDVI}}}} = \frac{{{\rho _4} - {\rho _2}}}{{{\rho _4} + {\rho _2}}} $ [20] 考虑绿波波段差值植被指数GBNDVI $ {G_{{\rm{BNDVI}}}} = \frac{{{\rho _4}\left( {{\rho _1} + {\rho _2}} \right)}}{{{\rho _4} + {\rho _1} + {\rho _2}}} $ [21] 比值植被指数RVI $ {R_{{\rm{VI}}}} = {\rho _4}/{\rho _3} $ [22] 转换型植被指数TVI $ {T_{{\rm{VI}}}} = \sqrt {{N_{{\rm{DVI}}}} + 0.5} $ [23] 说明:ρ1,ρ2,ρ3,ρ4分别为蓝、绿、红、近红波段 应用布设好的抽样点提取对应位置的GF-1 PMS影像光谱信息,计算样本内的光谱平均值作为样本点的光谱值,参与模型的构建。本研究中,蓄积大于0的抽样点均落在乔木林(即有林地)范围内,不包括散生木、四旁树和疏林地部分,因此所构建的模型为乔木林蓄积量模型,参与全区的森林蓄积量估算。
2.2 自变量筛选
在建模变量中,自变量往往存在多重共线性问题,导致所构建的模型不够稳定,尤其是在变量个数较多时,会降低模型的预测精度,因此选择适宜的方法筛选自变量用于建模具有重要作用[24]。常用的变量筛选方法较多,有逐步回归法、Pearson相关系数法、平均残差平方和法等[4, 24-26]。相关研究表明:平均残差平方和法在变量筛选中具有很好的适用性[26],因此本研究选择此方法作为自变量筛选方法,平均残差平方和方法筛选变量的实现步骤参考文献[26]。
2.3 偏最小二乘回归法
偏最小二乘回归法是伍德(WOLD)和阿巴诺(ALBANO)于1983年提出的一种新型的多元统计方法。它集多元回归分析、典型相关分析和主成分分析的优点于一体,可以有效地解决多元回归分析中的变量多重相关性及噪声问题[27-29],近年来被逐渐地应用到森林参数的估计上[3, 30-31]。
以单因变量为例阐述其基本建模思想:设有因变量y和p个自变量{ x1,x2,…,xp},样本数为n,构成因变量和自变量的数据表y =[u]n×1和x[x1,x2,…,xp]n×p,对数据表x进行主成分处理,提取一个主成分t1(t1是x1,x2,…,xp的线性组合),要求t1尽可能多地携带x中的变异信息,同时与y的相关性最大,提取第1个主成分t1后,实施y和x对t1的回归,如果此时回归方程达到满意的精度,则算法停止,否则利用x和y被t1解释后的残余信息进行第2轮的主成分提取,如此反复,直到能达到较为满意的精度为止。若最终对x提取了m个主成分t1, t2,…,tm,偏最小二乘回归将实施y对t1, t2, …,tm的回归,然后表达成y对原变量x的回归方程。应用偏最小二乘回归法进行模型构建的详细过程见文献[9]。本研究应用MATLAB 2014a软件实现偏最小二乘回归模型的构建。
2.4 k-NN算法基本原理
k-NN算法是一种典型的非参数方法,基于观测点和预测点之间的空间相似性关系进行单变量或多变量预测(如蓄积量等森林参数),在欧洲和北美得到了广泛应用[32-34]。k-NN法用于森林参数估计的最大优点在于它不仅能同时估计若干个森林参数,而且它还能够维持参数之间的自然依赖结构,保持参数之间的一致性,同利用遥感自变量和森林参数建立的回归模型相比,k-NN方法更多地考虑森林参数同自变量间的非线性依赖关系[12, 35]。其基本原理为:记p为目标点,pi为参考点,并且参考点的森林参数(本研究为森林蓄积量)是已知的,Dp, pi为目标点和参考点之间的光谱距离,它是用来衡量样本参数间的相似度的。对于目标点p,找出其光谱空间最邻近的k个参考点p1,p2,…,pk,其中Dp, 1<Dp, 2<…<Dp, k。由于目标点p受其近邻的影响是不同的,通常距离越近的参考点对其影响越大,反之则影响越小。目标点p的森林参数VP可以通过k个参考点的相应的森林参数Vpi(i=1,2,…,k)的加权平均法获得[12],其中k个参考点的权重wpi, p通过光谱空间的反距离函数获得[12]。k-NN实质上是一个常用于空间插值的反距离加权平均法,当k=1时,k-NN即为最邻近距离法[35]。
$ {w_{pi, p}} = \frac{1}{{D_{pi, p}^t}}/\sum\limits_{i = 1}^k {/\frac{1}{{D_{pi, p}^t}}} ; $
(1) $ {V_p} = \sum\limits_{i = 1}^k {{w_{pi, p}}{V_{pi}}} 。 $
(2) 式(1)~式(2)中:t为距离分解因子,一般取值为0,1,2。光谱距离Dpi, p可采用多种距离进行度量,常用的有欧氏距离、马氏距离和光谱角制图等。在借鉴前人研究的基础上[12-13],选择t值为1,马氏距离作为距离度量标准,在确定最优波段的基础上,计算最优的k值用于全区森林蓄积量反演。本研究的k值是由MATLAB 2014a软件计算获得。
2.5 模型评价
选择留一交叉验证评价。模型估测精度采用均方根误差(ERMS),相对均方根误差(ERRMS),偏差(bbias)3个指标来评价,指标计算公式如下:
$ {E_{{\rm{RMS}}}} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{\left( {\hat y - {y_i}} \right)}^2}} }}{n}} ; $
(3) $ {E_{{\rm{RRMS}}}} = \frac{{{E_{{\rm{RMS}}}}}}{{{{\bar y}_i}}}; $
(4) $ {b_{{\rm{bias}}}} = \frac{{\sum\limits_{i = 1}^n {\left( {\hat y - {y_i}} \right)} }}{n}。 $
(5) 式(3)~式(5)中:yi为蓄积量实测值,$ {{{\hat y}_i}} $为蓄积量预测值,$ {{{\bar y}_i}} $为蓄积量实测值平均值,n为样本个数。
3. 研究结果
3.1 自变量筛选
利用平均残差平方和准则筛选出蓄积量估测的建模变量因子。由图 3可知:经过变量优选,提取的SAVI,OSAVI,NDVI,GNDVI,GBNDVI,DVI可以得最小的平均残差平方和,为13.71。因此选择SAVI,OSAVI,NDVI,GNDVI,GBNDVI,DVI共6个因子作为蓄积量模型构建的优选变量。
3.2 蓄积量估测模型构建
3.2.1 偏最小二乘回归模型构建
将筛选的自变量构建森林蓄积量估测模型,应用MATLAB计算模型的各个参数,最后得到基于偏最小二乘回归法构建的蓄积量估测模型,其数学表达式为V=0.809 5+0.017 5 SAVI +0.025 8 OSAVI +0.025 6 NDVI +2.034 4 GNDVI +3.545 9 GBNDVI +0.001 5 DVI。其中,V为森林蓄积量,SAVI,OSAVI,NDVI,GNDVI,GBNDVI和DVI为表 3对应的植被指数。
3.2.2 k值的确定
k-NN方法的估测精度随着k值的不同而变化。相关研究表明[12, 23, 26]:k值取1~10的范围时,对不同参数的估测效果较好。本研究将k的取值范围设置为3~10,并对不同k值的估测结果进行分析,得到最优k值。由图 4可知:当k值为7时,k-NN方法估测的均方根误差(ERMS)最小,为10.633 4 m3·hm-2。因此,本研究选取7作为蓄积量估测的最佳k值。
3.2.3 模型验证
由表 4可知:偏最小二乘回归法估测的森林蓄积量均方根误差为21.90 m3·hm-2,相对均方根误差为27.5%,偏差为17.23 m3·hm-2,基于k-NN方法的森林蓄积量估测的均方根误差为12.80 m3·hm-2,相对均方根误差为16.0%,偏差为15.02 m3·hm-2。由此可知:基于非参数方法的k-NN方法估测效果要好于基于参数方法的偏最小二乘回归法,可作为延庆区森林蓄积量估测的方法。进一步对延庆区森林总蓄积量预测结果进行精度检验。以首都园林绿化政务网(http://www.bjyl.gov.cn/zwgk/tjxx/201604/t20160401_178533.html)公布的2015年延庆区森林蓄积量数据为实际值,对比分析基于2种方法反演的蓄积量预测值的差异(表 5)。由表 5可知:应用建立的偏最小二乘回归模型反演的森林蓄积量为266.22万m3,相对误差为50.45万m3,估测精度为76.6%,应用k-NN方法反演的森林蓄积量245.98万m3,相对误差为30.21万m3,估测精度为86.0%。由此可知:基于k-NN方法反演全区森林蓄积量的估测结果要好于偏最小二乘回归法,估测结果可靠。
表 4 2种估测模型的估测精度Table 4. Estimation accuracy of two models评价指标 均方根误差/(m3·hm-2) 相对均方根误差/% 偏差/(m3·hm-2) 偏最小二乘回归法 21.90 27.5 17.23 k-NN方法 12.80 16.0 15.02 表 5 延庆区森林蓄积量(FSV)估测误差比较Table 5. Comparison of estimation error of forest stock volume in Yanqing District项目 森林蓄积量/万m3 相对误差/万m3 误差百分比/% 森林蓄积量统计(网站) 215.77 偏最小二乘回归法 266.22 50.45 23.38 k-NN法 245.98 30.21 14.00 3.3 基于k-NN法的森林蓄积量反演
依据遥感影像分类得到的森林边界数据,应用k-NN方法建立的蓄积量估测模型对研究区森林蓄积量进行反演,得到延庆区森林蓄积量空间分布等级图(图 5)。
4. 讨论
基于偏最小二乘回归法的回归统计方法可以减少多重共线性的影响,提高模型构建的稳定性,保证估测的精度。以往的研究表明[3, 27-28]:应用偏最小二乘回归法估测森林参数要好于其他常规的回归方法,可以在一定程度上提高待估参数的估测精度。k-NN方法作为一种典型的非参数方法,它不用考虑变量间的多重共线性的关系,具有一定的应用优势。本研究比较了这2种方法的估测效果,结果表明:在研究区内,基于k-NN方法的非参数方法的估测精度要好于基于偏最小二乘回归的参数方法,对全区森林蓄积量进行反演的估测精度达到86.0%。但本研究还存在以下问题:①研究应用的两景GF-1影像虽然只覆盖了很少的区域,但影像时相与其余影像时相存在差异,可能导致蓄积量估测结果产生偏差,但在本研究中忽略了其影响,此部分问题有待于进一步分析。②应用k-NN法进行蓄积量估测可以减少由影像的同物异谱和同谱异物带来的随机变化[11],但其高值低估和低值高估现象依旧是应用k-NN法基于像素级估测森林参数普遍存在的问题[11-12, 35]。在本研究的估测过程中,随着k值的增大,蓄积量估计值分布空间呈现缩小的趋势。在后续的研究中,可考虑直方图匹配方[11]来提高k-NN法估测变量的精度。③本研究中的均方根误差随k值的增加呈现不规则的变化,这与KATILA等[37]和郑刚等[12]的研究中的均方根误差随k值的增大而减小的趋势不同。向安民等[23]应用GF影像估算森林蓄积量的研究中也出现了均方根误差随k值的增加出现不规则的变化趋势。这与GF影像上的椒盐噪声有很大关系,使得光谱信息与蓄积量值出现不匹配的现象,导致了均方根误差不规则的变化。
5. 结论
本研究应用GF-1 PMS影像数据提取了9种植被指数作为建模变量,采用平均残差平方和法对变量进行筛选,最终提取的SAVI,OSAVI,NDVI,GNDVI,GBNDVI和DVI等6个变量因子可以得到最小的平均残差平方和,作为蓄积量估测模型的变量。对比了偏最小二乘回归法(参数方法)和k-NN方法(非参数方法)估测森林蓄积量的效果。结果显示:k-NN方法的估测效果(均方根误差为12.80 m3·hm-2,相对均方根误差为16.0%,偏差为15.02 m3·hm-2)要好于偏最小二乘回归法(均方根误差为21.90 m3·hm-2,相对均方根误差为27.5%,偏差为17.23 m3·hm-2),并与首都园林绿化网公布的延庆区森林蓄积量结果进行了对比分析,基于k-NN方法反演的森林蓄积量估测精度达到86.0%,最后生成了延庆区森林蓄积量空间分布图。说明应用GF-1 PMS影像估测森林蓄积量是可行的。可以进一步在不同的县域范围应用GF-1 PMS影像估测森林蓄积量及相关的森林参数,对GF-1 PMS影像的估测潜力进行挖掘,这对推广应用国产GF-1 PMS影像具有重要意义。
6. 致谢
感谢中国林业科学研究院资源信息研究所提供GF-1 PMS卫星影像数据。
-
[1] 周玉萍, 陈琼华, 黄小玲, 等.拟南芥开花时间调控的分子基础[J].植物学报, 2014, 49(4):469-482. ZHOU Yuping, CHEN Qionghua, HUANG Xiaoling, et al. Molecular basis of flowering time regulation in Arabidopsis[J]. Chin Bull Bot, 2014, 49(4):469-482. [2] FORNARA F, de MONTAIGU A, COUPLAND G. SnapShot:control of flowering in Arabidopsis[J]. Cell, 2010, 141(3):550-550. [3] HUANG T, BÖHLENIUS H, ERIKSSON S, et al. The mRNA of the Arabidopsis gene FT moves from leaf to shoot apex and induces flowering[J]. Science, 2005, 309(5741):1694-1696. [4] LIU Lu, ZHU Yang, SHEN Lisha, et al. Emerging insights into florigen transport[J]. Curr Opin Plant Biol, 2013, 16(5):607-613. [5] MANDEL M A, YANOFSKY M F. A gene triggering flower formation in Arabidopsis[J]. Nature, 1995, 377(6549):522. [6] PUTTERILL J, LAURIE R, MACKNIGHT R. It's time to flower:the genetic control of flowering time[J]. Bioessays, 2004, 26(4):363-373. [7] MANDEL M A, GUSTAFSON-BROWN C, SAVIDGE B, et al. Molecular characterization of the Arabidopsis floral homeotic gene APETALA1[J]. Nature, 1992, 360(6401):273. [8] 戚晓利, 卢孟柱.拟南芥APETALA1基因在花发育中的网络调控及其生物学功能[J].中国农学通报, 2011, 27(8):103-107. QI Xiaoli, LU Mengzhu. Regulation network and biological roles of APETALA1 of Arabidopsis thaliana in flower development[J]. Chin Agric Sci Bull, 2011, 27(8):103-107. [9] KAUFMANN K, WELLMER F, MUINO J M, et al. Orchestration of floral initiation by APETALA1[J]. Science, 2010, 328(5974):85-89. [10] IRISH V F, SUSSEX I M. Function of the APETALA1 gene during Arabidopsis floral development[J]. Plant Cell, 1990, 2(8):741-753. [11] BOWMAN J L, ALVAREZ J, WEIGEL D, et al. Control of flower development in Arabidopsis thaliana by APETALA1 and interacting genes[J]. Development, 1993, 119(3):721-743. [12] CHEN Mingkun, LIN Ichun, YANG Changhsien. Functional analysis of three lily (Lilium longiflorum) APETALA1-like MADS box genes in regulating floral transition and formation[J]. Plant Cell Physiol, 2008, 49(5):704-717. [13] LIU Yuexue, KONG Jin, LI Tianzhong, et al. Isolation and characterization of an APETALA1-like gene from pear (Pyrus pyrifolia)[J]. Plant Mol Biol Rep, 2013, 31(4):1031-1039. [14] SUN Yingkun, FAN Zhengqi, LI Xinlei, et al. The APETALA1 and FRUITFUL homologs in Camellia japonica and their roles in double flower domestication[J]. Mol Breed, 2014, 33(4):821-834. [15] LIU Yuexue, SONG Huwei, LIU Zongli, et al. Molecular characterization of loquat EjAP1 gene in relation to flowering[J]. Plant Growth Regulation, 2013, 70(3):287-296. [16] TANG Mingyong, TAO Yanbin, XU Zengfu. Ectopic expression of Jatropha curcas APETALA1(JcAP1) caused early flowering in Arabidopsis, but not in Jatropha[J]. Peer J, 2016, 4:e1969. doi:10.7717/peerj.1969. [17] 向其柏, 刘玉莲.中国桂花品种图志[M].浙江:浙江科学技术出版社, 2008:56. [18] 王英, 张超, 付建新, 等.桂花花芽分化和花开放研究进展[J].浙江农林大学学报, 2016, 33(2):340-347. WANG Ying, ZHANG Chao, FU Jianxin, et al. Progress on flower bud differentiation and flower opening in Osmanthus fragrans[J]. J Zhejiang A & F Univ, 2016, 33(2):340-347. [19] 付建新, 张超, 王艺光, 等.桂花组织基因表达中荧光定量PCR内参基因的筛选[J].浙江农林大学学报, 2016, 33(5):727-733. FU Jianxin, ZHANG Chao, WANG Yiguang, et al. Reference gene selection for quantitative real-time polymerase chain reaction (qRT-PCR) normalization in the gene expression of sweet osmanthus tissues[J]. J Zhejiang A & F Univ, 2016, 33(5):727-733. [20] THEISSEN G, BECKER A, DI ROSA A, et al. A short history of MADS-box genes in plants[J]. Plant Mol Biol, 2000, 42(1):115-149. [21] NG M, YANOFSKY M F. Function and evolution of the plant MADS-box gene family[J]. Nat Rev Genet, 2001, 2(3):186-195. [22] LIU Chang, XI Wanyan, SHEN Lisha, et al. Regulation of floral patterning by flowering time genes[J]. Dev Cell, 2009, 16(5):711-722. [23] CHUANG Tienhsin, LI Kunhung, LI Peifang, et al. Functional analysis of an APETALA1-like MADS box gene from Eustoma grandiflorum in regulating floral transition and formation[J]. Plant Biotechnol Rep, 2018, 12(2):1-11. [24] 吴菁华, 吴少华, 杨超, 等.建兰AP1基因的克隆、表达及其与MADS-box转录因子相互作用的分析[J].园艺学报, 2013, 40(10):1935-1942. WU Jinghua, WU Shaohua, YANG Chao, et al. Cloning and expression analysis on AP1 homologous gene from Cymbidium ensifolium and interaction analysis between AP1 and MADS-box transcription factors[J]. Acta Hortic Sin, 2013, 40(10):1935-1942. [25] 吴彦庆, 葛金涛, 陶俊.芍药花分生组织决定基因(AP1)克隆、序列分析及其在不同发育时期花瓣中的表达变化规律[J].农业生物技术学报, 2015, 23(12):1559-1567. WU Yanqing, GE Jintao, TAO Jun. cDNA cloning, sequence analysis and tissue expression detection of APETALA1 gene (AP1) in Paeonia lactiflora Pall. petals of different development stages[J]. Chin J Agric Biotechol, 2015, 23(12):1559-1567. [26] 梁芳, 黄萍, 袁秀云, 等.菊花CmAP1基因克隆及其植物表达载体构建[J].南方农业学报, 2017, 48(6):952-959. LIANG Fang, HUANG Ping, YUAN Xiuyun, et al. Cloning of CmAP1 gene from Chrysanthemum morifolium and establishment of its plant expression vector[J]. J South Agric, 2017, 48(6):952-959. 期刊类型引用(20)
1. 邓再春,张超,朱夏力,范金明,钱慧,李成荣. 基于无人机多光谱影像的云南松林蓄积量估测模型. 浙江农林大学学报. 2024(01): 49-56 . 本站查看
2. 贾勃,王新杰. 应用贝叶斯模型平均法建立东北云冷杉针阔混交林蓄积生长模型. 东北林业大学学报. 2023(01): 1-5 . 百度学术
3. 吴胜义,王义贵,王飞,李伟坡. 基于多距离度量kNN模型的森林蓄积量反演. 中南林业科技大学学报. 2023(02): 10-18 . 百度学术
4. 胡建锦,熊伟,方陆明,吴达胜. 基于距离相关系数和Catboost方法的森林蓄积量估测. 中南林业科技大学学报. 2023(05): 27-35 . 百度学术
5. 魏智海,张志超,李崇贵. 基于GF-1PMS影像的森林郁闭度定量估测模型研究. 西北林学院学报. 2022(04): 231-237 . 百度学术
6. 吕金城,王振锡,杨勇强,曲延斌,马琪瑶. 基于WorldView-2影像和随机森林算法的天山云杉蓄积量反演. 新疆农业科学. 2022(08): 1992-1998 . 百度学术
7. 李坤,吴达胜,方陆明,刘建超. 运用Sentinel-2遥感影像数据估测森林蓄积量. 东北林业大学学报. 2021(05): 59-66 . 百度学术
8. 庞晓燕,刘海松,年学东,张志超,李崇贵,董相军. 应用Sentinel-2A卫星遥感影像估测森林蓄积量. 东北林业大学学报. 2021(07): 72-77+90 . 百度学术
9. 肖越,许晓东,龙江平,林辉. 基于国产高分数据的森林蓄积量反演研究. 林业资源管理. 2021(03): 101-107 . 百度学术
10. 苏迪,高心丹. 基于无人机航测数据的森林郁闭度和蓄积量估测. 林业工程学报. 2020(01): 156-163 . 百度学术
11. 朱赞,袁希平,甘淑,张良洁,赵庆会. 高分1号数据用于云南文山三七种植信息提取. 浙江农林大学学报. 2020(01): 129-135 . 本站查看
12. 刘兆华,林辉,龙江平,李新宇. 基于高分二号的旺业甸林场蓄积量估测模型研究. 中南林业科技大学学报. 2020(03): 79-84+118 . 百度学术
13. 宋亚斌,邢元军,江腾宇,林辉. 基于距离相关系数和KNN回归模型的森林蓄积量估测研究. 中南林业科技大学学报. 2020(04): 22-27+33 . 百度学术
14. 黄宇玲,吴达胜,方陆明. 基于逐步回归的XGboost方法的森林蓄积量估测. 中南林业科技大学学报. 2020(06): 72-80 . 百度学术
15. 黄宇玲. 基于机器学习的森林蓄积量研究综述. 智能计算机与应用. 2020(04): 158-161 . 百度学术
16. 韩瑞,吴达胜,方陆明,黄宇玲. 基于Boruta和极端随机树方法的森林蓄积量估测. 林业资源管理. 2020(04): 127-133 . 百度学术
17. 崔立,闫保银. 基于遥感技术的森林蓄积量估测研究进展. 江苏林业科技. 2020(04): 45-49 . 百度学术
18. 蒋馥根,孙华,ZHAO Feng,林辉,龙江平. 基于方差优化k最近邻法的森林蓄积量估测. 森林与环境学报. 2019(05): 497-504 . 百度学术
19. 张沁雨,王海宾,彭道黎,夏朝宗,陈健,柳文杰. 基于基准样地法和国产高分数据的湖南省森林植被碳储量估测. 应用生态学报. 2019(10): 3385-3394 . 百度学术
20. 冯源,肖文发,朱建华,黄志霖,鄢徐欣,吴东. 林龄和气候变化对三峡库区马尾松林蓄积量的影响. 北京林业大学学报. 2019(11): 11-21 . 百度学术
其他类型引用(23)
-
-
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2019.04.005