留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

面向Sentinel-2A影像的大理市土地利用分类方法适用性研究

贾玉洁 刘云根 杨思林 王妍 张超 徐红枫 郑淑君

魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
引用本文: 贾玉洁, 刘云根, 杨思林, 等. 面向Sentinel-2A影像的大理市土地利用分类方法适用性研究[J]. 浙江农林大学学报, 2022, 39(6): 1350-1358. DOI: 10.11833/j.issn.2095-0756.20220134
WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
Citation: JIA Yujie, LIU Yungen, YANG Silin, et al. Applicability of land use classification method in Dali City based on Sentinel-2A image[J]. Journal of Zhejiang A&F University, 2022, 39(6): 1350-1358. DOI: 10.11833/j.issn.2095-0756.20220134

面向Sentinel-2A影像的大理市土地利用分类方法适用性研究

DOI: 10.11833/j.issn.2095-0756.20220134
基金项目: 国家自然科学基金资助项目(32160405);云南省高原湿地保护修复与生态服务重点实验室开放基金项目(202105AG070002)
详细信息
    作者简介: 贾玉洁(ORCID: 0000-0003-0184-0266),从事环境生态遥感研究。E-mail: 2443972318@qq.com
    通信作者: 杨思林(ORCID: 0000-0003-1671-8482),副教授,博士,从事高原湖泊水环境研究。E-mail: 84458250@qq.com
  • 中图分类号: S758;F301.2

Applicability of land use classification method in Dali City based on Sentinel-2A image

  • 摘要:   目的  获取更高效、准确的土地利用自动分类方法,为后续的高原山区土地利用分类研究提供理论支撑。  方法  选取中国典型的高原山区云南省大理市为研究区域,以Sentinel-2A影像为对象,提出一种面向对象特征的决策树分类方法,并将此方法分类结果与传统的ISODATA法和最大似然法土地利用分类结果进行对比。  结果  ①面向对象特征的决策树方法分类结果在空间分布和各地类的面积统计方面都优于ISODATA法和最大似然法,与研究区实际土地利用面积数据更为接近;②在大理市,最大似然法在水体和林地的提取上适用性较好,而面向对象特征的决策树分类方法在农田、草地、建设用地和其他这些地类的区分上适用性更强,且在冰川积雪的提取上也有更好的提取效果;③相比与传统的ISODATA法和最大似然法分类结果精度,面向对象特征的决策树分类方法可进一步提高分类精度,总体分类精度可达90.20%,Kappa系数为87.95%。  结论  相较于传统的分类方法,先粗分类再进一步细分类的分类思想,可避免区域之间的混淆问题。面向对象特征与决策树相结合的组合分类方法在高原山区有着更好的适用性,可以有效提高高原山区分类精度。图3表7参26
  • 密码子是识别和传递生物体遗传信息、联系蛋白质与DNA之间的重要桥梁,在生物体遗传和变异中起着至关重要的作用[1]。编码同一氨基酸的不同密码子被称为同义密码子。由于基因突变和自然选择的影响,某些同义密码子在蛋白质翻译过程中往往被高频使用,被称为密码子的使用偏好性[23]。物种的生物学功能与密码子偏好性密切相关,密码子偏好性不仅可以影响生物编码基因的蛋白质合成速率和翻译速率[4],还会影响蛋白质结构、折叠程度和mRNA的合成[5]。研究表明:同一物种或亲缘关系相近的物种,具有相似的密码子偏好使用模式[6],通过分析物种的密码子偏好性可以衡量物种之间的基因表达量,进而探究物种之间亲属关系[7]。通过密码子偏好性的研究,能够更好地阐明物种进化过程中基因的表达规律[8],为利用基因工程技术改良物种目标基因提供参考依据[9]

    梁山慈竹Dendrocalamus farinosus属竹亚科Bambusoideae牡竹属Dendrocalamus,又名大叶竹和瓦灰竹,是中国西南地区重要的经济竹种[10],生长速度快,适应性强,竹笋效益高,属于优良的笋竹两用竹种,与硬头黄竹Bambusa rigida都属于竹编和制浆造纸的优质原料[11]。针对梁山慈竹叶绿体基因组密码子使用偏好性的研究鲜见报道。为了更好地挖掘和利用梁山慈竹的潜在经济价值,本研究以梁山慈竹叶绿体基因组序列为研究对象,分析其密码子偏好性使用模式,探究并总结其相关表达基因的密码子偏好性,以期分析影响梁山慈竹叶绿体基因组密码子偏好性的主要因素,并筛选出最优密码子,为后续梁山慈竹叶绿体基因工程改造等研究提供理论基础。

    根据GenBank登录号MZ681865.156在美国国家生物技术信息中心(NCBI)数据库中搜索并下载梁山慈竹叶绿体基因组序列,共有85条编码序列(CDS)。序列重复或小于300 bp会对密码子偏好性指标的测定产生影响[12]。对基因序列进行筛选,剔除序列长度小于300 bp且重复的序列,获取起始密码子为ATG,终止密码子为TAG、TGA和TAA的序列,最终获得51条CDS序列作为后续分析的样本序列。

    运用CodonW1.4.2 (http://sourceforge.net/projects/codonw)和EMBOSS (http://imed.med.ucm.es/EMBOSS/)计算有效密码子数(ENC)、适应指数(CAI)、密码子偏性指数(CBI)、最优密码子频率(FOP)以及密码子第3位核苷酸A、T、C、G的含量(分别记为A3、T3、C3、G3)。利用ENC判断密码子偏好性程度,ENC>35说明密码子偏好性比较弱;反之,说明偏好性强[13]。通过CUSP软件分析并获得密码子鸟嘌呤(G)和胞嘧啶(C)所占的比率(GC比率)及GC平均比率(GCall),使用SPSS 25.0软件对梁山慈竹密码子各位置的GC比率与ENC进行相关分析。

    运用CodonW 1.4.2对同义密码子相对使用度(RSCU)进行分析,即该密码子的实际使用频率与其理论使用频率的比值[14]。当RSCU大于1时,同义密码子中偏好使用该密码子,被称为高频密码子;当RSCU等于1时,密码子无偏好性;当RSCU小于1时,密码子使用偏好性较弱[15]

    中性绘图分析是对影响密码子使用偏好性的关键因素进行分析,X轴为GC3,Y轴为GC1和GC2的平均值,绘制二维散点图对GC3和GC12 (各基因 GC1和GC2的平均值)的相关性进行分析(GC1、GC2、GC3分别代表第1、2、3位密码子的GC比例)。若回归系数接近1,代表GC3和GC12显著相关,碱基组成没有差异,说明突变是决定密码子偏好性的主要因素;若回归系数接近0,则代表自然选择是主要因素。

    ENC-plot绘图分析表现密码子的使用偏好性受到突变和自然选择的影响程度。使用Python 3.7进行ENC-plot绘图分析,构建散点图,横纵坐标分别为GC3、ENC,并绘制ENC的标准曲线。基因位点靠近或在标准曲线上,表明突变是决定密码子偏好性的主要因素,若基因位点和标准曲线距离很大,则说明偏好性主要由自然选择决定。

    PR2-plot分析表明基因中密码子的第3位碱基的构成情况。计算密码子碱基中第3位上4种碱基A、T、C、G比例,G3/(G3+C3)为X轴,A3/(A3+T3)为Y轴,绘制PR2-plot散点图,中心点为碱基比例A=T、C=G时的值,代表处于此区域的密码子并无使用偏好性[16]

    将51条基因升序排列后的ENC前后两端10%的基因建立高、低表达基因库。通过CodonW软件计算2个表达库中密码子的RSCU和ΔRSCU,同时满足高频密码子(RSCU>1)和高表达密码子(ΔRSCU≥0.08)的为最优密码子[17]

    在Codon Usage Database (http://www.kazusa.or.jp/codon/)下载异源表达宿主和植物代表类群,包括巨龙竹D. farinosus、粉麻竹D. sinicus、小叶龙竹D. pulverulentus、硬头黄竹、大肠埃希菌Escherichia coli、烟草Nicotiana tabacum、拟南芥Arabidopsis thaliana和酿酒酵母Saccharomyces cerevisiae等物种基因组密码子的使用频率,与梁山慈竹基因组密码子使用频率比值进行比较分析,当梁山慈竹密码子使用频率比其他生物的比值≥2.0或≤0.5时,说明该物种与梁山慈竹的同义密码子的使用偏好性差异较大,当比值不在上述范围内时,表明这2个物种对该密码子的偏好性较接近。

    将叶绿体基因如表1所示进行功能分类,使用CodinW软件,选择对应分析计算样本中各个基因的RSCU,将分析结果分布在59维向量空间中,分析指标间的对应性。

    表 1  梁山慈竹叶绿体基因结构分析
    Table 1  Structural analysis of the choroplast genome of D. farinosus
    基因分类基因分组基因名称
    光合系统基因光系统Ⅰ基因psaApsaBpsbApsbCpsbDpsbB
    光系统Ⅱ基因petApetBpetD
    细胞色素b/f复合体基因atpAatpBatpEatpFatpI
    三磷酸腺苷合成酶基因ndhAndhBndhCndhDndhEndhFndhGndhHndhIndhJndhK
    遗传系统基因烟酰胺腺票吟二核甘酸氧化还原酶基因rbcL
    二磷酸核酮糖羧化酶大亚基基因rpoArpoBrpoC1、rpoC2
    RNA聚合酶亚基基因rps2、rps3、rps4、rps7、rps8、rps11、rps12、rps14、rps18
    核糖体蛋白小亚基基因rpl2、rpl14、rpl16、rpl20、rpl22
    其他基因成熟酶K基因matK
    膜蛋白基因cemA
    细胞色素合成基因ccsA
    酪蛋白分解蛋白酶基因clpP
    未知功能基因假定叶绿体阅读框ycf2、ycf3、infA
    下载: 导出CSV 
    | 显示表格

    分析梁山慈竹叶绿体基因组CDS序列的碱基组成:梁山慈竹的4种碱基所对应的同义密码子的第3位碱基比例 (T3s、A3s、C3s、G3s)分别为45.28%、42.07%、18.13%、17.96%,T3s和A3s远高于G3s和C3s,表明梁山慈竹叶绿体基因组密码子的第3位碱基以A/U结尾为主。梁山慈竹的ENC为50.40,CAI为16.6%,第3位同义密码子的GC比率 (GC3S)为28.1%,表明其叶绿体基因组密码子偏好性较弱。

    梁山慈竹叶绿体基因组密码子的GC平均比率为39.48%,且GC1 (47.69%)>GC2 (39.70%)>GC3 (31.05%)。ENC为 39.04~61.00,均值为49.51,GC比率在基因密码子上并没有均匀分布(表2)。ENC和密码子3个位置GC比率的相关分析(表3)结果发现:ENC与GC3比率显著相关,与GC1、GC2不显著相关,说明密码子使用偏好性形成过程中GC3的影响作用大于GC1、GC2。

    表 2  梁山慈竹叶绿体基因组各基因密码子相关参数统计
    Table 2  Statistics of codon related parameters of various genes in the chloroplast genome of D. farinosus
    基因GC比率/%ENCCAIFOP基因GC比率/%ENCCAIFOP
    GCGC1GC2GC3GCGC1GC2GC3
    rps1241.8752.0047.2026.4044.850.1400.341rps1833.5334.5039.7726.3239.040.1470.333
    psbA42.5649.7242.9435.0341.330.3130.532rpl2036.1138.3340.8329.1750.970.1120.298
    matK34.4440.8232.4230.0849.490.1660.329clpP43.0152.5338.2538.2552.370.1750.337
    psbD44.4453.3943.5036.4448.990.2420.456psbB44.0154.4245.9731.6350.730.1900.380
    psbC44.6653.5944.7335.6348.910.1830.386petB41.0648.9341.2033.0547.310.1910.333
    rpoB39.1949.8138.0129.7449.690.1530.353petD40.3750.9339.1331.0649.460.1610.305
    rpoC139.8749.9338.0731.6352.770.1560.347rpoA37.0646.1835.5929.4149.940.1510.311
    rpoC238.9549.0136.6431.1852.290.1540.333rps1143.5250.6956.2523.6144.330.1740.396
    rps238.4040.5140.9333.7652.550.1680.338infA40.3543.8635.9641.2361.000.1810.409
    atpI38.8447.5836.2932.6650.550.1630.353rps836.5041.6141.6126.2846.620.1220.374
    atpF38.2747.6235.4531.7553.170.1470.353rpl1438.7154.8437.1024.1951.900.1810.392
    atpA42.0656.0139.9630.1249.960.1820.385rpl1644.7652.1453.5728.5739.410.1150.354
    rps1439.4239.4246.1532.6941.730.1350.384rps333.4743.7531.6725.0048.030.1930.402
    psaB41.8148.7143.1333.6149.340.1720.350rpl2237.5641.3336.6734.6747.480.1880.415
    psaA43.6851.8043.2835.9552.070.1980.373rpl244.5651.7748.5833.3353.330.1430.361
    ycf339.6947.4038.1533.5355.450.1560.343ndhB38.1642.0739.3333.0746.710.1560.348
    rps437.1347.5237.1326.7349.590.1690.386rps739.4949.6845.2223.5748.310.1640.373
    ndhJ39.3849.3836.8831.8851.480.1760.356ndhF34.1937.8438.9225.8146.190.1440.321
    ndhK38.6041.7043.7230.3651.910.1590.329ccsA33.6433.7441.1026.0745.600.1520.307
    ndhC39.6750.4136.3632.3348.750.1770.345ndhD36.1940.7236.9330.9448.980.1330.314
    atpE42.5152.1739.1336.2359.510.1670.405ndhE33.3341.1832.3526.4759.060.1440.316
    atpB42.6253.9141.6832.2647.430.1920.381ndhG34.4644.0732.7726.5545.770.1250.250
    rbcL44.1457.1143.9331.3850.190.2710.454ndhI34.9937.5738.6728.7352.090.1710.345
    ycf441.2248.3939.7835.4847.140.1620.385ndhA33.9842.4236.3623.1444.350.1400.321
    cemA33.6241.9927.7131.1755.910.1760.342ndhH37.8250.7634.7727.9249.950.1550.322
    petA40.2953.5835.232.0951.120.1550.331
    下载: 导出CSV 
    | 显示表格
    表 3  梁山慈竹叶绿体基因组中各基因参数的相关性分析
    Table 3  Correlation analysis of various gene parameters in the chloroplast genome of D. farinosus
    参数GC1GC2GC3ENCCAICBIFOPGC3sGC
    GC11
    GC20.300*1
    GC30.265−0.0091
    ENC0.142−0.425**0.389**1
    CAI0.409**0.0760.370**0.0121
    CBI0.438**0.2720.322*−0.0920.774**1
    FOP0.402**0.312*0.341*−0.0640.797**0.965**1
    GC3s0.271−0.0290.946**0.445**0.330*0.330*0.370**1
    GC0.814**0.673**0.525**0.0100.407**0.512**0.518**0.499**1
      说明: *表示显著相关 (P<0.05);**表示极显著相关 (P<0.01)。
    下载: 导出CSV 
    | 显示表格

    梁山慈竹叶绿体基因组中共包含18110个密码子(表4),总计编码20个氨基酸,密码子数为12~705个,其中密码子UGA共有12个,密码子含量最多的是编码谷氨酸的GAA,共有705个。梁山慈竹叶绿体基因组蛋白编码序列RSCU分析表明:氨基酸含量较高的有亮氨酸(Leu)和精氨酸(Arg),均为6个密码子编码,编码精氨酸的是UUA、UUG、CUU、CUC、CUA和CUG;编码亮氨酸的有AGA、AGG、CGU、CGC、CGA和CGG;除此之外,蛋氨酸(Met)和色氨酸(Trp)均只有1个密码子编码,分别是AUG和UGG,其余氨基酸密码子编码个数分别为2~4个。

    表 4  梁山慈竹叶绿体基因组蛋白编码序列RSCU分析
    Table 4  RSCU of protein coding region in the chloroplast of D. farinosus
    氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU
    PheUUU*6441.29TyrUAU*5321.59SerUCU*3431.58CysUGU*1511.53
    PheUUC3510.71TyrUAC1370.41SerUCC*2601.19CysUGC470.47
    LeuUUA*6341.94TERUAA*281.56SerUCA*2221.02ArgAGA*3221.75
    LeuUUG*3621.11TERUAG140.78SerUCG1190.55ArgAGG1190.64
    LeuCUU*4201.29TERUGA120.67SerAGU*2731.25ArgCGU*2611.41
    LeuCUC1380.42TrpUGG*3281.00SerAGC890.41ArgCGC950.51
    LeuCUA2950.90GlnCAA*4771.53ThrACU*4031.68ArgCGA*2341.27
    LeuCUG1070.33GlnCAG1480.47ThrACC1810.75ArgCGG760.41
    IleAUU*7401.48GluGAA*7051.46ThrACA*2591.08GlyGGU*4211.24
    IleAUC2950.59GluGAG2630.54ThrACG1160.48GlyGGC1450.43
    IleAUA4610.92LysAAA*6471.44AlaGCU*4931.73GlyGGA*5381.58
    MetAUG*4161.00LysAAG2530.56AlaGCC1720.60GlyGGG2590.76
    ValGUU*3821.47AspGAU*5221.54AlaGCA*3431.20ProCCU*2861.48
    ValGUC1260.49AspGAC1550.46AlaGCG1350.47ProCCC*1961.01
    ValGUA*3901.50HisCAU*3111.47AsnAAU*5281.48ProCCA*2091.08
    ValGUG1390.54HisCAC1120.53AsnAAC1870.52ProCCG840.43
      说明:*表示RSCU大于1的高频密码子。
    下载: 导出CSV 
    | 显示表格

    梁山慈竹叶绿体基因组RSCU大于1的密码子数目为34个(分别为UUU、UUA、UUG、CUU、AUU、AUG、GUU、GUA、UCU、UCC、UCA、AGU、ACU、ACA、GCU、GCA、AAU、UAU、UAA、UGG、CAA、GAA、AAA、GAU、CAU、UGU、AGA、CGU、CGA、GGU、GGA、CCU、CCC和CCA),即筛选出了34个高频密码子,其中以A、U、C、G结尾的密码子分别有13、16、2和1个,这说明密码子偏好以A和U结尾,RSCU较高的3个密码子分别为UUU (1.94)、CUA (1.73)和UCU (1.75)。

    中性绘图分析量化自然选择和突变压力之间的关系,阐明3个密码子位置之间的联系。结果表明:横坐标GC3的数值为23.14%~41.23%,纵坐标GC12的数值为39.04%~61.00% (图1)。梁山慈竹的Pearson相关系数为0.17,呈正相关关系,数据拟合后的回归系数为0.1868,决定系数(R2)较小,为0.0282,GC12和GC3的相关性不显著,说明其叶绿体基因组密码子偏好性受自然选择影响较大。

    图 1  中性绘图分析
    Figure 1  Analysis of neutrality plot

    图2显示:ENC分布并不紧密,少量分布在标准曲线附近,还有个别分布在标准曲线上侧,位点的ENC均大于35,与预期ENC值有差距。说明梁山慈竹密码子偏好性较弱且自然选择和突变都对其偏好性有影响。由于落在标准曲线下方的基因点数量比较多,所以梁山慈竹基因组密码子使用偏好性主要受自然选择的影响。

    图 2  ENC-plot分析
    Figure 2  Analysis of ENC-plot

    图3显示:基因位点在平面图4个区域内分布并不均匀,在A3/(A3+T3)<0.5和G3/(G3+C3)>0.5区域范围内分布最多。表明第3位碱基使用频率为:T>A、G>C,梁山慈竹叶绿体基因组密码子的第3位碱基在选择上具有偏好性,同时说明其密码子使用偏好性主要受自然选择的影响。

    图 3  PR2-plot分析
    Figure 3  Analysis of PR2-plot

    对梁山慈竹的ENC进行升序排列,前10%为高表达基因,即rps18、rpl16、psbA、rps14、rps11,后10%为低表达基因,即 ycf3、cemA、ndhE、atpE、infA。梁山慈竹的RSCU和ΔRSCU表明(表5):梁山慈竹叶绿体基因组有32个高频密码子,筛选出GCA、GCU等25个高表达密码子,最终确定18个密码子作为梁山慈竹叶绿体基因组的最优密码子,分别为UAA、GCA、GCU、UUC、GGU、AAA、CUU、UUA、CCA、CCU、CAA、AGA、CGU、AGU、UCC、ACU、GUA、GUU。其中16个以A/U结尾,2个以C结尾。

    表 5  梁山慈竹叶绿体基因组各氨基酸的RSCU分析及最优密码子分析
    Table 5  RSCU analysis and optimal codon analysis of amino acids in chloroplast genome of D. farinosus
    氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU
    TerUAA***1.560 01.800 01.200 00.600 0MetAUG1.000 01.000 01.000 00
    UAG0.780 00.600 01.200 0−0.600 0AsnAAC*0.520 00.893 60.625 00.268 6
    UGA0.670 00.600 00.600 00AAU1.480 01.106 41.375 0−0.268 6
    AlaGCA**1.200 01.200 00.734 70.465 3ProCCA**1.080 00.800 00.500 00.300 0
    GCC0.600 00.457 10.653 1−0.196 0CCC1.010 00.800 01.166 7−0.366 7
    GCG0.470 00.228 60.734 7−0.506 1CCG0.430 00.444 41.000 0−0.555 6
    GCU*1.730 02.114 31.877 60.236 7CCU***1.480 01.955 61.333 30.622 3
    CysUGC**0.470 00.400 000.400 0GlnCAA*1.530 01.500 01.368 40.131 6
    UGU1.530 01.600 02.000 0−0.400 0CAG0.470 00.500 00.631 6−0.131 6
    AspGAC*0.460 00.500 00.411 80.088 2ArgAGA*1.750 01.723 41.534 90.188 5
    GAU1.540 01.500 01.588 2-0.088 2AGG0.640 00.319 10.837 2−0.518 1
    GluGAA1.460 01.189 21.578 9−0.389 7CGA1.270 01.276 61.395 3−0.118 7
    GAG**0.540 00.810 80.421 10.389 7CGC0.510 00.319 10.837 2−0.518 1
    PheUUC**1.290 01.041 70.650 00.391 7CGG0.410 00.319 10.279 10.040 0
    UUU0.710 00.958 31.350 0−0.391 7CGU***1.410 02.042 61.116 30.926 3
    GlyGGA1.580 01.253 71.818 2−0.564 5SerAGC0.410 00.384 60.470 6−0.086 0
    GGC0.430 00.417 90.484 8−0.066 9AGU**1.250 01.846 21.411 80.434 4
    GGG0.760 00.119 40.363 6−0.244 2UCA1.020 00.615 41.058 8−0.443 4
    GGU***1.240 02.209 01.333 30.875 7UCC***1.190 01.769 20.941 20.828 0
    HisCAC**0.530 00.941 20.571 40.369 8UCG0.550 00.153 80.705 9−0.552 1
    CAU1.470 01.058 81.428 6−0.369 8UCU1.580 01.230 81.411 8−0.181 0
    Ile AUA0.920 00.850 70.949 4−0.098 7ThrACA1.080 01.181 81.176 50.005 3
    AUC*0.590 00.626 90.531 60.095 3ACC0.500 00.818 21.058 8−0.240 6
    AUU1.480 01.522 41.519 00.003 4ACG0.480 00.363 60.588 2−0.224 6
    LysAAA**1.440 01.471 71.155 60.316 1ACU**1.680 01.636 41.176 50.459 9
    AAG0.560 00.528 30.844 4−0.316 1ValGUA***1.500 01.767 41.257 10.510 3
    LeuCUA0.900 00.833 31.295 5−0.462 2GUC0.490 001.028 6−1.028 6
    CUC0.420 000.545 5−0.545 5GUG0.540 00.372 10.342 90.029 2
    CUG0.330 00.250 00.477 3−0.227 3GUU**1.470 01.860 51.371 40.489 1
    CUU*1.290 01.333 31.227 30.106 0TrpUGG1.000 01.000 01.000 00
    UUA***1.940 02.166 71.022 71.144 0TyrUAC**0.410 00.521 70.166 70.355 0
    UUG1.110 01.416 71.431 8−0.015 1UAU1.590 01.478 31.833 3−0.355 0
      说明: 高频密码子(RSCU>1.00)带下划线;*. ΔRSCU≥0.08;**. ΔRSCU≥0.3;***. ΔRSCU≥0.5; 加粗的密码子表示最优密码子。
    下载: 导出CSV 
    | 显示表格

    将梁山慈竹基因组密码子使用频率与巨龙竹、粉麻竹、小叶龙竹、硬头黄竹、大肠埃希菌、烟草、拟南芥和酿酒酵母等物种的基因组密码子使用频率进行比较(图4)。结果显示:梁山慈竹与巨龙竹、粉麻竹、小叶龙竹和硬头黄竹的密码子使用频率为0.5~2.0,说明它们的密码子使用偏好性相似,推测具有亲缘关系的禾本科Gramineae牡竹属植物叶绿体基因组密码子偏好性相似;在大肠埃希菌、烟草、拟南芥和酿酒酵母的密码子使用比值中筛选≥2.0或≤0.5的密码子,分别有28和15、15、14个,表明梁山慈竹与这些物种在同义密码子的偏好性上有一定差异。

    图 4  梁山慈竹与其他物种密码子偏好性比较
    Figure 4  Comparison of codon preference between D. farinosus and other species

    将梁山慈竹的51个叶绿体基因的基因功能分为光合系统基因、遗传系统基因、其他基因和未知功能基因四大类,在计算RSCU的基础上将各个基因分布到59维的向量空间。对应分析结果(图5)显示:前4个向量轴分别存在18.3%、16.8%、15.6%和15.4%的差异,前4向量轴累计差异为66.1%,4个轴对密码子均有不同程度的影响;第1轴的值大于其他轴,说明第1轴对梁山慈竹叶绿体基因组密码子偏好性的影响较大。对第1轴与CAI、CBI、FOP、ENC和GC3s等指数进行进一步的相关分析发现:梁山慈竹基因在第1轴上的坐标值与CAI (r=−0.001 7,P<0.01)、CBI (r=0.099 0,P<0.01)、FOP (r=0.083 0,P<0.01)、ENC (r=0.112 0,P<0.01)、GC3s (r=−0.145 0,P<0.01)间具有极显著的相关关系,其中CAI和GC3s第1轴具有负相关关系,表明基因组密码子的偏好性不止受单一因素的影响,自然选择、基因突变均有可能影响梁山慈竹基因组密码子使用偏好性[18]

    图 5  梁山慈竹基因组密码子RSCU的对应性分析
    Figure 5  Correspondence Analysis on RSCU of D. farinosus

    本研究对梁山慈竹叶绿体基因组密码子进行使用偏好性分析,筛选出51条CDS序列,分析表明:GC1>GC2>GC3,密码子在3个位置上的分布并不均匀,密码子偏好使用以A或U结尾的碱基,且梁山慈竹叶绿体基因组的ENC均值为49.51,表明其叶绿体基因组密码子使用偏好性较弱。这与乳油木Vitellaria paradoxa[19]和二乔玉兰Magnolia soulangeana[20]等植物叶绿体基因组密码子偏好性相似。

    对梁山慈竹叶绿体基因组密码子进行中性绘图、ENC-plot分析、PR2-plot分析和对应分析。在中性绘图分析中,回归系数为0.412 8,说明密码子偏好性更多受到自然选择的影响;在ENC-plot分析中,多数基因离标准曲线距离较远,实际ENC和预期ENC有差距,表明该部分基因的密码子偏好性主要受自然选择的影响;在PR2-plot绘图分析中,大部分基因位于平面图的右下方,即T>A、G>C,表明其密码子的使用更多受自然选择的影响。综上所述,影响梁山慈竹叶绿体基因组密码子偏好性的主要原因是自然选择。该研究结果与巨桉Eucalyptus grandi[21]、灰毛浆果楝Cipadessa cinerascens、酸枣Ziziphus jujuba var. spinosa[22]和云南油杉Keteleeria evelyniana[23]等叶绿体基因组密码子偏好性研究结果基本一致;但在对4种蔷薇科 Rosaceae果树[24]和银白杨Populus alba[25]的研究中发现:突变是影响密码子偏好性的主要因素。这说明密码子的使用偏好性受自然选择或基因突变因素影响。基于RSCU的对应分析表明:梁山慈竹的密码子使用变异原因除了突变和自然选择之外,还有其他的因素,这其中光合系统基因和遗传系统基因分布相对集中,各类基因密码子使用偏好性较为接近。该结论与木薯Manihot esculenta[26]和高山松Pinus densata[27]的研究结果一致。密码子使用频率比较结果显示:梁山慈竹与禾本科牡竹属的植物密码子偏好性相似,在基因选择外源系统表达时,可以选择密码子偏好性差异相对较小的酿酒酵母,在选择大肠埃希菌、烟草和拟南芥作为外源表达宿主时,需要根据密码子使用偏好性进行碱基优化,从而使基因在宿主体内更好地表达。

    最优密码子分析表明:梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子,最优密码子大部分以A或U结尾。该结果与抽筒竹Gelidocalamus tessellatus[28]和毛竹Phyllostachys edulis[29]叶绿体基因组最优密码子分析结果一致,这可能与亲缘关系相近,但不同物种之间叶绿体基因组进化过程中的相对保守性有关系[21]。通过筛选获取梁山慈竹偏好使用密码子,可进一步对目标基因进行密码子优化,提高梁山慈竹的竹笋产量和造纸纤维含量,以及利用新一代精准基因编辑工具CRISPR/Cas9优化梁山慈竹密码子,从而改造梁山慈竹基因组编辑的Cas9基因,提高该基因在梁山慈竹中的表达水平[30]

    本研究通过分析梁山慈竹叶绿体基因组的CDS序列,对梁山慈竹的叶绿体基因组进行生物信息学分析,筛选出梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子。研究结果表明:影响梁山慈竹密码子偏好性的主要因素是自然选择。研究结果为后续在分子层面上利用基因工程开发梁山慈竹优良资源提供参考。

  • 图  1  分类模型流程图

    Figure  1  Flow chart of classification model

    图  2  基于不同分类方法得到的大理市2020年土地利用类型示意图

    Figure  2  Land use type map of Dali City in 2020 based on different classification methods

    图  3  各类地物面积统计

    Figure  3  Area statistics of various features

    表  1  各种类型地物样本组合的Jeffries-Matusita距离

    Table  1.   Jeffries Matusita distance of various types of feature sample combinations

    土地利用类型分离度土地利用类型分离度
    林地-农田 1.953 农田-其他 1.994
    林地-水体 2.000 水体-草地 1.993
    林地-草地 1.895 水体-建设用地 2.000
    林地-建设用地 1.998 水体-冰川积雪 1.998
    林地-冰川积雪 1.995 水体-其他 1.996
    林地-其他 1.994 草地-建设用地 1.996
    农田-水体 1.983 草地-冰川积雪 1.997
    农田-草地 1.894 草地-其他 1.996
    农田-建设用地 1.993 建设用地-冰川积雪 1.992
    农田-冰川积雪 1.993 建设用地-其他 1.983
    冰川积雪-其他 1.990
    下载: 导出CSV

    表  2  面向对象特征定义表

    Table  2.   Object oriented feature definition

    类别特征定义和公式
    光谱特征 光谱均值   斑块内像素光谱均值
    纹理特征 纹理特征   灰度共生矩阵(GLCM,包括5×5卷积模板内的均值、方差、同质性、熵值、对比度、二阶矩、相关性)
    几何特征 面积     斑块总面积
    延伸率    最大直径与最小直径比值
    矩形形状参数 矩形形状度量值(Rect)=面积/(最大直径×最小直径)
    下载: 导出CSV

    表  3  各地类验证点个数

    Table  3.   Number of verification points of each class

    土地利用类型天地图验证点个数野外调查验证点个数
    水体  945
    林地  6858
    建设用地546
    农田  6718
    草地  898
    冰川积雪130
    其他  164
    下载: 导出CSV

    表  4  ISODATA法遥感解译误差矩阵

    Table  4.   ISODATA remote sensing interpretation error matrix

    土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
    林地 93 0 3 0 4 0 0 100 93.00
    建设用地 0 67 0 7 5 5 3 87 77.01
    农田 16 2 47 0 2 1 7 75 62.67
    水体 0 0 0 76 2 0 0 78 97.44
    草地 3 0 0 3 29 2 0 37 78.38
    其他 0 4 2 0 8 71 0 85 83.53
    冰川积雪 0 2 6 0 0 0 30 38 78.95
    分类样本数 112 75 58 86 50 79 40 500
    制图精度/% 83.04 89.33 81.03 88.37 58.00 89.37 75.00
    下载: 导出CSV

    表  5  最大似然法遥感解译误差矩阵

    Table  5.   Maximum likelihood remote sensing interpretation error matrix

    土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
    林地 119 0 0 0 2 0 0 121 98.35
    建设用地 3 51 2 5 1 2 0 64 79.69
    农田 6 4 61 0 4 4 1 80 76.25
    水体 0 0 0 91 0 0 0 91 100.00
    草地 5 4 7 0 55 0 3 74 74.32
    其他 0 14 2 0 0 36 0 52 69.23
    冰川积雪 1 4 0 0 1 0 12 18 66.67
    分类样本数 134 77 72 96 63 42 16 500
    制图精度/% 88.81 66.23 84.72 94.79 87.30 85.71 75.00
    下载: 导出CSV

    表  6  面向对象特征决策树法遥感解译误差矩阵

    Table  6.   Remote sensing interpretation error matrix of object-oriented feature decision tree method

    土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
    林地 118 0 2 0 5 0 0 125 94.40
    建设用地 0 51 3 3 1 2 1 61 83.61
    农田 4 2 76 0 4 1 2 89 85.39
    水体 1 2 0 93 1 0 0 97 95.88
    草地 3 3 4 3 86 0 0 99 86.87
    其他 0 1 0 0 0 17 0 18 94.44
    冰川积雪 0 1 0 0 0 0 10 11 90.91
    分类样本数 126 60 85 99 97 20 13 500
    制图精度/% 93.65 85.00 89.41 93.94 88.66 85.00 76.92
    下载: 导出CSV

    表  7  3种分类方法比较

    Table  7.   Comparison of three classification methods

    分类方法总体分类精度/%Kappa系数/%
    ISODATA法分类 82.60 79.40
    最大似然法分类 85.00 81.90
    面向对象特征决策树法 90.20 87.95
    下载: 导出CSV
  • [1] 郎文婧, 李效顺, 卞正富, 等. 徐州市区土地利用格局变化分析及其空间扩张模拟[J]. 生态与农村环境学报, 2017, 33(7): 592 − 599.

    LANG Wenjing, LI Xiaoshun, BIAN Zhengfu, et al. Analysis of land use pattern change and spatial expansion simulation in Xuzhou [J]. J Ecol Rural Environ, 2017, 33(7): 592 − 599.
    [2] 李万源, 田佳, 马琴, 等. 基于Google Earth Engine与机器学习的黄土梯田动态监测[J]. 浙江农林大学学报, 2021, 38(4): 730 − 736.

    LI Wanyuan, TIAN Jia, MA Qin, et al. Dynamic monitoring of loess terraces based on Google Earth Engine and machine learning [J]. J Zhejiang A&F Univ, 2021, 38(4): 730 − 736.
    [3] 谭磊, 赵书河, 罗云霄, 等. 基于对象特征的山东省丘陵地区多时相遥感土地覆被自动分类[J]. 生态学报, 2014, 34(24): 7251 − 7260.

    TAN Lei, ZHAO Shuhe, LUO Yunxiao, et al. Automatic classification of land cover based on multi temporal remote sensing in hilly areas of Shandong Province [J]. J Ecol, 2014, 34(24): 7251 − 7260.
    [4] 周珂, 杨永清, 张俨娜, 等. 光学遥感影像土地利用分类方法综述[J]. 科学技术与工程, 2021, 21(32): 13603 − 13613.

    ZHOU Ke, YANG Yongqing, ZHANG Yanna, et al. Summary of land use classification methods of optical remote sensing images [J]. Sci Technol Eng, 2021, 21(32): 13603 − 13613.
    [5] 杨知, 欧文浩, 刘晓燕, 等. 基于LinkNet卷积神经网络的高分辨率遥感影像水体信息提取[J]. 云南大学学报(自然科学版), 2019, 41(5): 932 − 938.

    YANG Zhi, OU Wenhao, LIU Xiaoyan, et al. Water information extraction from high resolution remote sensing images based on LinkNet convolutional neural network [J]. J Yunnan Univ Nat Sci Ed, 2019, 41(5): 932 − 938.
    [6] 尹华锋, 苏程, 冯存均, 等. 基于样本知识挖掘的高分辨率遥感图像水稻种植信息提取方法[J]. 浙江大学学报(农业与生命科学版), 2018, 44(6): 765 − 774.

    YIN Huafeng, SU Cheng, FENG Cunjun, et al. Extraction of rice planting information from high-resolution remote sensing images based on sample knowledge mining [J]. J Zhejiang Univ Agric Life Sci Ed, 2018, 44(6): 765 − 774.
    [7] 甘甜, 李金平, 李小强, 等. 面向对象的高分辨率遥感影像建筑物震害信息提取[J]. 测绘工程, 2015, 24(4): 11 − 15.

    GAN Tian, LI Jinping, LI Xiaoqiang, et al. Object oriented extraction of building seismic damage information from high-resolution remote sensing images [J]. Surv Mapp Eng, 2015, 24(4): 11 − 15.
    [8] 宋军伟, 张友静, 李鑫川, 等. 基于GF-1与Landsat-8影像的土地覆盖分类比较[J]. 地理科学进展, 2016, 35(2): 255 − 263.

    SONG Junwei, ZHANG Youjing, LI Xinchuan, et al. Comparison of land cover classification based on GF-1 and landsat-8 images [J]. Prog Geogr Sci, 2016, 35(2): 255 − 263.
    [9] 张卫春, 刘洪斌, 武伟. 基于随机森林和Sentinel-2影像数据的低山丘陵区土地利用分类——以重庆市江津区李市镇为例[J]. 长江流域资源与环境, 2019, 28(6): 1334 − 1343.

    ZHANG Weichun, LIU Hongbin, WU Wei. Land use classification in low mountain and hilly areas based on random forest and Sentinel-2 image data: a case study of Lishi Town, Jiangjin District, Chongqing [J]. Resour Environ Yangtze River Basin, 2019, 28(6): 1334 − 1343.
    [10] ZHU Yuanhui, LIU Kai, LIU Lin, et al. Exploring the potential of World- View-2 Red-Edge Band-Based vegetation indices for estimation of mangrove leaf area index with machine learning algorithms[J/OL]. Remote Sensing, 2017, 9(10): 1060[2022-01-02]. doi: 10.3390/rs9101060.
    [11] KIM H O, YEOM J M. Effect of red-edge and texture features for object-based paddy rice crop classification using Rapid Eye multi-spectral satellite image data [J]. Int J Remote Sensing, 2014, 35(19): 7046 − 7068.
    [12] IMMITZER M, VUOLO F, ATZBERGER C. First experience with Sentinel-2 data for crop and tree species classifications in central Europe [J/OL]. Remote Sensing, 2016, 8(3): 166[2022-01-10]. doi: 10.3390/rs8030166.
    [13] 许超, 何静, 何小弟, 等. 基于遥感的土地利用/覆盖信息动态变化监测分析——以扬州市为例[J]. 东北林业大学学报, 2010, 38(4): 128 − 131.

    XU Chao, HE Jing, HE Xiaodi, et al. Monitoring and analysis of dynamic change of land use / cover information based on remote sensing: a case study of Yangzhou City [J]. J Northeast For Univ, 2010, 38(4): 128 − 131.
    [14] 代晶晶, 吴亚楠, 王登红, 等. 基于面向对象分类的稀土开采区遥感信息提取方法研究[J]. 地球学报, 2018, 39(1): 111 − 118.

    DAI Jingjing, WU Yanan, WANG Denghong, et al. Research on remote sensing information extraction method of rare earth mining area based on object-oriented classification [J]. Acta Geo Sin, 2018, 39(1): 111 − 118.
    [15] 郭海湘, 杨娟, 杨文霞, 等. 基于改进的ABC模糊分类法煤矿物资分类[J]. 辽宁工程技术大学学报(自然科学版), 2010, 29(5): 985 − 989.

    GUO Haixiang, YANG Juan, YANG Wenxia, et al. Coal mine material classification based on improved ABC fuzzy classification [J]. J Liaoning Univ Eng Technol Nat Sci Ed, 2010, 29(5): 985 − 989.
    [16] 张晓羽, 李凤日, 甄贞, 等. 基于随机森林模型的陆地卫星-8遥感影像森林植被分类[J]. 东北林业大学学报, 2016, 44(6): 53 − 57, 74.

    ZHANG Xiaoyu, LI fengri, ZHEN Zhen, et al. Forest vegetation classification of Landsat-8 remote sensing images based on random forest model [J]. J Northeast For Univ, 2016, 44(6): 53 − 57, 74.
    [17] 郑卓, 方芳, 刘袁缘, 等. 高分辨率遥感影像场景的多尺度神经网络分类法[J]. 测绘学报, 2018, 47(5): 620 − 630.

    ZHENG Zhuo, FANG Fang, LIU Yuanyuan, et al. Multi scale neural network classification of high resolution remote sensing image scenes [J]. J Surv Mapp, 2018, 47(5): 620 − 630.
    [18] 张舒婷, 王晓慧, 彭道黎, 等. 黄土高原丘陵沟壑区植被覆盖度变化监测[J]. 浙江农林大学学报, 2020, 37(6): 1045 − 1053.

    ZHANG Shuting, WANG Xiaohui, PENG Daoli, et al. Monitoring of vegetation coverage change in Hilly and gully areas of the Loess Plateau [J]. J Zhejiang A&F Univ, 2020, 37(6): 1045 − 1053.
    [19] 陈俊松, 施舫, 杜薇, 等. 基于GF-2影像的平原河网区规模化生猪养殖场提取方法研究[J]. 生态与农村环境学报, 2020, 36(11): 1485 − 1494.

    CHEN Junsong, SHI Fang, DU Wei, et al. Study on extraction method of large-scale pig farm in plain river network area based on GF-2 image [J]. J Ecol Rural Environ, 2020, 36(11): 1485 − 1494.
    [20] 杨子生, 杨诗琴, 杨人懿, 等. 基于利用视角的土地资源分类方法探讨[J]. 资源科学, 2021, 43(11): 2173 − 2191.

    YANG Zisheng, YANG Shiqin, YANG Renyi, et al. Discussion on land resources classification method based on utilization perspective [J]. Resour Sci, 2021, 43(11): 2173 − 2191.
    [21] 任向宇, 孙文彬, 袁烨. MESMA与面向对象组合的土地利用分类方法[J]. 遥感信息, 2021, 36(1): 69 − 76.

    REN Xiangyu, SU Wenbin, YUAN Ye. Land use classification method based on combination of MESMA and object-oriented [J]. Remote Sensing Inf, 2021, 36(1): 69 − 76.
    [22] 吴健生, 潘况一, 彭建, 等. 基于QUEST决策树的遥感影像土地利用分类——以云南省丽江市为例[J]. 地理研究, 2012, 31(11): 1973 − 1980.

    WU Jiansheng, PAN Kuangyi, PENG Jian, et al. Land use classification of remote sensing images based on quest decision tree: a case study of Lijiang City, Yunnan Province [J]. Geogr Res, 2012, 31(11): 1973 − 1980.
    [23] NOVELLI A, AGUILAR M A, NEMMAOUI A, et al. Performance evaluation of object based greenhouse detection from Sentinel-2 MSI and Landsat 8 OLI data: a case study from Almería (Spain) [J]. Int J Appl Earth Obs Geoinf, 2016, 52: 403 − 411.
    [24] HILLl M J. Vegetation index suites as indicators of vegetation state in grassland and savanna: an analysis with simulated SENTINEL 2 data for a north American transect [J]. Remote Sensing Environ, 2013, 137: 94 − 111.
    [25] GAUTAM V K, GAURAV P K, MURUGAN P, et al. Assessment of surface water dynamics in bangalore using WRI, NDWI, MNDWI, supervised classification and K-T transformation [J]. Aquatic Procedia, 2015, 4: 739 − 746.
    [26] 张亚新, 吴志勇, 何海. 苏南丘陵区土地利用遥感分类方法适用性研究[J]. 湖北农业科学, 2021, 60(5): 138 − 143.

    ZHNG Yaxin, WU Zhiyong, HE Hai. Study on applicability of remote sensing classification method of land use in hilly area of Southern Jiangsu [J]. Hubei Agric Sci, 2021, 60(5): 138 − 143.
  • [1] 张娟, 赵润江, 雷金睿, 林川翔, 王泽宇, 黄家健.  基于InVEST模型的海口市2000—2020年生境质量时空演变分析 . 浙江农林大学学报, 2025, 42(2): 383-392. doi: 10.11833/j.issn.2095-0756.20240358
    [2] 王祥福, 李愿会, 王维枫, 孙杰杰, 王倩, 董文婷, 王荣女, 杨娅琪.  土地利用和气候变化对青海省雪豹潜在适宜生境的影响 . 浙江农林大学学报, 2024, 41(3): 526-534. doi: 10.11833/j.issn.2095-0756.20230259
    [3] 左启林, 于洋, 查同刚, 张恒硕, 梁一鹏, 欧阳佳焕.  晋西清水河流域不同土地利用类型土壤质量评价 . 浙江农林大学学报, 2023, 40(4): 801-810. doi: 10.11833/j.issn.2095-0756.20220498
    [4] 潘婷, 王懿祥, 刘宪钊, 徐成立, 刘志军.  雄安新区土地利用变化及其对生态质量的影响 . 浙江农林大学学报, 2023, 40(5): 1102-1110. doi: 10.11833/j.issn.2095-0756.20220596
    [5] 陈曦, 叶可陌, 李坤, 金阳.  资源型城市“三生空间”土地利用变化及其风险和价值研究 . 浙江农林大学学报, 2023, 40(5): 1111-1120. doi: 10.11833/j.issn.2095-0756.20220666
    [6] 杨东伟, 张建强, 黄学彬, 章明奎.  休闲农业旅游背景下浙江省水改旱土壤有机碳的时空分异 . 浙江农林大学学报, 2022, 39(6): 1296-1302. doi: 10.11833/j.issn.2095-0756.20210607
    [7] 曹嘉铄, 邓政宇, 胡远东, 吴妍.  神农架林区景观格局时空演变及其驱动力分析 . 浙江农林大学学报, 2021, 38(1): 155-164. doi: 10.11833/j.issn.2095-0756.20200279
    [8] 崔杨林, 高祥, 董斌, 位慧敏.  县域景观生态风险评价 . 浙江农林大学学报, 2021, 38(3): 541-551. doi: 10.11833/j.issn.2095-0756.20200461
    [9] 李文灏, 沈俊.  水网平原地区耕地破碎化时空变化研究 . 浙江农林大学学报, 2021, 38(4): 723-729. doi: 10.11833/j.issn.2095-0756.20200682
    [10] 孙敏, 陈健, 林鑫涛, 杨山.  城市景观格局对PM2.5污染的影响 . 浙江农林大学学报, 2018, 35(1): 135-144. doi: 10.11833/j.issn.2095-0756.2018.01.018
    [11] 段彦博, 雷雅凯, 马格, 吴宝军, 田国行.  郑州市生态系统服务价值时空变化特征 . 浙江农林大学学报, 2017, 34(3): 511-519. doi: 10.11833/j.issn.2095-0756.2017.03.017
    [12] 董心玉, 范文义, 田甜.  基于面向对象的资源3号遥感影像森林分类研究 . 浙江农林大学学报, 2016, 33(5): 816-825. doi: 10.11833/j.issn.2095-0756.2016.05.013
    [13] 于龙, 周宇峰, 丁丽霞, 邹红玉.  基于波谱角分类的土地利用动态监测 . 浙江农林大学学报, 2014, 31(3): 386-393. doi: 10.11833/j.issn.2095-0756.2014.03.009
    [14] 俞静芳, 余树全, 张超, 李土生.  应用CASA模型估算浙江省植被净初级生产力 . 浙江农林大学学报, 2012, 29(4): 473-481. doi: 10.11833/j.issn.2095-0756.2012.04.001
    [15] 张利阳, 温国胜, 王圣杰, 刘兆玲.  毛竹光响应模型适用性分析 . 浙江农林大学学报, 2011, 28(2): 188-193. doi: 10.11833/j.issn.2095-0756.2011.02.003
    [16] 吴见, 彭道黎.  多伦县土地利用遥感信息提取技术 . 浙江农林大学学报, 2010, 27(3): 417-423. doi: 10.11833/j.issn.2095-0756.2010.03.016
    [17] 顾蕾, 吴春骏, 王鑫.  基于遥感的临安市土地利用变化及驱动力分析 . 浙江农林大学学报, 2009, 26(6): 870-876.
    [18] 葛静茹, 秦安臣, 赵雄伟, 孙秋华, 李明, 张锐, 贾哲.  叠加分类及其在冀太行山区土地利用类型遥感解译中的应用 . 浙江农林大学学报, 2007, 24(6): 681-685.
    [19] 曹银贵, 周伟, 程烨, 许宁, 郝银.  土地利用变化研究现状 . 浙江农林大学学报, 2007, 24(5): 633-637.
    [20] 蒋文伟, 管宇, 刘彤, 周国模, 沈振明.  利用Markov 过程预测安吉土地利用格局的变化 . 浙江农林大学学报, 2004, 21(3): 309-312.
  • 期刊类型引用(1)

    1. 何刀山,阳小强,秦雅林,何海燕,谢维,罗治国,李鹏. ‘湘辣14号’叶绿体基因组密码子偏好性分析. 中国果菜. 2025(01): 47-54+79 . 百度学术

    其他类型引用(0)

  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20220134

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2022/6/1350

图(3) / 表(7)
计量
  • 文章访问数:  669
  • HTML全文浏览量:  266
  • PDF下载量:  164
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-01-21
  • 修回日期:  2022-06-30
  • 录用日期:  2022-07-18
  • 网络出版日期:  2022-11-21
  • 刊出日期:  2022-12-20

面向Sentinel-2A影像的大理市土地利用分类方法适用性研究

doi: 10.11833/j.issn.2095-0756.20220134
    基金项目:  国家自然科学基金资助项目(32160405);云南省高原湿地保护修复与生态服务重点实验室开放基金项目(202105AG070002)
    作者简介:

    贾玉洁(ORCID: 0000-0003-0184-0266),从事环境生态遥感研究。E-mail: 2443972318@qq.com

    通信作者: 杨思林(ORCID: 0000-0003-1671-8482),副教授,博士,从事高原湖泊水环境研究。E-mail: 84458250@qq.com
  • 中图分类号: S758;F301.2

摘要:   目的  获取更高效、准确的土地利用自动分类方法,为后续的高原山区土地利用分类研究提供理论支撑。  方法  选取中国典型的高原山区云南省大理市为研究区域,以Sentinel-2A影像为对象,提出一种面向对象特征的决策树分类方法,并将此方法分类结果与传统的ISODATA法和最大似然法土地利用分类结果进行对比。  结果  ①面向对象特征的决策树方法分类结果在空间分布和各地类的面积统计方面都优于ISODATA法和最大似然法,与研究区实际土地利用面积数据更为接近;②在大理市,最大似然法在水体和林地的提取上适用性较好,而面向对象特征的决策树分类方法在农田、草地、建设用地和其他这些地类的区分上适用性更强,且在冰川积雪的提取上也有更好的提取效果;③相比与传统的ISODATA法和最大似然法分类结果精度,面向对象特征的决策树分类方法可进一步提高分类精度,总体分类精度可达90.20%,Kappa系数为87.95%。  结论  相较于传统的分类方法,先粗分类再进一步细分类的分类思想,可避免区域之间的混淆问题。面向对象特征与决策树相结合的组合分类方法在高原山区有着更好的适用性,可以有效提高高原山区分类精度。图3表7参26

English Abstract

魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
引用本文: 贾玉洁, 刘云根, 杨思林, 等. 面向Sentinel-2A影像的大理市土地利用分类方法适用性研究[J]. 浙江农林大学学报, 2022, 39(6): 1350-1358. DOI: 10.11833/j.issn.2095-0756.20220134
WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
Citation: JIA Yujie, LIU Yungen, YANG Silin, et al. Applicability of land use classification method in Dali City based on Sentinel-2A image[J]. Journal of Zhejiang A&F University, 2022, 39(6): 1350-1358. DOI: 10.11833/j.issn.2095-0756.20220134
  • 土地利用是城市发展规划及资源开发利用的关键信息,同时也是区域土地利用变化研究的重要基础[1]。然而高原山区的遥感影像自动分类相比其他地形区而言,传统的遥感分类方法在分类精度上受各方面因素影响,难以满足研究需求[2]。传统的监督分类方法和非监督分类方法,是基于像元的数理统计法,地物分类时考虑的主要为像元的光谱信息,对遥感影像的形状、纹理及空间关系等利用不够充分[3],容易发生“同物异谱”和“同谱异物”。近年来,国内外许多学者尝试利用不同类型遥感影像来提高土地利用分类精度,在遥感影像的使用上多以Landsat和Modis系列的中低分辨率数据为主,分类精度经常受到影像空间分辨率的限制,在地物破碎的区域提取草地、水塘和小规模村庄等时存在较大的局限性[4]。近年来采用高分辨率卫星作为实验数据的分类研究逐年增多[5-7],高分辨率影像可利用清晰的地物几何特征和纹理等信息,具有覆盖范围大、重访周期短、定量化探测等优点,但影像成本较高,获取难度较大[8]。哨兵二号遥感卫星最高的空间分辨率可达10 m,与传统遥感数据相比,Sentinel-2A遥感数据新增加的4个红边波段与叶绿素含量关系紧密[9]。在地物提取分类研究领域中,近年来有众多学者运用红边波段进行湿地提取[10]、作物识别[11]、地物类型划分[12]等方面的研究,均取得了较好的效果。随着计算机和3S技术的发展,遥感研究的逐渐深入,新的分类方法不断涌现,如多重滤波[13]、面向对象分类法[14]、模糊分类法[15]、随机森林分类法[16]、神经网络法[17]等。尽管这些分类方法在不同程度上均提高了分类精度,然而在分类结果中依然存在着或多或少的“椒盐效应”[18]。本研究以云南省大理市为研究区域,以Sentinel-2A遥感影像为数据源,提出一种面向对象特征与决策树规则相结合的分类方法,依靠多维遥感信息复合技术,充分利用地物的光谱特征[19]、几何结构和纹理等提高遥感影像在大理市不同土地利用类型的区分效果,可探索提高高原山区分类精度的有效途径。

    • 云南省大理市地处云贵高原,大理州中部,25°25′~25°58′N,99°58′~100°27′E,总面积为1 815 km2,基础海拔1 000 m以上,地面起伏较大,地形以山地为主,其中山地面积为1 278.8 km2,山区、半山区面积达70.5%。总体特征是西北高,东南低,四周高,中间低。研究区地处盆地,中部是洱海,被四周的高山环抱,西部是苍山,东侧为马尾山,四周山坡均朝向洱海。

    • 本研究使用的Sentinel-2数据源通过欧空局的哥白尼数据中心下载,辅助数据包括2.5 m天地图影像数据和从地理空间数据云获取的大理市行政边界矢量数据。利用欧洲航天局(ESA)官方提供的SNAP软件和sen2cor插件对下载的原始影像进行大气校正,得到L2A级数据,采用最近邻插值法将波段重采样为10 m分辨率,基于ENVI软件对其进行几何校正。因高原山区云雾较多,为降低影像云覆盖对分类精度影响,将2020年1月1日至12月31日大理市Sentinel-2A影像最小云量进行年度多时相合成,通过大理市行政边界矢量数据对遥感影像数据进行裁剪。

    • 土地利用分类标准在参照GB/T 21010—2017《土地利用现状分类标准》[20]的基础上结合高原山区各方面特征,将研究区分为七大类,选出准确可靠的7个类型样本,进行样本间的分离度计算,计算结果如表1所示。

      表 1  各种类型地物样本组合的Jeffries-Matusita距离

      Table 1.  Jeffries Matusita distance of various types of feature sample combinations

      土地利用类型分离度土地利用类型分离度
      林地-农田 1.953 农田-其他 1.994
      林地-水体 2.000 水体-草地 1.993
      林地-草地 1.895 水体-建设用地 2.000
      林地-建设用地 1.998 水体-冰川积雪 1.998
      林地-冰川积雪 1.995 水体-其他 1.996
      林地-其他 1.994 草地-建设用地 1.996
      农田-水体 1.983 草地-冰川积雪 1.997
      农田-草地 1.894 草地-其他 1.996
      农田-建设用地 1.993 建设用地-冰川积雪 1.992
      农田-冰川积雪 1.993 建设用地-其他 1.983
      冰川积雪-其他 1.990
    • 为能充分利用基于像素和面向对象分类方法优势,组合方法已被广泛应用于土地利用分类领域[21]。QUEST决策树从运算速度和分类精度方面均衡考量,优于其他决策树方法[22]。利用面向对象特征的遥感分类方法,可结合研究对象的光谱、形状、纹理、空间关系等不同属性信息,将相同性质的像元组成为基本处理单元“对象”完成分类[23]。对研究区各地物类型的光谱特征、纹理特征和几何特征分析后,以第3绿光波段、第8近红外波段、第4红波段和第11短波红外为特征波段,再提取农田、草地、冰川积雪和其他等4个不同类别地类的面向对象特征,根据各特征建立分类规则进行建模。构建面向对象特征与QUEST决策树相结合的分类模型,如图1所示。

      图  1  分类模型流程图

      Figure 1.  Flow chart of classification model

      ①水体区域提取。基于研究区实地情况,本研究采取归一化差异水体指数(NDWI)方法[24]将研究区水体部分划分出来。根据对样本数据的初步分析以及人工判读,先将QUEST决策树分类条件设置为NDWI>0.4125。②植被区域提取。因为Sentinel-2数据的优势是在红边范围含有3个波段的数据,且研究区是典型的高原山区,全域植被覆盖率较高,所以归一化植被指数(NDVI)能从影像中更加有效地提取植被区域[25]。以此为基础将决策树分类条件设置为NDVI>0.312 5,可将植被区域与非植被区域分离开,且不与水体区域混淆。再通过设置NDVI指数范围阙值,进一步将植被中的农田、草地分类条件设置为0.312 5<NDVI<0.654 3,林地则设置为0.654 3<NDVI<1.000 0。③非植被区域提取。将研究区的水体和植被两大类提取成功后,其余部分则为非植被区域。为了进一步将建筑用地从非植被区域提取出来,在前几步的基础上又计算了归一化建筑指数(NDBI),并将QUEST决策树分类条件设置为NDBI>0,发现此时可将研究区大部分建设用地从非植被区域提取出来。

    • 面向对象可充分利用各对象的各类特征信息,本研究使用了面向对象的光谱特征、几何特征和纹理特征,其定义如表2所示。

      表 2  面向对象特征定义表

      Table 2.  Object oriented feature definition

      类别特征定义和公式
      光谱特征 光谱均值   斑块内像素光谱均值
      纹理特征 纹理特征   灰度共生矩阵(GLCM,包括5×5卷积模板内的均值、方差、同质性、熵值、对比度、二阶矩、相关性)
      几何特征 面积     斑块总面积
      延伸率    最大直径与最小直径比值
      矩形形状参数 矩形形状度量值(Rect)=面积/(最大直径×最小直径)

      本研究采用多尺度分割算法进行影像分割,共设置了一个分割层次,主要目的是将农田与草地、冰川积雪与其他进行区分。在确保影像分类精度的前提下进行多次实验,最终结果表明:分割尺度设置为30较为适宜,此时,各个分类对象均有较好的可分离性,且各个对象内部的同质性较高。再根据相邻对象的纹理特征和内部一致性确定归并尺度,对分割好的原始影像进行迭代归并,进一步完成相邻同类对象的归并。经多次实验,确定的归并尺度为65最为适宜。①草地与农田的面向对象特征。草地与农田相比,具有规则的几何形状,同时,草地与农田的光谱均值也有一定差异。所以,可将农田的对象筛选条件设置为:面积>3 000 m2,矩形形状参数>0.3,光谱均值>3 000 nm,余下不满足设定的农田筛选条件的地区为草地。②冰川积雪与其他的面向对象特征。其他用地类型延伸率较小且形状不规则,光谱均值也有较大差异,而冰川积雪大都分布于苍山高海拔地区,且连续性高,面积较大。所以为将两者区分开来,设定其他用地的筛选条件为:延伸率<3.5,1 210 nm<光谱均值(第4波段)<1 360 nm,1 225 nm<光谱均值(第3波段)<1 335 nm,1 400 nm<光谱均值(第2波段)<1 465 nm ,符合该条件的区域可判定为其他用地,余下不满足设定条件的则为冰川积雪。

    • 本研究还运用了最大似然分类法、ISODATA法与面向对象特征决策树法进行比较。ISODATA法分类与最大似然法均未引入面向对象特征,ISODATA法使用ENVI 5.3软件,选择IsoData分类器,预设22个类别和最大迭代次数为10进行分类计算,最后通过目视识别分类结果合并为本研究的7个类别。最大似然法基于ENVI 5.3软件使用ROIS方法定义7类训练样本进行分类。面向对象特征决策树分类使用IDL8.5结合ENVI 5.3编程实现。

    • 为了检验研究区影像分类解译结果的可信度,通过野外调查和2.5 m精度的天地图相结合的方式目视判读检验研究区各个样本点的真实土地利用类别,采用误差矩阵方法进行检验。在研究区内利用ArcGIS软件随机生成500个检验样本点,各地类验证点个数如表3所示。

      表 3  各地类验证点个数

      Table 3.  Number of verification points of each class

      土地利用类型天地图验证点个数野外调查验证点个数
      水体  945
      林地  6858
      建设用地546
      农田  6718
      草地  898
      冰川积雪130
      其他  164
    • 将3个分类结果与同期高分辨率天地图影像进行叠加对比(图2):ISODATA法相比前2种方法虽然显示结果较差,但具有明显特征的地物基本都能被识别出来,冰川积雪与建筑用地因光谱特征类似,从而产生了部分混淆。最大似然分类和面向对象决策树分类得到的研究区地物分布与天地图影像显示结果基本一致。但是,由于高原山区草地和部分农田分布较为破碎,且研究区地表植被覆盖度较高,所以利用最大似然方法提取的某些林地、草地和面积较小的农田会产生部分混淆。而面向对象决策树分类由于构建特征指数将不同地物差异放大,且引入了面向对象特征,更有利于决策规则的制定,所以提取的结果在空间表现上相比与其他分类方法更合理。

      图  2  基于不同分类方法得到的大理市2020年土地利用类型示意图

      Figure 2.  Land use type map of Dali City in 2020 based on different classification methods

      对3种土地利用分类方法各地类的面积进行统计,并与欧空局公布的2020年10 m分辨率土地利用数据进行验证对比。结果如图3所示:面向对象特征的决策树法提取的研究区内林地面积最大,其次是农田、草地、水体、建设用地和冰川积雪,面积最小的为其他用地:3种分类方法中此方法结果与研究区的实际情况最为符合。 ISODATA法基于机器学习,在地物分布较为破碎的区域,机器学习的效果会受样本中噪声的影响,产生过拟合现象。最大似然法是基于统计分析的原理,可减轻样本中噪声的影响,提取结果在空间分布上也更为合理。面向对象特征的决策树法以对象为处理单元,充分利用研究对象的光谱、形状、纹理、空间关系等不同属性信息,所以提取的结果与实际情况最为接近。

      图  3  各类地物面积统计

      Figure 3.  Area statistics of various features

    • 为进一步比较不同方法下各类地物的提取差异,采用2.5 m天地图的500个样点结合野外调查对3种方法的分类结果进行验证,利用误差矩阵分析得到的分类结果进行精度评价,结果如表4所示。从制图精度角度看,ISODATA法制图精度由高到低依次是其他、建设用地、水体、林地、农田、冰川积雪和草地,其中精度最高的其他为89.37%,最低的草地仅为58.00%。对于用户精度,ISODATA法的水体用户精度最高,为97.44%。余下的地类用户精度由高到低分别为林地、其他、冰川积雪、草地、建设用地和农田。从以上2个精度对比来看,林地和水体的分类精度最高,建设用地、草地、冰川积雪和其他分类精度也较高,农田分类精度较低。分析认为,由于水体的光谱特性相对单一,误分状况较少。而林地、农田和草地三者误分与互相之间光谱特性重合有较大关系。建设用地的误分区域主要分布在洱海周边和建成区周围的裸地,因裸地和房屋具有相似的高反射特性,主要误分为建设用地和草地,草地和冰川积雪误分为建设用地由光谱特性相近导致。

      表 4  ISODATA法遥感解译误差矩阵

      Table 4.  ISODATA remote sensing interpretation error matrix

      土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
      林地 93 0 3 0 4 0 0 100 93.00
      建设用地 0 67 0 7 5 5 3 87 77.01
      农田 16 2 47 0 2 1 7 75 62.67
      水体 0 0 0 76 2 0 0 78 97.44
      草地 3 0 0 3 29 2 0 37 78.38
      其他 0 4 2 0 8 71 0 85 83.53
      冰川积雪 0 2 6 0 0 0 30 38 78.95
      分类样本数 112 75 58 86 50 79 40 500
      制图精度/% 83.04 89.33 81.03 88.37 58.00 89.37 75.00

      表5可得:基于最大似然法的水体制图精度最高,为94.79%,余下6个地类制图精度由高到低分别为林地、草地、其他、农田、冰川积雪和建设用地。用户精度最高的地类是水体,为100.00%,其他地类用户精度由高到低分别是林地、建设用地、草地、农田、其他和冰川积雪。冰川积雪精度最低,仅为66.67%。通过分析认为,水体的光谱特性较为单一,极少出现误分。充分利用不同类型的光谱表现特征和周边地理环境,所以林地和农田区分度较好,但和草地仍有部分混淆。部分建设用地位于山区,受周边地理环境影响较大,加之城区建设用地光谱特征较为复杂。农田误分主要是误分为林地、草地和建设用地,由于前三者均属于绿色植被,在气温湿度均较好的情况下,选择样本时会经常造成3类间的误分。与建设用地的误分由于山区农田与建设用地交错分布,难以分辨。其他地类误分为建设用地由于两者具有相似的高反射特性,极易造成混淆。

      表 5  最大似然法遥感解译误差矩阵

      Table 5.  Maximum likelihood remote sensing interpretation error matrix

      土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
      林地 119 0 0 0 2 0 0 121 98.35
      建设用地 3 51 2 5 1 2 0 64 79.69
      农田 6 4 61 0 4 4 1 80 76.25
      水体 0 0 0 91 0 0 0 91 100.00
      草地 5 4 7 0 55 0 3 74 74.32
      其他 0 14 2 0 0 36 0 52 69.23
      冰川积雪 1 4 0 0 1 0 12 18 66.67
      分类样本数 134 77 72 96 63 42 16 500
      制图精度/% 88.81 66.23 84.72 94.79 87.30 85.71 75.00

      表6可以看出:基于面向对象特征决策树法中的水体制图精度仍是最高,为93.94%,其他地类制图精度由高到低分别是林地、农田、草地、建设用地、其他和冰川积雪。冰川积雪虽然精度最低,但仍达76.92%。面向对象特征决策树法制图精度由高到低分别是水体、其他、林地、冰川积雪、草地、农田和建设用地,其中用户精度最高的水体为95.88%,最低的建设用地精度为83.61%。分析认为,误分情况主要是由于决策树粗分类时3个指数的参数设置原因。农田和草地之间的部分误分也与面向对象特征参数设置有关,此方法分类中冰川积雪和其他2个地类无错分现象,由此看出面向对象特征参数设置较为适合。

      表 6  面向对象特征决策树法遥感解译误差矩阵

      Table 6.  Remote sensing interpretation error matrix of object-oriented feature decision tree method

      土地利用类型林地建设用地农田水体草地其他冰川积雪参考样本数用户精度/%
      林地 118 0 2 0 5 0 0 125 94.40
      建设用地 0 51 3 3 1 2 1 61 83.61
      农田 4 2 76 0 4 1 2 89 85.39
      水体 1 2 0 93 1 0 0 97 95.88
      草地 3 3 4 3 86 0 0 99 86.87
      其他 0 1 0 0 0 17 0 18 94.44
      冰川积雪 0 1 0 0 0 0 10 11 90.91
      分类样本数 126 60 85 99 97 20 13 500
      制图精度/% 93.65 85.00 89.41 93.94 88.66 85.00 76.92

      以上精度分析可以看出,面向对象特征决策树法相比于其他方法在农田、草地、建设用地和其他这4类分类精度上有了显著提高,且在高原山区特有地类冰川积雪的信息提取上也有较好的适用性。而对于研究区水域和林地的提取来说,最大似然法的适用性更好。

    • 一般总体精度在80%以上可以认为精度良好,表7表明:3种分类方法分类精度良好。其中,ISODATA法总体分类精度最低,但也满足基本分类需求,总体分类精度为82.60%,Kappa系数为79.40%;其次是最大似然法,总体分类精度较ISODATA法略有提高,总体分类精度为85.00%,Kappa系数为81.90%,但最大似然法基于机器学习的提取方法也可能会带来过拟合效应,导致提取精度偏高;面向对象特征决策树分类方法精度最高,总体分类精度可达90.20%,Kappa系数为87.95%,说明此方法的分类结果与实际情况最为贴近,更加适用于高原山区土地利用分类。

      表 7  3种分类方法比较

      Table 7.  Comparison of three classification methods

      分类方法总体分类精度/%Kappa系数/%
      ISODATA法分类 82.60 79.40
      最大似然法分类 85.00 81.90
      面向对象特征决策树法 90.20 87.95
    • 本研究结果表明:①从地物空间分布上看,面向对象与决策树相结合的方法得到的最终分类结果与同期高分辨率天地图影像较为一致,表明与地物的实际分布情况更为接近。②从地类方法适用性角度来看,最大似然分类法在水域和林地的提取上适用性较好,面向对象特征决策树法在农田和草地、建设用地和其他这些光谱特征较为相似的地类区分度较好。在高原山地特有的地类冰川积雪提取上也表现出了极大的优越性。③从不同方法总体分类精度角度看,面向对象特征的决策树法在大理市的土地利用信息提取中效果最好,总体分类精度和Kappa系数分别为90.20%和87.95%,较传统的最大似然法和ISODATA法分类精度均有提升,可实现大理市土地利用的高精度提取。

      本研究在进行大理市土地利用分类时,利用先粗分类再进一步细分类的思想,将面向对象特征与决策树规则相结合,粗分类先设计决策树分类规则,在决策树基础上进行类别的细分类,此方法可避免区域之间的混淆问题,反映了提高遥感影像分类精度的一个方法,具有良好的应用前景[26]。面向对象特征辅助决策树分类,其分类精度和准确性虽有提高,但与欧空局面积仍存在一定的出入,说明分类过程中仅提取面向对象特征辅助是不够的。因此,在今后的计算机分类过程中,需进一步加强遥感影像计算机自动解译的研究,充分利用地物形状、纹理、空间关系、空间位置等特征,对影像进行综合评判,提高影像的分类精度。

参考文献 (26)

目录

/

返回文章
返回