-
菠萝Ananas comosus原产巴西,为热带多年生草本植物,16世纪时传入中国,有70多个品种,岭南四大名果之一。菠萝含有大量的果糖,葡萄糖,维生素A,维生素B,维生素C,磷,柠檬酸和蛋白酶等营养物质。其果味甘性温,具有解暑止渴、消食止泻之功,为夏令医食兼优的时令佳果。另外,菠萝皮中富含菠萝酶,有丰富的药用价值,长期食用菠萝皮,心脑血管,糖尿病发病率显著降低,并有一定的抗癌效果。近年来分子生物学的发展以及各种分子标记技术不断出现,使得植物遗传分析研究得以迅速发展,其中以简单重复序列(simple sequence repeat,SSR)标记在植物遗传研究上应用最为广泛。随着测序技术成本的降低,GenBank中大量的植物表达序列标签(expressed sequence tag,EST)数据为SSR分子标记的开发提供了新的途径。EST-SSR除具一般SSR分子标记特点外,还有信息量大,通用性好,开发简单、快捷、成本低等[1]的特殊优势。目前,许多作物[2-5]已开发大量的EST-SSR,并应用于遗传作图、遗传多样性等[6]研究上,但在菠萝栽培种上至今尚未见从EST中开发SSR的相关报道。本研究对现有菠萝EST中SSR信息进行全面分析,以明确菠萝EST-SSR发生频率和特点,为进一步建立EST-SSR标记并探索其在菠萝研究中的遗传作图、育种材料评价、品种鉴定等的应用奠定基础。
HTML
-
在5 659条EST序列中,经过筛选共发现SSR序列636个,占整个EST数据库的11.24%,表明菠萝中的EST-SSR十分丰富。经计算去除冗余后的菠萝EST序列总长约为4.7×106 bp,菠萝SSR分布密度为平均7.39 kb EST就存在1条SSR(表 1),并且不同重复类型的平均距离有明显差异,EST-SSR出现频率越高其平均距离则越小。菠萝EST-SSR中含有二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸重复的序列分别占EST数据库中发现SSR序列总数的42.61%(271/636),29.25%(186/636),3.46%(22/636),4.56%(29/636),20.13%(128/636)(表 1),说明菠萝EST-SSR的优势重复单元为二核苷酸、三核苷酸和六核苷酸,三者共占EST-SSR总数的91.99%。其中二核苷酸重复的出现频率(42.61%)明显高于其他类型,三核苷酸(29.25%)和六核苷酸(20.13%)重复的出现频率也相对较高。重复类型为四核苷酸、五核苷酸的重复所占的比例比较小,只占总SSR的8.02%。
重复类型 SSR数量 所占总SSR比例/% 出现频率/% 分布密度/kb 二核苷酸 271 42.61 4.79 17.34 三核苷酸 186 29.2' 3.29 2'.27 四核苷酸 22 3.46 0.39 213.64 五核苷酸 29 4.56 0.51 162.07 六核苷酸 128 20.13 2.26 36.72 总计 636 100 11.24 7.39 Table 1. Number, Proportion, frequency and mean distance of EST-SSR in pineapple
-
全部菠萝的EST-SSR中共搜索出174种重复基元,其中二核苷酸重复基元有10种,三核苷酸重复基元有48种,四核苷酸重复基元有15种,五核苷酸重复基元有21种,六核苷酸重复基元有80种(表 2)。在二核苷酸重复基元中AG/TC和GA/CT出现频率最高,在总的SSR中所占比例为23.27%(148/636)和15.88%(101/636)。而三核苷酸的重复基元中AGA/TCT,AGC/TCG,CAG/GTC,CTC/GAG,CTG/GAC,CTT/GAA的出现次数在10以上,并且其中重复次数最大的AGC/TCG也仅为总SSR的4.09%(26/636)(表 3)。统计显示三核苷酸的基元种类相对来说较多,比较分散。六核苷酸的SSR在总的EST中有128条,但六核苷酸的重复基元种类有80种,其中60种重复基元出现1次,其余20种重复基元出现次数在1次以上,在六核苷酸重复基元中CCTCCG出现7次,发生频率仅占总SSR的1.10%。总体而言六核苷酸重复基元总数虽然多,但每种基元类型出现的频率却不高。而四核苷酸和五核苷酸的重复基元不仅在数量上很少,而且基元分布较平均,未出现优势基元。
重复类型 基元数 重复基元 二核苷酸 10 AC,AG,AT,CA,CT,GA,GT,TA,TC,TG
AAC,AAG,AAT,ACA,ACG,AGA,AGC,AGG,ATC,ATG,ATT,CAA,CAC,CAG,CCA,CCG,三核苷酸 48 CCT,CGA,CGC、CGT,CTA,CTC,CTG,CTT,GAA,GAC,GAG,GAT,GCA,GCG,GCT,GGA,GGC,GTA,GYC,TAA,TAC,TAT,TCA,TCC,TCG,TCT,TGC,TGG,TGT,TTA,TTC,TTG 四核苷酸 15 AAAC,AATC,AGAA,CATG,CCAT,CGGT,CTTT,GACT,GCGA,GCTC,TAGA,TATT,TCGA,TCTT,TTTA 五核苷酸 21 AAAAT,AAAGA,AAATA,AAGAA,AAGCA,AATAA,ACCAT,AGAAG,AGATT,AGCTT,ATAAA,ATGAG,ATGGT,CACAA,CCACG,CTCGG,GATTA,TCTTT,TTATT,TTTTA,TTTTC
AAAAGA,AAAGAA,AACCCT,AAGAAA,AAGAAC,AAGCCG,AAGGAG,ACCACA,ACGCAC,AGAAAA,AGAAGC,AGAGGA,AGCACT,AGCAGA,AGCCCT,AGGAAG,AGGAGA,AGGATG,ATTAGT,CAGCTC,CATCTT,CCATAC,CCCTCC,CCCTCT,CCGCCT,CCGCGT,CCTCCG,CCTCTT,CGCAGT,CGGCAG,CGGCGA,CGTCCG,CGTGAT,CGTTTC,CTCCGC,CTGCTT,CTTCAT,CTTCCG,六核苷酸 80 CTTCCT,CTTCTC,CTTTGA,CTTTTT,GAAGAG,GAAGCA,GAAGCT,GACAGG,GAGAAC,GAGAAG,GAGGAA,GATCCC,GCAGAA,GCAGGA,GCCGTC,GCCTAT,GCCTGT,GCGAAG,GCTCCT,GGGCAC,GTTGTG,TAGGGT,TATCTA,TATTTT,TCAAAT,TCAGCC,TCCTCT,TCGCAG,TAGGAT,TCGGCG,TCTCGA,TCTCGC,TCTTCG,TCTTTT,TGAAGC,TGATGT,TGCTTT,TTAGGG,TTCTGC,TTTCTT,TTTTCT,TTTTTG Table 2. Repeat motif of EST-SSRs in pineapple
重复类型 重复频率/% AAC/TTG 3.06 AAG/TTC 4.90 AAT/TTA 2.76 ACA/TGT 2.76 ACG/TGC 3.37 AGA/TCT 7.96 AGC/TCG 13.78 AGG/TCC 3.37 ATC 0.61 ATG/TAC 1.07 ATT/TAA 2.76 CAA 0.61 CAC 1.07 CAG/GTC 7.04 CCA 0.61 CCG/GGC 1.53 CCT/GGA 4.90 CGA/GCT 3.37 CGC/GCG 1.53 CGT/GCA 4.90 CTA/GAT 3.37 CTC/GAG 5.51 CTG/GAC 6.43 CTT/GAA 7.96 GTA 0.61 TCA 2.76 TGG 0.61 Table 3. Number of SSR loci in trinucleotide repeats across the entire pineapple ESTs
菠萝的EST-SSR基元长度分布情况见图 1。由于搜索标准严格,将一些兀余序列剔除(特别是一些本身序列较短或者是数据库重复登录的序列)。因此,EST-SSR的分布不是连续的。菠萝的EST-SSR基元长度分布主要集中在18~36 bp,其中18 bp在总的分布中尤为突出,共有194条,占总数的30.50%。从整体趋势来看,EST-SSR的数量是随着基元长度的增长而减少的。TEMNYKH等[8]研究发现,SSR基元长度在12 bp以下时为低多态性,长度在12~20 bp的SSR为中等多态性,长度大于或等于20 bp时为高多态性。依据以上标准,41.67%菠萝的EST-SSR为中等多态性,58.33%菠萝的EST-SSR则为高多态性。
-
根据所统计的SSR位点的EST序列信息,共设计了636对引物,从中根据二、三、四、五、六核苷酸在总SSR中所占比例选取30对引物,其中包含3条重叠的SSR所对应的引物,对菠萝的基因组DNA进行PCR扩增。其中筛选出27对引物能扩增出清晰的,大小与预期片段相近的2~7条带,占扩增引物的90%,引物筛选结果见图 2。筛选出的27对引物的详细信息见表 4。该实验说明利用菠萝EST序列开发EST-SSR标记是高效且可行的。
SSR位置 登录号 产物长度/bp 重复基元 T/℃ 上游引物 (5'→3') 下游引物 (5'→3') 基因功能 扩增带数 ACSSR1 DT338344.1 390 (GCT)7/(TGG)7 59.8 CGTTCAAGTTAGCA-GAAGCTGA CAGAAACACTTCCA-CAACCAAA 水分胁迫诱导蛋白 7 ACSSR2 DT339079.1 290 (CCTCTT)3/(CTTCCG)3 60.2 A-GATCGGGTTCTTCACTCT TCA AGACAAG-GTTCTTCTTTCGCAC 甲酰转移酶 4 ACSSR4 DT339555.1 399 (GA)16 60.1 AAGCCAAAGCAGA-CAAAAGAAG TAGAACACCCAACTG-GTTCAAA 未知蛋白 7 ACSSR6 DT337477.1 388 (CT)17 60.0 CAGCAGATTTCGCAGGT-GT CTTGGCGCT-GTTGATAATGTAG 未知蛋白 2 ACSSR7 C0732232.1 393 (AG)16 60.4 AAGAGCAAGAGAGGAG-TAGGGG GAGAAAATTACAGGT-GTTGGCG 未知蛋白 4 ACSSR8 DT335862.1 394 (TA) 9 60.0 TCAAGTTTGGTGGCTTC-CTAAT TTGTGTTGGCTTAT-GTCGTTTC 未发现的序列 5 ACSSR9 DT335902.1 397 (CT) 21 59.1 GGGATGCTCCAGTTTCT-GAT ATTTATGATGGCGAC-CTTCTTC 衰老相关蛋白 6 ACSSR10 C0731041.1 396 (AT) 12 59.9 GTACGCGGTCTTCTACT-GCC GACTCCATGTTCACAC-GACAAT 假定的脱水反应蛋白质RD22前体 6 ACSSR11 DT337447.1 398 (GA)11 60.3 TTAACTCC-CATCTTCGTTTTGG CTAGAGAGACCATA-CATCCCGC 未发现的序列 1 ACSSR12 DT338461.1 395 (TC) 10 60.0 TTTCAGAGCTTTAGAG-GATGGC GGGTATCTTTGGCTA-CATCGAC 未知蛋白 3 ACSSR13 DT338327.1 379 (AG)15 60.7 GGGGAAGAAGACGAA-GAAGAAG AAGCTATGCGAAGTA-GACAGGC 未知蛋白 3 ACSSR14 DT338672.1 394 (CT)15 60.2 GGT-GTCTCAGGTCAGGTAG-GAG CGAAGTTTGC-CTTTTGTTTGAC 拟30s核糖体蛋白S9 5 ACSSR15 DT338506.1 398 (CTA)12 60.7 GAATCC-CCAGCATAGTTTCCTT ATGGCCTTTTC-CTCTCTCTCTC 未发现的序列 3 ACSSR16 DT337566.1 396 (TCT)8 59.8 CTCTTC-CTCTTCTTCGTCTTCG CACTGAAGTTTCTC-CTCAGCAA 核糖体L11相似蛋白 6 ACSSR17 DT336908.1 393 (CAG)9 60.0 CTTGTCCATTAGCACCA-CAAAA CCTCCTCCTCCTCCTCT-GTTAT 未知蛋白 5 ACSSR18 DT338459.1 387 (GAA)6 60.5 CAGATCGAGGACCA-GATGAAAT GCACC-CAAATTCTTTTGTAAGC 未知蛋白 3 ACSSR19 DT336929.1 383 (CAG)8 60.0 AGGTTATCCACCG-CAAACTCTA GCTGTTCTTGGTCCT-GCTTATT 未发现的序列 3 ACSSR20 C0731978.1 378 (GAC)6 60.1 CGGTAACTGTAATTGT-GCAGGA AGTTTGGGCTCTTGAAA ACATC 拟新生多肽α链 3 ACSSR21 DT337637.1 383 (TCT)11 59.9 AAGGCAACGTAGAGAG-GTGAAG AAACCACACAAGGGA-GAAAAGA 细胞质膜质子泵 6 ACSSR22 DT337211.1 351 (AAAC)6 60.3 ATGAACCCTTCC-CTTCTCCTTA CTCCTTCCCACAAAAT-CAAAAC 未发现的序列 4 ACSSR23 C0731699.1 341 (GCGA)5 61.1 GGAGGGTCTCAT-CAAGGGATAC GACAAATCTCGATCTC-CACCTC PoP3肽 4 ACSSR24 DT336569.1 392 (AAAGA)5 59.8 GATCTCTTGCTC-CAACTGGTTT ATCTTCGATTGT-GAAAACTGGC 抑制蛋白[菠萝] 3 ACSSR25 C0730830.1 391 (GATTA)4 59.9 GTTCTCCATTGCTTCTC-GATCT AGGGCATACTACCAT-CAACAGG 菠萝绿色成熟果实cDNA库的菠萝cD-NA克隆 4 ACSSR26 DT336115.1 397 (CCTCTT)3 59.6 AAGATCGGGTTCAT-CACTCTTC ACCAAAACAGCATC-TATCTGCC 未知蛋白 4 ACSSR27 DV190745.1 395 (AGAAGC)3 59.9 TGCAATTCTGT-GAGTTCTTCGT GAAACACTGCTCC-CTTGTCTCT 未发现的序列 4 ACSSR29 DT337199.1 391 (CTTCCG)4 60.1 GATCGGGTTCTTCACTTT TCAG CCTG-CACTTTCTTTTGCTTCTT 未知蛋白 3 ACSSR30 DT338688.1 387 (AGCTCT)3 59.8 TACACCACCACCTTTTC-CTTTT CTTGTTCTCTCCCTCTC-CTCCT 未发现的序列 4 Table 4. Information of Pineapple EST-SSR primer screening
-
值得关注的是,EST-SSR使无功能的分子标记开始逐步向可以揭示有基因功能的分子标记发展[9],筛选出来的菠萝27对引物所对应的EST,概念性翻译后经BLASTp分析,其中有11条为未知蛋白的mRNA序列,7条为还未发现的序列,其余9条EST的功能注释中有水分胁迫诱导蛋白,甲酰转移酶,衰老相关蛋白,脱水-应答蛋白PD22前体,30S核糖体蛋白质S9,核糖体蛋白L11类似物,新生多肽相关复杂α链,质膜H+-ATP酶,pop3肽,抑制蛋白以及菠萝成熟果实cDNA,新生多肽相关复合物α链。