当前位置:首页 期刊杂志

基于SNP标记的不同居群文山三七遗传结构分析

时间:2024-07-28

王 灿,黄玉玲,杨清松,彭翠仙,李 玲,赵大伟,陶永宏

(云南省文山州农业科学院,云南 文山 663000)

文山三七[Panax notoginseng(Burk.) F. H.Chen](下简称三七)是五加科人参属药用植物,具有悠久的栽培历史,是珍贵的中药材,同时也是保健品、特色食材等,具有消肿定痛、止血、滋补强壮、抗疲劳、耐缺氧、抗衰老、降血脂、降血糖、提高机体免疫力等功效[1-2]。据有关文献记载,三七使用历史近600 年,栽培历史近500 年。三七主要分布在我国西南部海拔1 500 ~ 1 800 m,北纬23.5°的特殊地理气候环境中[2],其中云南文山是三七的原产地和主产地,全国的三七大多来源于此。随着市场对三七需求量的增加,三七病害、连作障碍的发生,三七耕作制度的影响,导致三七种植业存在不断更换种植地点,农户间相互售卖各地种苗,三七种质混杂,极大增加了三七居群间的基因交流等问题的出现,影响了三七产业的正常发展[2-3]。

基因分型技术(Genotyping by sequencing,GBS)是一种基于二代测序的简化基因组测序技术,可检测物种SNP 的变异位点,对了解种质资源的遗传背景、系统进化、群体遗传多样性及遗传结构具有重要意义[4-5]。目前已应用GBS 方法对石斛[6]、黄芪[7]等物种进行了群体SNP 的检测并用于群体关联分析、遗传图谱的构建和遗传多样性研究。郭灿等[8]根据地理来源和种质类型将59 份不同茶树品种(系)材料分为11个种群,发现不同种群间具有较低的基因交流,但种群内部具有较高的基因交流,由此提出在育种实践中应尽量避免相同地理来源材料间的杂交应用。

虽然育种工作者很早就开始三七种质资源的收集和利用,但由于三七选育周期长良种少,种质资源混杂、自身多样性丰富等原因导致三七种质资源的评价、收集、利用相关基础还很薄弱[1]。为此本研究以28份不同居群三七及其近缘种为材料,采用GBS技术,初步进行不同居群间遗传结构分析,为后续更加全面解析三七及其近缘种种质资源多样性评价、育种亲本选择、优良种质性状遗传标记提供理论依据。

1 材料与方法

1.1 实验材料

收集文山州地区栽培3年以上的人参属植物叶片样本共28 份(表1),其中包括25 份文山三七样本,由文山州农业科学院药物生物研究所陶永宏研究员鉴定为文山三七[Panax notoginseng(Burk.)F.H.Chen]。此外还收集3 份近缘种材料:屏边三七、姜状三七、狭叶竹节参各一份由文山州农业科学院药物生物研究所黄玉玲高级农艺师鉴定为屏边三七(Panax stipuleanatus)、姜状三七(Panax zingiberensis)和狭叶竹节参(Panax japonicasvar.angustifo-lius)。

表1 供试三七及其近缘种植物材料Tab.1 Panax notoginseng and its closely related species materials provided in the experiment

1.2 方法

DNA 提取采用CTAB 法[9],分别取28 份三七及其近缘种幼嫩叶片材料约0.05 g 用组织研磨仪进行研磨。DNA 产物经0.8%琼脂糖凝胶电泳检测,确认目的条带清晰明亮且完整后,利用 TIANGEN Purification Kit 柱式胶回收试剂盒进行纯化,纯化后的产物经过浓度及纯度检测达到测序要求后,送往广州基迪奥生物科技有限公进行测序。

1.3 数据统计

使用比对软件bwa(0.7.12)采用mem 算法将过滤后的reads 比对到五加科人参属三七[Panax notoginseng( Burk.) F. H. Chen]参考基因组(NCBI:PRJNA632433)上[10],比对完之后结果使用picard(1.129)软件进行标记。使用软件 GATK (3.4-46)的UnifiedGenotyper 模块将处理好的比对文件进行多个样本的Variant 检测,检测到的变异使用Variant-Filtration 进行过滤。使用ANNOVAR 对检测出的Variant进行功能注释。通过得到的SNP信息计算样品间遗传距离,对样品进行聚类分析,并使用 treebest 软件邻接法构建进化树。同时采用Plink 和Admixture软件进行群体结构和杂合率分析。

2 结果

2.1 测序质量分析

将28 份三七及其近缘种幼嫩叶片材料DNA 提取后进行凝胶电泳检测,电泳图如下(图1),条带清晰可用于后续建库测序。对28 份材料的测序数据进行统计共获得115.64 Gb 数据,平均每个样品为4.13 Gb。过滤后各样本测序片段数和碱基数存在差异,其中最多的是PN-PB-2(测序片段数为42 350 070,碱基数为5 926 130 970 bp),最少的是PN-PL-4(测序片段数为15 681 198,碱基数为2 208 630 526 bp)。测序质量里平均Q20 ≧ 98.63%、平均Q30 ≧ 95.05%、平均GC ≧ 38.47%,测序质量较好,满足分析要求。(表2)

图1 琼脂糖凝胶电泳图Fig.1 Agarose gel electropherogram

表2 三七及其近缘种植物测序数据统计Tab.2 Statistics of plant sequencing data of panax notoginseng and closely related species

在三七及三七近缘种植物与参考基因组比对统计表中,单端比对上的reads 最高的是PZ(11 769 895),双端比对上的reads 最高的是PNPB-2 (38 394 164)。未比对上的reads 最高的是PS达 8 229 975,最低的是PN-PA-3 仅106 684。比对率最高的是PN-PA-3 (99.45%),最低的是PS(70.03%)。在杂合率比较中,三七杂合率5.6% ~12.9%,平均值为10.02%,均高于屏边三七1.3%、姜状三七6.2%、狭叶竹节参5.1%(表3)。

表3 三七及其近缘种植物与参考基因组比对统计表Tab.3 Statistical table for comparison of panax notoginseng and closely related species with reference genome

2.2 SNP突变类型及数量

对SNP 分型结果进行突变统计,获得高质量SNP 位点1 968 786,InDel 标记90 954,All Variant 数2 059 740。Transition占比为68.49%(1 348 336个),其中C->T 转换类型最多(420 919 个),占全部碱基突变类型的21.38%,G->A 转换类型(418 681 个)占21.27%,T->C 转换类型(254 618 个)占12.93 %,A->G 转换类型(254 118 个)占12.91%。Transversion占比为31.51%(620 450个)。其中C->A颠换类型最多(110 447 个)占5.61%,C->G 颠换类型最少(36 203个)占1.84%。转换与颠换比为2.17(图2)。

图2 SNP位点碱基突变类型及其数量Fig.2 Types and quantities of base mutations at SNP sites

对Variant 注释发现功能分类中(表4),非同义突变最大为60 052 个,约占54.979%,其次是同义突变44 160 个,约占40.429%,终止子获得为2 548 个,约占2.333%。此外标记最多的位于基因间区,约占总量的77.83%,12.31%位于基因中内含子区域,5.30%位于基因中外显子区域。1.66%和1.62%分别位于基因下游和上游,位于基因下游区域同时又位于上游区域的占0.18%。UTR3 和UTR5 分别占0.63%、0.45%,位于UTR3 同时又位于UTR5 区域的占0.001%。位于剪切位点的占0.03%(表5)。

表4 SNP功能分类Tab.4 Functional classification of the SNP

表5 SNP标记的功能性分布Tab.5 Functional distribution of the SNP markers

2.3 遗传结构分析

根据得到的SNP 信息,用treebest 软件构建NJ(Neighbor-joining methods)进化树(图3a),可划分3个大的类群。即屏边三七单独聚为一类,姜状三七和狭叶竹节参聚为一类,文山三七单独聚为一类。此外在文山三七中,不同地点采集的样本分布较为混杂,相同地理来源的种质并未完全归并到一处。

图3 群体遗传结构分析Fig.3 Population genetic structure analysis

通过Plink 和Admixture 进行群体遗传结构分析。提取K= 1 ~ 9 时的交叉验证错误率(Cross-valdaion error,CV error),K从2开始CV error逐渐增大,因此K= 2 可作为最佳值(图3b)。Structure 图可以看出K= 2 时,PS(屏边三七)、PZ(姜状三七)、PJA(狭叶竹节参)聚为一支;文山三七(PN)聚为一支与进化树结果一致,其中PN-ML-5、PN-PA-2、PNPL-3、PN-PL-4包含了2种遗传背景(图3c)。

3 讨论

种质资源是培育优良品种的基础,不同居群遗传结构分析对培育新品种和种质资源收集、评价与利用具有重要的意义。本文对25 份文山三七样本和3 份近缘种进行GBS 测序,共获得115.64 Gb 数据,1 968 786 个SNP 位点,其中5.30%(109 188)位于外显子区域。外显子作为真核生物基因的一部分,包含着合成蛋白质所需要的核心信息并可在蛋白质生物合成过程中被表达[11]。因此外显子上的SNP 可应用于功能基因标记的开发,表明本研究中外显子上的109 188 个SNP 具有开发成功能标记的潜力。此外SNP 功能分布中,终止子获得是指碱基突变导致终止密码子提前出现,产生截短的蛋白质从而使基因丧失原本的功能,并进一步引发植物表型变异[11]。大豆中GmSG基因发生 A->G 转换导致翻译提前终止,使大豆种皮颜色由黄色转变为黄绿色[12]。水稻中OsCUL3a 蛋白翻译提前终止导致水稻flg 22、几丁质诱导的活性氧和相关发病基因表达量显著增加,进而产生类病斑[13]。因此终止子获得对基因功能研究具有重要意义,本试验中终止子获得有2 548 个,约占2.333%,仅次于非同义突变,(54.979%)和同义突变(40.429%)排名第3,此结果将为后续三七生长特性、生物抗性及皂苷合成等基因功能研究提供新的见解。

本研究中根据NJ进化树显示,三七不同居群间遗传分化水平较低、距离较近;另外三七近缘种与三七遗传距离较远,尤其是屏边三七与三七遗传距离最远,这与张金渝等[4]通过SSR标记分析比较8个文山三七及近缘种居群遗传结构结果一致。遗传结构分析中当K= 2时除个别材料外,三七居群间均仅包含1 种遗传背景,暗示不同地区间遗传差异不明显,种源间交流频繁、基因遗传一致度较高,难以形成遗传分化较大的品种和居群。试验通过杂合率分析可知,三七杂合率较高,其范围在5.6% ~12.9%,平均值为10.02%,而在近缘种中屏边三七是1.3%、姜状三七6.2%、狭叶竹节参5.1%,其杂合度明显低于三七,说明三七遗传多样性和遗传变异丰富。Fan 等[14]揭示了三七群体间存在频繁基因流动,其原因可能是由于三七植株生长过程中为了适应复杂的地理气候环境,形成了丰富多样的生态类型,同时受三七连作障碍的影响频繁更换种植区域,造成居群间基因频繁交流,故增加了居群内基因的杂合度,增加了基因交换、重组的几率,从而使三七居群间的遗传背景高度一致,群体遗传差异较小。这意味着文山不同地区间群体混杂,整体遗传背景差异较小,杂合度较高难以以此为基础进行杂交育种。杂交育种是将两个或多个性状优良的品种通过杂交选育的方法,快速将多个优良性状集合到单一的品种上从而提高品种利用性。但应注意亲本间的遗传差异,选用生态类型差异较大、亲缘关系较远、基因纯合的亲本材料相互杂交[15]。因此今后的育种工作中,通过分子标记准确筛选鉴定优异单株并开展定向培育(如抗病、高产等)是开展三七育种的有效途径[16]。同时应着重对三七居群个体间具有优良性状的变异个体(抗病、优质)进行种质资源的收集、筛选、评价和保存。利用三七的高多态性加速三七重要功能基因的标记、利用,针对特定性状进行小孢子单倍体育种快速培育是未来三七新品培育的重要研究内容之一。

4 结 论

综上,本文运用SNP 标记对不同居群文山三七及其近缘种遗传结构进行研究,发现文山三七及其近缘种遗传距离较远,尤其是屏边三七与文山三七遗传距离最远。不同地区三七居群间遗传背景差异不显著,遗传分化程度较低,但个体间多样性、杂合度较高。此外试验获得1 968 786 个SNP 位点,其中5.30%(109 188)位于外显子区域,另外终止子获得有2 548 个约占2.333%。这些结果进一步丰富了三七分子标记开发数量,为后续重要基因功能的标记和研究如生物抗性及皂苷合成等提供了巨大研究潜力,同时也为三七的种质资源评价、资源保护、遗传图谱构建、生物育种等研究提供科学参考。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!