当前位置:首页 期刊杂志

亚麻NBS类抗病基因家族全基因组分析

时间:2024-07-29

谢冬微,路颖,赵德宝,杨学,粟建光,孙健,

(1.黑龙江省农业科学院经济作物研究所,哈尔滨150030;2.中国农业科学院麻类研究所,长沙410205;3.东北农业大学农学院,哈尔滨150030)

植物对于识别和响应病原菌 (病毒、真菌、细菌)具有复杂的机制。诱导防御响应被病原体无毒性 (avr)基因和植物抗病基因 (R)的特异相互作用所调节。R和avr基因在植物识别和抵御病原菌方面起着非常重要的作用[1-2]。近些年来,大量的R基因已经从一些植物中被克隆获得,R蛋白能直接或间接地作用于病原诱导物并启动抗病基因下游的级联防卫反应[3]。R基因被视为植物的广谱抗病基因,通常该类基因中会包含有一些非常保守的结构域[1,4]。

绝大多数R基因编码的蛋白具有编码核苷酸结合位点 (nucleotide-binding site,NBS)和富亮氨酸重复蛋白 (leucine-rich-repeat,LRR)结构域的特点[4],NBS结构域中包含的保守基序可以将NBS类基因分成不同的亚组[5-7]。在植物R蛋白中NBS区域负责结合ATP和GTP[8],而LRR区域在植物中表现出直接或间接的抗病作用[9]。此外,LRR区域还被证明参与结合病原感应器和调解信号转导[10]。NBS-LRR基因家族根据其N末端结构的不同被分成两个亚家族[11],一个亚家族是由TIR-NBS-LRR(TNL)组成,其编码的序列N末端具有TIR(Toll/白细胞介素-1受体类似结构),另外的一个亚家族是由CC-NBS-LRR(CBL)组成,其编码序列的N末端不具有TIR,但却有卷曲的螺旋 (Coiled-coil CC)结构域[12]。

亚麻 (Linum usitatissimum)是人类最早使用的植物天然纤维及油料作物,是重要的经济作物之一。2012年,Wang等[13]报道非冗余的重叠群组装后获得302Mb的亚麻全基因组数据大约覆盖了亚麻基因组的81%以上,多达96%的已报道的亚麻EST序列被比对到全基因组测序得到的scaffolds上,且预测得到43384个编码功能蛋白的基因。这为系统分析亚麻抗病基因提供了一个前所未有的机会[13]。许多病害 (包括白粉病[14],炭疽病[15]及枯萎病[16]等)都会引起亚麻大面积的减产,所以提高亚麻抗病性问题急需解决。

近年来,植物基因组测序飞速进展,人们已经可以在基因组水平上对植物重要基因家族进行挖掘、比较分析和功能预测。本研究通过生物信息学方法在亚麻基因组全序列测定完成的基础上,对亚麻全基因组中的NBS类基因进行分类和系统发生学分析。以期更加深入和全面的了解亚麻抗性相关的基因,进而加快亚麻中抗病基因的克隆以及抗病机制的研究,并为植物抗病育种提供理论依据。

1 材料与方法

1.1 试验材料

本研究以亚麻为研究对象,亚麻全基因组数据下载于 phytozome网站 (http://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Lusitatissimum)中的最新数据。

1.2 试验方法

1.2.1 NBS类基因的鉴定和分类

利用phytozome网站中的亚麻基因组数据库,鉴定亚麻中的NBS类基因的方法与粳稻和栽培稻日本晴相同[17,19]。通过Pfam(http://pfam.sanger.ac.uk)鉴定候选抗病基因所编码的 TIR(Toll/白细胞介素-1受体类似结构)、NBS以及LRR结构域,将不含以上三种结构域之一及测序存在问题的候选基因序列排除;其次,通过COILS Server(http://www.ch.embnet.org/software/COILS_form.html)鉴定NBS类抗病基因的CC(coiled-coil)结构域 (阀值为0.9)[18]。

1.2.2 NBS类基因的Scaffold位点定位及蛋白分析

通过phytozome网站查询所有入选的NBS类基因的Scaffold位点信息,并下载所有基因的蛋白序列,利用expasy网站 (http://web.expasy.org/compute_pi/)预测NBS类蛋白序列的分子量和等电点信息。

1.2.3 NBS类基序结构及基因结构的分析

对NBS类抗病基因的每个保守基序进行鉴定,通过将完整的NBS类基因的蛋白序列输入到MEME网站 (http://meme.nbcr.net/meme/intro.html)在线分析,参数设置:基序宽度为6X50,鉴定最大基序数量为20。利用Gene Structure Display Server(http://gsds1.cbi.pku.edu.c n/)在线分析NBS类基因的基因结构,分别将每个基因的CDS序列及基因组DNA序列输入以上网站进行分析及绘图。

1.2.4 NBS类基因的系统发育树的构建

首先将含有NBS结构和不含该结构域的序列分存于两个文件中,然后利用Clustal x软件分别对两个文件中的序列进行比对分析,将比对结果输入MEGA5.0软件构建两个系统进化树,并对其进行人工修饰。

2 结果分析

2.1 亚麻NBS-LRR类抗病基因的鉴定及分类

在亚麻基因组中最终鉴定得到137个NBS类基因,其中有83个带有NBS结构域的基因和54个结构域不完整的NBS类基因 (仅含有LRR或TIR结构域)。而含有NBS结构域的基因又可以进一步被分为七组,分别为CC-NBS-LRR(1个)、NBS-LRR(3个)、CC-NBS(11个)、NBS(12个)、TIR-NBS-LRR(14个)、TIR-NBS-LRR-X(28个)及 TIR-NBS(14个),而不含有NBS结构域的基因可分为两组,即为LRR(26个)和TIR(28个)。

目前为止,许多植物NBS-LRR抗病基因家族已经得到研究,不同植物NBS-LRR抗病基因的总数量以及各个亚组中基因数量分布都有所不同,水稻中共发现519个NBS-LRR抗病基因,其中304个为TN亚家族基因,160个为CNL亚家族基因,NL亚家族中的基因数量几乎是CNL亚家族的两倍[19],而双子叶植物拟南芥和苜蓿NL亚家族基因数量较少,CNL和TNL亚家族基因数量较多,这与亚麻的NBS-LRR基因分类比例十分相似,这说明NBS-LRR家族基因在双子叶和单子叶植物中的分类是有明显区别的。

表1 NBS类基因保守结构域分类Tab.1 Conserved domain classification of NBS genes

2.2 NBS类基因在Scaffolds上的分布及蛋白理化特性

尽管学者们已经对亚麻全基因进行了测序且将信息上传至phytozome网站,但并未公布测序亚麻品种的染色体物理图谱。所以我们无法将预测的NBS类基因定位到亚麻的染色体组上。本研究发现亚麻NBS类家族基因分布并不均匀,出现成簇分布的现象,在Scaffold106、Scaffold2057、Scaffold630、Scaffold472、Scaffold132、Scaffold416、Scaffold917及 Scaffold15中发现3个NBS类基因存在,而在Scaffold280中有4个,Scaffold77中有5个 (见表2)。因此,这些基因成簇存在的Scaffold将是进一步研究亚麻抗病基因的重点区段。

在以上的研究中,得出NBS类家族基因在scaffolds上分布是不均匀的。对蛋白分子量和等电点的分析结果表明,分子量大于100kDa占有的序列比例在50%以上,占总基因数的比例较大(见表3),由于高分子量的蛋白质不论是用于质谱鉴定,还是用于基因的遗传转化难度都比较大,这些高分子量的蛋白序列可能会给后续的研究工作带来一定的阻碍,所以在接下来的实验设计和具体操作的过程中要对这部分基因多加考虑。与NBS类家族蛋白质的分子量的结果相比较,其等电点分布规律性显得较为明显,主要分布在pH值在5~8的范围内,所占比例为70.07%(见表4)。这表明极酸或极碱的蛋白相对较少,这有利于后续的实验研究和分析。

表2 部分NBS类家族基因基本信息Tab.2 Basic information of some NBS gene families

表3 亚麻NBS-LRR家族蛋白质分子量统计数据表Tab.3 Protein molecular weight data sheet of flax NBS-LRR family

表4 亚麻NBS-LRR家族蛋白质等电点统计数据表Tab.4 Protein isoelectric point data sheet of flax NBS-LRR family

2.3 亚麻NBS类家族基因系统进化分析

利用Clustal X和Mega软件构建了两个关于亚麻中NBS类家族基因的系统进化树 (图1-A,B)。其中一个是有83个含有NBS结构域的基因构成的系统进化树图1-A,该进化树将83个基因分成了5个亚组,每个亚组中包含13~28个NBS类基因不等,其中TNLX亚组含有NBS类基因最多为28个,N亚组最少为13个。而如图1-B所示,不含NBS结构域的NBS类基因 (即结构域不完整的NBS类基因)被分成两个亚组,分别为仅含TIR结构域组和仅含LRR结构域组。综合以上两个系统进化树,本研究中的137个NBS类家族基因被分成7个亚组,分别代表着具有不同抗病结构域的组合。由此我们推测不同亚组中的抗病基因可能对病原菌的侵袭具有不同的抵抗能力,该观点有待于进一步的试验验证。

图1 亚麻NBS类基因的系统进化树Fig.1 The phylogenetic tree of flax NBS genes

2.4 NBS类家族基因的基因结构分析

亚麻NBS类家族基因的CDS和基因组DNA序列在phytozome网站下载得到,通过GSDS(http://gsds.cbi.pku.edu.cn/index.php)网站进行基因内含子和外显子位置的预测 (图2)。本研究中除了34个NBS类基因没有内含子外,其余103个基因均含有1~19个不等的内含子。NBS类家族基因的内含子分布情况与进化树分类十分吻合,我们发现分属于进化树中TNLX、TIR及LRR亚组的NBS类基因所含有的内含子平均长度较其它亚组更长,分在同一亚组中的基因结构十分相似,说明同亚组内的基因间的进化相对保守。但不同亚组之间的基因无论从内含子数量还是基因组DNA长度上都存在明显差异,这表明亚麻NBS类基因经历了不同的复制和演变进而导致基因结构存在着丰富的多样性。

2.5 亚麻NBS类家族基因的基序分析

利用MEME在线工具对亚麻NBS类蛋白序列进行了保守基序分析,结果表明,亚麻NBS类蛋白具有20类保守基序,长度变化较大,在15~50个氨基酸之间,这说明了NBS类家族基因成员之间保守性相对较高。我们进一步分析了这些保守基序在亚麻NBS类蛋白中的分布情况(图3),发现大部分NBS类基因都含有20个保守基序,也有少部分基因出现保守基序缺失的情况。缺失最明显的就是分类于TIR和LRR两个亚组的NBS类基因,由于这两个亚组成员可能在亚麻全基因组测序拼接的时候组装的并不完整,导致其缺失了部分功能区,但它们仍还有与抗病密切相关的一部分保守结构域且这类基因的数目较多,在本研究中达到54个,因此,它们也是研究亚麻抗病基因不可或缺的部分。

3 讨论

NBS类抗病基因是植物基因组中最大的家族之一,同时也是所含基因数目最多的抗病基因家族。目前,由于部分植物基因组测序的相继完成,这为学者们从基因组水平上对植物的NBS类抗病基因进行研究提供了基础。因此,亚麻作为主要的经济作物和已测序的作物之一,对其NBS类抗病基因进行研究也是必要且切实可行的。亚麻中共鉴定了137个NBS类抗病基因,并且根据这些基因所含结构域的不同,将它们进一步分成了7个亚组,亚麻的NBS类抗病基因各亚组基因的分布数目各不相同,这与拟南芥和苜蓿[20]等双子叶植物NBS类抗病基因家族基因分布情况类似 (见表1),而与水稻[21]中抗病基因的分布差异较大。由此,我们发现单双子叶植物中NBS类抗病基因种类的分布差异明显,这种不均匀分布可能与不同类型植物长期进化过程中适应生存环境的结果有关。基因结构分析表明,NBS类家族基因成员间由于具有不同的内含子数目及长度而导致基因结构产生差异,推测这些差异产生的原因可能是在这些基因演化的过程中发生了内含子的插入或缺失。而对于NBS类抗病基因的保守基序分析我们发现,在进化树中被分在同一组的基因在保守基序的种类和排布上非常相似,这也进一步印证了进化树分类的可靠性。在亚麻NBS类抗病基因家族中,被克隆并报道的基因数目并不多,绝大部分基因的功能到目前为止还不清楚。本研究通过生物信息学方法总括了亚麻全基因组中的NBS类抗病基因的分类、系统发生及基因结构等,对于发掘新的与植物抗性相关的基因,加快亚麻中抗病基因的克隆以及抗病机制的研究具有十分重要的意义,也为亚麻的抗病育种研究奠定了基础。

图2 亚麻NBS类家族基因的基因结构示意图Fig.2 Schematic diagram of the gene structure of flax NBS gene families

图3 亚麻NBS类家族基因的保守基序图Fig.3 Conserved motif graph of flax NBS gene families

[1]Dangl JL ,Jones JD.Plant pathogens and integrated defence responses to infection [J].Nature,2001,411(6839):826–833.

[2]Flor H.Current status of the gene-for-gene concept[J].Annu Rev Phytopathol,1971,9:275–296.

[3]Meyers BC,Kozik A,Griego A,et al.Genome-wide analysis of NBS-LRR-encoding genes in Arabidopsis[J].Plant Cell,2003,15(4):809–834.

[4]Hulbert SH,Webb CA,Smith SM,et al.Resistance gene complexes:evolution and utilization[J].Annu Rev Phytopathol,2001,39:285–312.

[5]Bourne HR,Sanders DA ,McCormick F.The GTPase superfamily:conserved structure and molecular mechanism [J].Nature,1991,349(6305):117–127.

[6]Saraste M,Sibbald PR ,Wittinghofer A.The P-loop:a common motif in ATP- and GTP-binding proteins[J].Trends Biochem Sci,1990,15(11):430 –434.

[7]Traut TW.The functions and consensus motifs of nine types of peptide segments that form different types of nucleotide-binding sites[J].Eur J Biochem,1994,222(1):9–19.

[8]Tameling WI,Elzinga SD,Darmin PS,et al.The tomato R gene products I-2 and MI-1 are functional ATP binding proteins with ATPase activity[J].Plant Cell,2002,14(11):2929–2939.

[9]Ellis JG,Lawrence GJ,Luck JE,et al.Identification of regions in alleles of the ax rust resistance gene L that determine differences in gene-for-gene specicity[J].Plant Cell,1999,11(3):495–506.

[10]Deyoung BJ,Innes RW.Plant NBS-LRR proteins in pathogen sensing and host defense[J].Nat Immunol,2006,7(12):1243–1249.

[11]Meyers BC,Dickerman AW ,Michelmore RW.Plant disease resistance genes encode members of an ancient and diverse protein family within the nucleotide-binding superfamily[J].Plant J,1999,20(3):317–332.

[12]van Ooijen G,van den Burg HA,Cornelissen BJ,et al.Structure and function of resistance proteins in solanaceous plants[J].Annu Rev Phytopathol,2007,45:43–72.

[13]Wang Z,Hobson N,Galindo L,et al.The genome of flax(Linum usitatissimum)assembled de novo from short shotgun sequence reads[J].The Plant Journal,2012,72(3):461-473.

[14]何建群,陈贵荟,李靖军,等.白粉病对亚麻原茎和种子产量、质量的影响[J].中国麻业科学,2006,28(6):317-321.

[15]杨学.亚麻炭疽病发生特点及防治 [J].黑龙江农业科学,2003,(2):13-14.

[16]杨学,王玉富.亚麻枯萎病发生规律及其综合防治措施 [J].中国麻业,2002,24(1):23-26.

[17]Zhou T,Wang Y,Chen JQ,et al.Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes[J].Mol Genet Genomics,2004,271(4):402–415.

[18]Guo Y L,Fitz J,Schneeberger K,et al.Genome- wide comparison of nucleotide- binding site-leucine-rich repeat-encoding genes in Arabidopsis[J].Plant Physiology,2011,157(2):757 -769.

[19]Yang S,Zhang X,Yue J,et al.Recent duplications dominate NBS encoding gene expansion in two woody species[J].Mol Genet Genomics,2008,280(3):187–198.

[20]Ameline-Torregrosa C,Wang BB,O’Bleness MS.Identification and characterization of nucleotide-binding site-leucinerich repeat genes in the model plant Medicago truncatula[J].Plant Physiol,2008,146(1):5–21.

[21]孙学辉,路铁刚,贾士荣,等.水稻中富含亮氨酸的重复序列和核苷酸结合位点(LRR-NBS)基因家族的生物信息学分析 [J].中国农业科学,2004,37(1):1-7.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!