当前位置:首页 期刊杂志

大白菜YUCCA基因家族的鉴定与生物信息学分析

时间:2024-05-21

綦洋 王柬钧 桑园园 沈玲玲 申颖 曹雪 刘振宁

摘要:生长素(IAA)是一种重要的植物内源激素,YUCCA基因作为IAA生物合成的限速酶编码基因,在植物生长发育过程中起着重要的调控作用。为深入研究大白菜YUCCA基因家族的功能,利用生物信息学分析对大白菜中YUCCA基因家族成员进行全基因组水平鉴定,并对其基因组信息、蛋白质生理生化特征、基因结构、保守结构域、系统进化树等方面进行研究。结果表明,在大白菜基因组中共鉴定出19个YUCCA基因,可以聚类到2个大的分支,Clade Ⅰ和Clade Ⅱ;YUCCA基因在大白菜10条染色体上呈不均匀分布,并有1对基因以串联重复现象在染色体上分布;基因结构分析表明大白菜YUCCA基因一般含有0~3个数量不等的内含子;对大白菜YUCCA蛋白质氨基酸序列多重比对的分析表明大白菜YUCCA蛋白质存在高度保守的FAD结合位点(一致序列为GAGPxG)和NADPH结合位点(一致序列为GxGNSG);通过MEME软件对大白菜YUCCA蛋白质模体(motif)的预测还发现12个比较保守的motif。上述研究结果为大白菜YUCCA基因功能的研究奠定了一定的基础。

关键词:大白菜;YUCCA;基因家族;生物信息学分析

中图分类号: S634.101  文献标志码: A  文章编号:1002-1302(2019)03-0049-06

生长素(IAA)作为一种重要的植物内源激素,在植物的生长发育过程中起着关键的调控作用[1]。依赖色氨酸的IPA(吲哚丙酸)途径是生长素合成的主要途径,以色氨酸为前体合成的IPA在黄素单加氧酶(YUCCA)的催化下生成IAA,这一过程也是IAA生物合成的限速步骤[2-3]。该途径产生的生长素是维管系统发生、花发育、胚胎和种子形成等生物学过程所必需的[4-5]。

YUCCA酶是含黄素的单氧化酶,黄素单加氧酶属于FMOs(flavin-containing monooxygenase)酶类,由YUCCA基因家族编码。植物中第一个功能被鉴定的FMOs就是YUCCA基因编码的蛋白质[6]。YUCCA基因最初是从IAA含量降低的拟南芥显性突变体中克隆鉴定的[6]。拟南芥YUCCA基因家族有11个基因成员,在生长素生物合成和调控过程中起着关键作用。35S启动子驱动YUCCA1基因在拟南芥中过表达,转基因植株中生长素水平稍有提高,并伴随着下胚轴伸长、子叶偏上性和顶端优势增强等表型[6]。后续研究表明,在水稻、马铃薯和草莓等植物中过表达YUCCA基因也都可以产生类似的生长素过量产生的表型[7-9]。对yuc基因功能缺失突变体的研究则进一步证明了YUC基因家族在生长素合成和植物生长发育过程中的重要作用。研究表明,拟南芥中单个YUC基因失活并没有表现出明显的发育缺陷,而yuc1、yuc4双突变体表现为维管组织减少,不能产生正常的花序,yuc1、yuc2、yuc4、yuc6 4突變体植株的表型更为严重。当用YUC的启动子启动iaaM基因在拟南芥体内表达时则可以恢复由YUC突变引起的表型,外源施加生长素却不能恢复这种表型[4]。这些结果说明,由YUC参与的生长素合成途径对于植物的生长发育是必需的。在单子叶植物水稻中克隆到了7个YUCCA基因家族成员,过表达OsYUCCA1的水稻表现出生长素表型,而表达反义OsYUCCA1的水稻则表现出与水稻生长素不敏感突变体相似的缺陷表型[10]。同样在单子叶植物中,玉米YUCCA基因对其花序发育极其重要,其突变体spi1表现为叶腋分生组织的发育缺陷[11]。

作为生长素生物合成的限速酶编码基因,YUCCA基因得到了较为深入的研究。其中对拟南芥[4]、水稻[10]、玉米[11]和杨树[12]等为代表的模式植物中YUCCA基因家族进行了全基因组水平上的鉴定和分析。另外,对小麦[13]、烟草[14]、草莓[9]和长春花[15]等物种中的YUCCA基因也进行了基因克隆和功能研究。大白菜是我国北方乃至东南亚地区的重要蔬菜作物,南北各地均有栽培,也是我国种植面积最大的蔬菜作物。而目前未见关于大白菜YUCCA基因的研究报道。大白菜(Chiifu-401-42)全基因组测序的完成使得对大白菜中相关基因家族的鉴定和功能分析成为可能[16]。

本研究利用生物信息学方法对大白菜YUCCA基因家族成员进行了鉴定和基因组注释,并分析了其基因结构和保守域,以期为进一步对大白菜YUCCA基因功能的研究奠定一定的基础。

1 材料与方法

1.1 数据来源

首先,利用已知拟南芥YUCCA蛋白质的氨基酸序列作为种子序列,在大白菜数据库(http://brassicadb.org/brad/)中进行Blast P比对搜索筛选候选蛋白质。其次,为保证候选蛋白质没有被遗漏,利用搜索到的YUCCA蛋白质的氨基酸序列对大白菜基因组数据库进行2次Blast P比对搜索。最后,再利用Pfam数据库、SMART数据库和NCBI的保守域数据库分析候选蛋白质的保守域以验证YUCCA蛋白质鉴定的准确性。

1.2 试验方法

1.2.1 YUCCA基因的基因组信息和染色体定位 YUCCA基因的序列和基因组信息通过大白菜基因组数据库获得,并根据每一个YUCCA基因在染色体上的物理位置和染色体长度,利用Mapinspect软件将YUCCA基因定位到对应的染色体上。

1.2.2 YUCCA蛋白质的生理生化分析 YUCCA蛋白质的分子量和等电点通过ExPASy(http://www.expasy.ch/tools/pi_tool.html)进行预测。亚细胞定位通过ProtComp 9.0进行预测(http://www. linux1.softberry.com/berry.phtml)。

1.2.3 大白菜YUCCA基因的基因结构、保守域和系统进化树分析 GSDS网站(http://gsds1.cbi.pku.edu.cn/)用来绘制YUCCA基因的外显子-内含子结构图。对YUCCA蛋白质的氨基酸序列进行多重比对,使用DNAman软件完成。MEME网站(http://meme.sdsc.edu/meme/meme.html)用来预测YUCCA蛋白质氨基酸序列中的保守模体(motif),然后使用TBools软件进行绘制输出。对进化树的构建,首先利用MEGA5.0软件内置的Clustal W对大白菜和拟南芥蛋白质的氨基酸序列进行多重比对(空格罚分设置为10,空格扩展罚分设置为0.2),然后将比对好的序列用于进化树构建,进化树使用邻接法(neighbor-joining method)构建,采用泊松校正,成对删除和1 000次重复等建树参数[17]。

2 结果与分析

2.1 大白菜YUCCA基因家族的鉴定和注释

根据拟南芥YUCCA蛋白质的氨基酸序列,对大白菜数据库进行Blast P搜索比对,在大白菜基因组中共鉴定到19个YUCCA基因家族成员(表1)。19个ENT基因的开放阅读框在660 bp到1 326 bp,编码的氨基酸序列长度为219到441个氨基酸,相应的蛋白质分子量在25.0 ku到49.7 ku。其中BrYUCCA10的开放阅读框和编码的氨基酸序列长度最长,而BrYUCCA19的开放阅读框和编码的氨基酸序列长度最短。等电点(pI)在5.83到9.46之间,其中BrYUCCA19的等电点最低,BrYUCCA15的等电点最高。另外,笔者所在课题组利用ProtComp 9.0软件对YUCCA蛋白质的亚细胞定位进行了预测,结果表明所有的YUCCA蛋白质均定位于细胞质中。

对大白菜YUCCA基因染色体定位(图1)的研究表明,18个YUCCA基因均能定位到大白菜染色体基因组上,只有BrYUCCA4暂时定位在Scaffold000111上。YUCCA基因在大白菜的10条染色体上呈现明显的不均匀分布,其中第6号染色体上存在最多的5个YUCCA基因,第9和10号染色体上存在3个YUCCA基因,第1、2和8号染色体上均存在2个YUCCA基因,第5号染色体上仅存在1个YUCCA基因,而在3、4和7号染色体上则没有分布。另外,BrYUCCA18(Bra018763)和BrYUCCA19(Bra018761)在第6号染色体上仅间隔1个基因座,为明显的1对串联重复基因。

2.2 大白菜YUCCA基因结构分析

为研究大白菜YUCCA的基因结构,根据大白菜基因组信息获取了每一个YUCCA基因的基因组和CDS序列信息,并绘制了其外显子-内含子基因结构图(图2)。结果表明,BrYUCCA基因含有0~3个数量不等的内含子,外显子-内含子数量相对较少。其中只有BrYUCCA19没有内含子,BrYUCCA1、BrYUCCA2、BrYUCCA17和BrYUCCA18均只含有1个内含子,BrYUCCA3~BrYUCCA9含有2个内含子,BrYUCCA10~BrYUCCA16含有3个内含子。另外,通过对基因结构图和基因进化树的比较分析, 也发现聚类到较近的进化树分枝上的基因,亲缘关系越近,其基因结构和内含子数量也越相似。

2.3 大白菜YUCCA蛋白质的氨基酸序列多重比对和保守域分析

为进一步研究大白菜YUCCA蛋白质的保守结构域,使用DNAman软件对YUCCA蛋白质的氨基酸序列进行了多重比对(图3)。比对结果表明,大白菜YUCCA蛋白质的氨基酸序列还是比较保守的,均含有黄素单加氧酶共有的黄素嘌呤二核苷酸(FAD)结合位点(FAD-binding site)和还原型辅酶Ⅱ结合位点(NADPH-binding site)。拟南芥中共有11個YUCCA蛋白质,其FAD-binding site一致序列为GxGPxG,NADPH-binding site一致序列为GxGNSG。本研究中19个大白菜YUCCA蛋白质的FAD-binding site一致序列为GAGPxG,NADPH-binding site一致序列为GxGNSG,说明大白菜和拟南芥中这2个位点是高度保守的。另外,利用MEME软件对大白菜YUCCA蛋白质保守motif的预测分析(图4),鉴定到12个比较保守的motif(motif 1~12),其中motif 5为FAD结合位点,motif 2为NADPH结合位点,其余10个motif具体的生物学功能还有待于进一步研究(图5)。

2.4 大白菜YUCCA基因的系统发育分析和分类

为进一步分析大白菜YUCCA基因的亲缘关系和进化模式,笔者所在课题组选取大白菜、拟南芥、杨树、水稻和玉米这5个代表性陆生植物物种中YUCCA蛋白质的氨基酸序列,使用MEGA 5.0软件构建了NJ进化树并对YUCCA基因进行了聚类分析(图6)。结果表明,这5个物种中的60个YUCCA基因可以聚类到2个大的分支,Clade Ⅰ和Clade Ⅱ。分支

Clade Ⅰ中基因数量较少,但也可以细分为3个小的分支,Clade Ⅰ-1、Clade Ⅰ-2和Clade Ⅰ-3,其中BrYUCCA17位于分支Clade Ⅰ-2,BrYUCCA18和BrYUCCA19位于分支Clade Ⅰ-3。1个玉米YUCCA基因被单独聚类到了分支Clade Ⅰ-1中。值的注意的是在整个分支Clade Ⅰ中没有聚类到水稻的YUCCA基因。分支Clade Ⅱ中基因数量较多,可以分为Clade Ⅱ-A、Clade Ⅱ-B、Clade Ⅱ-C和Clade Ⅱ-D 4个分支。Clade Ⅱ-A又可以分成3个小的分支,Clade Ⅱ-A1、Clade Ⅱ-A2和Clade Ⅱ-A3,双子叶植物和单子叶植物的YUCCA基因在该分支中具有明显地差异,其中Clade Ⅱ-A1和Clade Ⅱ-A2这2个分支只包含拟南芥、大白菜和杨树双子叶植物的YUCCA基因,而水稻和玉米单子叶植物的YUCCA基因均被聚类到了Clade Ⅱ-A3中。Clade Ⅱ-B又可以分成2个小的分支,Clade Ⅱ-B1和Clade Ⅱ-B2,该分支与 Clade Ⅱ-A不同,均包含上述5个物种的YUCCA基因。分支Clade Ⅱ-C包含水稻和杨树各1个基因,而分支 Clade Ⅱ-D也是单子叶植物特有的分支,只包含水稻和玉米的YUCCA基因。

3 结论与讨论

本研究根据拟南芥YUCCA蛋白质的氨基酸序列,通过对大白菜数据库进行Blast P搜索比对,在大白菜基因组中共鉴定到19个YUCCA基因家族成员,并对其家族成员进行基因注释、基因结构、保守结构域及系统发育等方面的分析,为后续大白菜YUCCA基因功能研究提供了一定的基础信息。

大白菜和拟南芥在完成分化之前发生过3次全基因组复制事件(α、β、γ复制事件)。而后大白菜和拟南芥出现分化,大白菜基因组在大约540~900万年前又发生了全基因组3倍化事件[16,18-20]。笔者所在课题组在大白菜基因组中共鉴定出19个YUCCA基因,拟南芥、杨树、水稻和玉米的基因组中分别有11、11、7、12个YUCCA基因,说明大白菜YUCCA基因家族伴随着全基因组复制出现了扩增。BrYUCCA18和BrYUCCA19为一对串联重复基因,说明串联复制也是大白菜YUCCA基因家族基因扩增的一种方式。基因可以通过多种方式进行扩增,包括全基因组复制、串连复制、片段复制和逆转座复制等。大白菜YUCCA基因家族成员具体的基因扩增方式还有待于进一步深入研究。另外,根据大白菜YUCCA基因的系统发育分析,拟南芥YUCCA2基因在大白菜基因组中没有找到相对应的同源基因,说明该基因在拟南芥和大白菜物种分化后发生了基因丢失事件,但其具体的基因丢失机制还不清楚。本研究选取3个双子叶和2个单子叶植物的YUCCA基因家族成员构建了系统进化树,将YUCCA基因家族分成2个大的分支,Clade Ⅰ和Clade Ⅱ,但是在分支Clade Ⅰ中不存在任何一个水稻YUCCA基因家族成员,而玉米则有3个YUCCA基因家族成员被聚类到了Clade Ⅰ中。发生这种现象的原因可能是分支Clade Ⅰ中的水稻YUCCA基因在长期进化过程中发生了丢失,也可能是水稻YUCCA基因和其他几个物种亲缘关系较远导致没能聚类到一个分支,具体原因还需要进一步研究证实。

参考文献:

[1]Zhao Y D. Auxin biosynthesis and its role in plant development[J]. Annual Review of Plant Biology,2010,61(1):49-64.

[2]Mashiguchi K,Tanaka K,Sakai T,et al. The main auxin biosynthesis pathway in Arabidopsis[J]. Proceedings of the National Academy of Sciences,2011,108(45):18512-18517.

[3]Dai X H,Mashiguchi K,Chen Q G,et al. The biochemical mechanism of auxin biosynthesis by an Arabidopsis YUCCA flavin-containing monooxygenase[J]. Journal of Biological Chemistry,2013,288(3):1448-1457.

[4]Cheng Y F,Dai X H,Zhao Y D. Auxin biosynthesis by the YUCCA flavin monooxygenases controls the formation of floral organs and vascular tissues in Arabidopsis[J]. Genes & Development,2006,20(13):1790-1799.

[5]Cheng Y F,Dai X H,Zhao Y D. Auxin synthesized by the YUCCA flavin monooxygenases is essential for embryogenesis and leaf formation in Arabidopsis[J]. Plant Cell,2007,19(8):2430-1439.

[6]Zhao Y D,Christensen S K,Fankhauser C,et al. A role for flavin monooxygenase-like enzymes in auxin biosynthesis[J]. Science,2001,291(5502):306-309.

[7]游小慶,桑贤春,赵芳明,等. 水稻窄叶突变体nal7(t)的遗传分析与基因定位[J]. 分子植物育种,2010,8(2):240-244.

[8]Kim J I,Baek D,Park H C,et al. Overexpression of Arabidopsis YUCCA6 in potato results in high-auxin developmental phenotypes and enhanced resistance to water deficit[J]. Molecular Plant,2013,6(2):337-349.

[9]Liu H,Xie W F,Zhang L,et al. Auxin biosynthesis by the YUCCA6 flavin monooxygenase gene in woodland strawberry[J]. Journal of Integrative Plant Biology,2014,56(4):350-363.

[10]Yamamoto Y,Kamiya N,Morinaka Y,et al. Auxin biosynthesis by the YUCCA genes in rice[J]. Plant Physiology,2007,143(3):1362-1371.

[11]Gallavotti A,Barazesh S,Malcomber S,et al. Sparse inflorescence 1 encodes a monocot-specific YUCCA-Like gene required for vegetative and reproductive development in maize[J]. Procnatlacadsciusa,2008,105(39):15196-15201.

[12]Ye X,Kang B G,Osburn L D,et al. Identification of the flavin-dependent monooxygenase-encoding YUCCA gene family in Populus trichocarpa and their expression in vegetative tissues and in response to hormone and environmental stresses[J]. Plant Cell,Tissue and Organ Culture,2009,97(3):271-283.

[13]郭慶东,李 娜,惠文荣,等. 小麦TaYUC10基因种子特异表达载体构建及小麦遗传转化[C]. 全国小麦基因组学及分子育种大会, 2015.

[14]高玉龙,宋中邦,李文正,等. 两个烟草YUCCA6基因的克隆及分析[J]. 分子植物育种,2016,14(6):1376-1381.

[15]许 菲,张 颖,潘琪芳,等. 长春花黄素单加氧酶基因的克隆与组织表达分析[J]. 上海交通大学学报,2014,32(4):1-7.

[16]Wang X W,Wang H Z,Wang J,et al. The genome of the mesopolyploid crop species Brassica rapa[J]. Nature Genetics,2011,43(10):1035-1157.

[17]Saitou N,Nei M. The neighbor-joining method:a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution,1987,4(4):406-425.

[18]Blanc G,Wolfe K H. Widespread paleopolyploidy in model plant species inferred from age distributions of duplicate genes[J]. Plant Cell,2004,16(7):1667-1678.

[19]Blanc G,Hokamp K,Wolfe K H. A recent polyploidy superimposed on older large-scale duplications in the Arabidopsis genome[J]. Genome Research,2003,13(2):137-144.

[20]Lysak M A,Koch M A,Pecinka A,et al. Chromosome triplication found across the tribe Brassiceae[J]. Genome Research,2005,15(4):516-525.武凤霞,应梦真,李吉进,等. 不同施肥种类对玉米产量及土壤性状的影响[J]. 江苏农业科学,2019,47(3):55-60.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!