时间:2024-05-22
梁志强 孔德真 李辉玲 裴娟 祝建波 王爱英
摘要:以小拟南芥基因组DNA为模板,运用同源克隆法获得小拟南芥HDG12基因,命名为ApHDG12。运用生物信息学方法,对ApHDG12基因的理化性质、保守序列、二级结构、亚细胞定位等进行了分析,并进行同源建模。经测序和生物信息学软件预测分析,结果显示,ApHDG12基因由10个外显子和9个内含子组成,mRNA长度为2 064 bp,编码687个氨基酸,亚细胞定位于细胞核。系统进化树显示ApHDG12与Capsella rubella遗传距离最近,CDD保守序列分析结果显示ApHDG12有18~79位的同源异型域和206~436位的START结构域,属于HD-zipⅣ类基因家族,同时构建了植物表达载体pBI121::HDG12,转化到农杆菌GV3101中,为进一步研究基因功能奠定基础。
关键词:小拟南芥;HDG12基因;克隆;生物信息学
中图分类号: Q78文献标志码: A文章编号:1002-1302(2015)02-0033-05
收稿日期:2014-03-19
基金项目:石河子大学“自然科学与技术创新”团队项目(编号:2011ZRKXTD-0605)。
作者简介:梁志强(1988—),男,甘肃武威人,硕士,主要从事植物基因工程研究。E-mail:514326242@qq.com。
通信作者:王爱英,副研究员,主要从事植物基因工程与转基因生物安全性评价研究。E-mail:way-sh@126.com。全球正面临着水资源日益短缺的境况,由干旱造成的农作物减产及经济损失逐渐加剧,因此甄别利用具有耐旱性的基因,提高作物的耐旱性,发展生物节水农业,对于缓解水资源危机,保障国家的粮食安全、生态安全和可持续发展具有重要意义。
拟南芥HD-zipⅣ类基因家族有16个成员,其中大部分在植物表皮层中表达,控制表皮细胞的分化、色素的合成、表皮毛和根毛的发育[1-2]。GL2在表皮毛部位表达,控制种皮、根毛以及茎叶表皮毛的发育[3];ATML1和PDF2共同调节表皮的发育,若PDF2过量表达则影响花的形态以及开花时间[4];ANTHOCYANINLESS2(ANL2)控制表皮层花青素的积累[5];HDG11基因过量表达则会抑制表皮毛的分叉,且HDG11和HDG12基因共突变时这种现象更为明显[1],HDG11基因的过表达能够提高植物的耐旱性[6]。前人针对HD-zip基因家族的研究结果表明,该家族内成员的功能较为复杂,在植物生长发育的过程中均发挥着重要作用,因此更深层次的研究其基因家族内成员的功能并加以合理利用具有十分重要的意义。
近年来,对拟南芥近缘种的研究已成为一个热点,而新疆是拟南芥近缘种的分布中心[7],小拟南芥(Arabidopsis pumila)是双子叶模式植物拟南芥(Arabidopsis thaliana)的近缘种,为十字花科拟南芥属的短命植物,在适应新疆特殊干旱气候方面,小拟南芥表现出更为优异的适应特性[8-9]。目前从小拟南芥中克隆得到了一些抗逆基因,与拟南芥有较高的同源性,如黄先忠等利用同源克隆法克隆的ApCBF1和AtCBF1编码的氨基酸序列一致[10];院海英等利用同源克隆法得到的ApNHX1与AtNHX1编码的氨基酸序列比对结果为99%[9];刘瑞娜等利用同源克隆法以AtHRD基因序列为模板设计同源引物克隆得到了小拟南芥ApHRD[11]。本研究以小拟南芥基因组DNA为模板,根据NCBI上HDG12基因序列设计同源引物,克隆得到了ApHDG12基因,并利用生物信息学软件及在线序列分析工具,对其进行结构与功能预测,以期为后续开展的ApHDG12基因功能和作用机理研究提供一定的参考依据。
1材料与方法
1.1材料
小拟南芥种子由本实验室保存,种植于“营养土 ∶蛭石=1 ∶2”的培养土中,置于20 ℃、16 h光照、8 h黑暗条件下培养。大肠杆菌TOP10、农杆菌GV3101,Taq DNA聚合酶购自天根公司,PMD18-T simple vector kit、琼脂糖凝胶回收试剂盒和质粒提取试剂盒购自康为世纪生物科技有限公司。
1.2方法
1.2.1小拟南芥基因组DNA的提取采用CTAB优化法[12]提取小拟南芥基因组DNA。
1.2.2小拟南芥ApHDG12克隆及测序根据NCBI上已提交的拟南芥HDG12基因(NM_101655.2)cDNA序列,运用Primer 5.0设计同源引物(F:5′-AGTTGTGTGATGGTCCAGAGTTAGC-3′,R:5′-GATTTCTTACACTCTTTGCAGGCAT-3′),以小拟南芥基因组DNA为模板进行PCR扩增,PCR反应体系参考Taq DNA Polymerase说明书。
PCR反应程序:94 ℃预变性5 min;94 ℃变性30 s,58.0 ℃ 退火30 s,72 ℃延伸3 min 10 s,30个循环,72 ℃总延伸10 min,最后4 ℃保存。PCR产物用琼脂糖凝胶回收试剂盒回收,与PMD18-T simple vector于16 ℃过夜连接,连接产物转化大肠杆菌感受态细胞,涂布于含有氨苄青霉素(50 μg/mL)、X-gal(20 mg/mL)、IPTG(200 mg/mL)的LB平板上进行蓝白斑筛选,对重组克隆进行PCR鉴定。阳性克隆交由北京华大基因公司进行测序。
1.2.3序列分析测序结果用DNAMAN 6.0进行拼接,用FGENESH(http://linux1.sof tberry.com/berry.phtml)进行分析并预测蛋白的氨基酸序列,蛋白质理化性质预测用ProtParam(http://web.expasy.org/protparam/)分析,蛋白质亲疏水性预测用ProtScale(http://web.expasy.org/protscale/)分析,蛋白亚细胞定位预测分别采用WolfPsort(http://wolfpsort.org/)[13]、BaCelLO(http://gpcr.biocomp.unibo.it/bacello)、Cello(http://cello.life.nctu.edu.tw/)3种工具分析。
通过NCBI的CDD(Conserved Domain Database)数据库(http://www.ncbi.nlm. nih.gov/Str ucture/cdd/cddsrv.cgi)对ApHDG12蛋白序列的保守结构进行分析。运用NCBI的BlastP搜索与HDG12蛋白同源的其他植物序列,DNAMAN分析其相似性,使用MEGA5.2软件Neighbor-Joining方法构建系统进化树,Bootstrap分析次数为1 000次[14]。
利用在线工具HNN (http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa _gor4.ht ml)对ApHDG12蛋白二级结构预测,螺旋卷曲(coiled-coil)预测用COILS(http://www.ch.embnet.org/software/COILS_form.html)分析。选择同源建模SWISS-MODEL CPHMODELS对ApHDG12蛋白构建三级结构模型[15]。
1.2.4植物表达载体构建测序正确的PMD18-T::HDG12用BamHⅠ/SacⅠ双酶切得到的目的基因片段,同时用BamHⅠ/SacⅠ双酶切pBI121质粒,切除GUS基因片段,回收表达载体大片段。将载体、片断按1 ∶1比例,经T4连接酶4 ℃过夜连接,产物经热激法转化大肠杆菌Top 10感受态细胞。挑取菌斑在含有卡那霉素的液体LB培养基中,于 37 ℃、220 r/min振荡培养5~6 h,进行PCR检测,对阳性克隆提取质粒,进行酶切鉴定。BamHⅠ/SacⅠ酶切鉴定后得重组的植物表达载体命名为pBI121::HDG12。
将酶切正确的质粒,电击法转化农杆菌GV3101,挑取单克隆进行PCR鉴定,保存鉴定正确的单克隆菌液。
2结果与分析
2.1小拟南芥HDG12基因的克隆和测序
经PCR扩增,电泳检测得到3 000 bp左右的条带(图1),挑选其中2个单克隆进行测序,小拟南芥HDG12基因2条测序序列重复率为99.67%,与拟南芥HDG12基因比对,重复率为94.37%。测序分析PCR产物长度为3 034 bp,与预期结果相一致,命名为ApHDG12。
使用在线工具FGENESH对克隆到的ApHDG12基因组序列进行分析,得出ApHDG12基因包含10个外显子、9个内含子(图2),并预测ApHDG12基因mRNA的长度为2 064 bp,编码687个氨基酸。
氨基酸序列比对结果(图3)显示,ApHDG12与AtHDG12氨基酸序列相似性为93.18%。共计45位氨基酸发生了变异。这些发生变异的氨基酸位点是否是小拟南芥特有,有待于进一步验证。在几个拟南芥近缘物种中的Homeodomain结构域中,ApHDG12第5位氨基酸突变为精氨酸R,在拟南芥及其近源物种中HDG12第5位为赖氨酸K,表明该结构域第5位的R是小拟南芥特有位点,预示着这一位的氨基酸在同源异型域中起着重要的作用。
2.2HDG12蛋白保守序列预测
使用NCBI 的 CDD(Conserved Domain Database)数据库对FGENESH预测的ApHDG12氨基酸序列保守结构域进行分析,结果显示,该序列具有典型的HD-zip转录因子结构特点(图4),氨基酸序列18~79位是同源异型域(Homeodomain);206~436位是START结构域(START domain)。
2.3蛋白质理化性质分析和亚细胞定位预测
使用Portparam分析小拟南芥ApHDG12基因编码的氨基酸序列的理化性质,结果显示,该序列的分子量为76 426.8 u,理论等电点为6.43,总负电荷残基数目为74,总正电荷残基数目为69,分子式为C3330H5304N950O1033S39,不稳定指数为5252,属于不稳定蛋白,脂肪指数为81.32。
3种在线工具对ApHDG12亚细胞定位进行预测。WolfPsort预测结果显示该蛋白定位于细胞核,Cello结果预测该蛋白定位于细胞核,可靠指数为2.694,BaCelLO预测结果该蛋白定位于细胞核,定位顺序为:细胞内>细胞核或细胞质>细胞核。
2.4ApHDG12蛋白疏水性分析
用在线工具PortScale对小拟南芥ApHDG12基因编码的氨基酸序列进行疏水性分析,窗口大小选择9(图5),结果表明,20位赖氨酸疏水性最弱,疏水指数为-3.944;341/342位半胱氨酸C/谷氨酸E 疏水性最强,疏水指数为1.956,多肽链整体表现为亲水性,平均疏水性为-0.330。
2.5同源性和进化树分析
在GenBank中输入ApHDG12氨基酸序列,运行BlastP,结果显示,该氨基酸序列已在蓖麻、毛果杨、Capsella rubella(与拟南芥近缘的荠菜属一个自交物种)、Eutrema salsuginuem、拟南芥、陆地棉、葡萄、玉米、可可、高粱、山羊草、碧桃等物种里报道过。运行DNAMAN对氨基酸序列进行比对,结果显示,AtHDG12基因编码的氨基酸序列与高粱(Sorghum bicolor;XP_002438026.1)的同源性是50.48%;与碧桃(Prunus persica;EMJ18783.1)的同源性是43.34%;与山羊草(Aegilops tauschii;EMT05677.1)的同源性是45.60%;与Eutrema salsugineum(ESQ35009.1)的同源性是85.71%;与无油樟(Amborella trichopoda;ERN11049.1)的同源性是56.88%;与玉米(Zea mays;AFW73676.1)的同源性是49.93%;与可可(Theobroma cacao;EOY01444.1)的同源性是44.43%;与葡萄(Vitis vinifera;CAN83483.1)的同源性是63.64%;与毛果杨(Populus trichocarpa;ERP52009.1)的同源性是62.92%;与陆地棉(Gossypium hirsutum;AAU12247.1)的同源性是65.33%;与蓖麻(Ricinus communis;XP_002527933.1)的同源性是62.15%;与拟南芥(Arabidopsis thaliana;NP_564041.2)的同源性是9318%;与Capsella rubella(EOA39819.1)的同源性是93.03%。
应用MEGA5.2软件对13个物种的HDG12氨基酸序列进行系统进化分析,结果显示,小拟南芥与Capsella rubella、 Eutrema salsuginuem、拟南芥遗传关系最近,与Capsella rubella聚为一类(图6)。
2.6ApHDG12蛋白二级结构预测
利用在线工具HNN对ApHDG12蛋白二级结构进行预测,结果显示,ApHDG12多肽链有α螺旋残基206个,占二级结构29.99%;β折叠残基133个,占19.36%;无规则卷曲残基348个,占50.66%。利用PSIPRED分析显示该蛋白拥有19个α螺旋,15个β折叠,无规则卷曲34个(图7)。运用COILS对ApHDG12编码的氨基酸序列进行卷曲螺旋(coiled-coil)预测(图8),结果显示,第一个coiled-coil模式序列位于31~45区域;第二个coiled-coil模式序列位于47~61区域;第三个coiled-coil模式序列位于69~111区域。
2.7ApHDG12蛋白三级结构同源建模
选择同源建模SWISS-MODEL CPHMODELS对ApHDG12蛋白建模,用DeepView观察其结果,发现该蛋白由两部分结构域组成(图9),第一部分由18~79位氨基酸组成的同源异型结构域(homeodomain)(图10-A),以鸡engrailed 2 homeodomain蛋白同源异型结构域为模板;第二部分由206~436位氨基酸组成的START结构域,以人类类固醇合成急性调节蛋白(human phosphatidylcho line transfer protein)START结构域为模板(图10-B)。
2.8植物表达载体的构建
为模板,克隆得到两端带有酶切位点的基因片段,克隆方法同上。将该质粒用BamHⅠ/SacⅠ双酶切回收基因片段,同时BamHⅠ/SacⅠ双酶切pBI121质粒,回收载体大片段,经T4连接酶连接的产物转化大肠杆菌TOP10感受态,PCR鉴定后,质粒用BamHⅠ/SacⅠ双酶切进行鉴定,酶切产物在3kb处,即为插入的目的基因片段(图11),表明植物过表达载体已构建成功。该植物表达载体包括完整的NPTⅡ筛选标记,CaMV 35S启动子,NOS终止子(图12)。
2.9pBI121::HDG12转化农杆菌
将酶切验证正确的pBI121::HDG12质粒,电击法转化农
杆菌GV3101细胞,涂布于含有利福平(100 mg/L)、庆大霉素(50 mg/L)和卡那霉素(50 mg/L)的固体LB培养基上,28 ℃培养36 h后,挑取单克隆,PCR鉴定,扩增片段与PMD18-T::HDG12扩增条带一致(图13),证明pBI121::HDG12植物表达载体已经转入了农杆菌GV3101中。
3结论与讨论
干旱是影响全世界农业可持续发展的一个重要问题。利
用转基因方法培育耐旱作物品种是实施农业节水的一个重要途径,具有周期短、资源丰富的优势。近年来,越来越多的同源异型域——亮氨酸拉链基因被克隆,并证实具有特殊的功能。
棉花GbML1属于HD-zipⅣ基因家族,NM端的同源异型域(HD)和不完整的亮氨酸拉链结构(LZL)专一的L1盒,控制LI层相关基因的表达。START结构域和SAD结构域共同完成与GbMYB25蛋白的结合,经采用片段缺失法,通过酵母双杂交手段验证,只有完整的START结构域和SAD结构域存在时,GbML1蛋白和GbMYB25蛋白才能相互作用[16],说明HD-zipⅣ蛋白的HD-LZL结构专一结合DNA结合位点,START-SAD结构与相关蛋白结合,行使特定功能。
AtHDG12基因在突变时,拟南芥表现出与野生型相同的表型,表明了AtHDG12为冗余基因;与AtHDG11基因双突变时表现出了比野生型和AtHDG11单突变时更为显著的表型—表皮毛分支数明显增加,多于野生型和HDG11基因单突变时的表皮毛分支数[2],有可能暗示着HDG12基因与HDG11基因在植物中表达调控时具有相互作用。AtHDG11过表达使得拟南芥和烟草都表现出气孔密度降低、主根增长和侧根数量增加的表型,提高了拟南芥和烟草的耐旱性[6]。AtHDG12和AtHDG11为一对等位基因,是否AtHDG12也具有类似于AtHDG11一样的功能尚不明确,有待于实验验证。
我们从小拟南芥中克隆得到了ApHDG12,对其进行生物信息学分析,发现ApHDG12具有HD-zip基因家族的特征,在氨基酸的理化性质方面二者存在明显的差异,在homeodomain域中的第5位氨基酸发生了变异,是否是这一位的氨基酸突变会改变蛋白功能,还需要进一步的实验证明,同源性分析其与拟南芥近缘种Capsella rubella亲缘关系最近,次之为拟南芥。卷曲螺旋预测,在homeodomain结构域中存在3个卷曲螺旋结构,与homeodomain结构域功能相符合,ApHDG12氨基酸序列不论从保守序列预测还是三级结构建模预测,只预测到了同源异型域和START结构域,不完整亮氨酸拉链结构(LZL)和SAD结构域没有预测到,也许是因为生物信息学在线分析工具存在一定局限性,不能完整预测蛋白结构。同时我们构建了pBI121::HDG12植物表达载体,转化了农杆菌GV3101,为我们后续将该基因转化模式植物拟南芥和烟草分析其功能提供了依据。
参考文献:
[1]Ariel F D,Manavella P A,Dezar C A,et al. The true story of the HD-Zip family[J]. Trends in Plant Science,2007,12(9):419-426.
[2]Nakamura M,Katsumata H,Abe M,et al. Characterization of the class IV homeodomain-Leucine Zipper gene family in Arabidopsis[J]. Plant Physiology,2006,141(4):1363-1375.
[3]Ishida T,Kurata T,Okada K,et al. A genetic regulatory network in the development of trichomes and root hairs[J]. Annual Review of Plant Biology,2008,59:365-386.
[4]Abe M,Katsumata H,Komeda Y,et al. Regulation of shoot epidermal cell differentiation by a pair of homeodomain proteins in Arabidopsis[J]. Development,2003,130(4):635-643.
[5]Kubo H,Peeters A J,Aarts M G,et al. ANTHOCYANINLESS2,a homeobox gene affecting anthocyanin distribution and root development in Arabidopsis[J]. The Plant Cell,1999,11(7):1217-1226.
[6]Yu H,Chen X,Hong Y Y,et al. Activated expression of an Arabidopsis HD-START protein confers drought tolerance with improved root system and reduced stomatal density[J]. The Plant Cell,2008,20(4):1134-1151.
[7]刘彤,赵新俊,崔运河,等. 天山北麓中段拟南芥(Arabidopsis thaliana)与相邻物种的分布格局及相互关系[J]. 生态学报,2008,28(4):1842-1849.
[8]张海波,刘彭,刘立鸿,等. 新疆短命植物小拟南芥耐盐性的初步研究[J]. 西北植物学报,2007,27(2):286-290.
[9]院海英,顾超,徐芳,等. 小拟南芥Na+/H+逆向转运蛋白基因的克隆及生物信息学分析[J]. 石河子大学学报:自然科学版,2011,29(4):401-407.
[10]黄先忠,张鹏,吕新华,等. 新疆小拟南芥ApCBF1基因的克隆及其过量表达转基因的研究[J]. 石河子大学学报:自然科学版,2009,27(3):265-268.
[11]刘瑞娜,焦天奇,王爱英,等. 十字花科植物HRD基因的克隆及分析[J]. 新疆农业科学,2011,48(3):437-444.
[12]黄萱,高丽美,张永彦,等. 一种优化的植物总DNA提取方法[J]. 西北植物学报,2004,24(6):1103-1106.
[13]冯媛媛,侯佩,李颖楠,等. 番茄 ARF2 蛋白的生物信息学分析与亚细胞定位[J]. 生物化学与生物物理学进展,2012,39(1):51-58.
[14]Kumar S,Nei M,Dudley J,et al. MEGA:a biologist-centric software for evolutionary analysis of DNA and protein sequences[J]. Briefings in Bioinformatics,2008,9(4):299-306.
[15]Peitsch M C. ProMod and Swiss-Model:internet-based tools for automated comparative protein modelling[J]. Biochemical Society Transactions,1996,24(1):274-279.
[16]张飞. 棉纤维发育早期的转录调控机制研究[D]. 上海:上海交通大学,2010.卫晓静,王华忠,岳洁瑜. 白粉菌诱导小麦叶片全长cDNA文库的构建及质量评价[J]. 江苏农业科学,2015,43(2):38-40.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!