时间:2024-05-25
陈 龙,单艳敏,廖桂堂,崔阔澍,伍亚琼,杨淞杰
(1.河套学院农学系,内蒙古 巴彦淖尔 015000;2.内蒙古自治区林业和草原有害生物防治检疫总站,呼和浩特 010051;3.成都信息工程大学,成都 610225;4.四川省农业技术推广总站,成都 610041;5.四川省农业农村厅植物保护站,成都 610041)
【研究意义】春尺蠖(ApocheimacinerariusErschoff)隶属于鳞翅目,尺蛾科,属于暴发性食叶害虫,在我国北方区域分布较广,并逐步向四川、云南等南部区域迁移,其主要危害胡杨、柠条、苹果等林木,还危害小麦、玉米等农作物,近年该虫呈蔓延分布趋势,已对发生区域造成了严重的损失[1-2]。嗅觉感受系统是昆虫与外界交流的重要方式,对外界环境中成千上万气味分子的感知和判断发挥了重要作用,体内多种嗅觉蛋白参与了该识别过程,主要包括气味结合蛋白(odorant binding proteins,OBPs)、化学感受蛋白(chemosensory proteins,CSPs)、气味受体(odorant receptors,ORs)、离子型受体(ionotropic receptors,IRs)、感受神经元膜蛋白(sensory neuron membrane proteins,SNMPS)以及气味降解酶(odorant degration enzymes,ODEs)等,昆虫迁飞、聚集、取食量等多种生理行为活动都与其存在重要关联[3]。【前人研究进展】近年,对昆虫化学生态学的研究在嗅觉感受机理的理论研究和应用方面取得了较大突破,运用反向化学生态学研究嗅觉相关蛋白的生物学功能,可筛选出高效、无公害、绿色的防治害虫的防治靶标位点[4-7]。高通量测序技术的快速发展,极大促进了昆虫基因组、转录组,特别是无参考基因组信息的昆虫基因组学研究。尤其是转录组测序技术具备在特定时间段、较全面地记录某一物种转录活动,并快速获得其全转录组信息的特点,其操作简单高效便捷,是非模式昆虫基因挖掘、功能鉴定以及遗传多样性分析的一种有效手段[8-10]。目前,通过转录组基因测序技术,在昆虫化学感受系统、滞育、抗性等领域均取得快速进展,并在昆虫基因差异表达、功能基因发现挖掘等方面均有较好应用,特别是检测到较多与昆虫嗅觉相关的基因[11-12]。【本研究切入点】基于转录组测序技术,鉴定并筛选春尺蠖嗅觉相关基因,对其进行基因注释和系统进化分析。【拟解决的关键问题】明确参与调控春尺蠖嗅觉系统对气味化合物的识别蛋白,探明嗅觉识别机理,为进一步阐明春尺蠖有关生理行为,进行药剂研发和绿色防控提供分子生物学基础。
试验昆虫来源于内蒙古乌拉特前旗人工柠条草场(108°45′23.63″E、40°46′4.19″N),2019年冬季将春尺蠖越冬蛹置于恒温[(22±1)℃]、光周期L:D=18 h:6 h、相对湿度55%~59% 条件下的人工气候箱中培养,待春尺蠖羽化后,分别选取羽化第3天大小相同、活力充沛的雌、雄蛾成虫各5头,用液氮速冻后置于-80 ℃冰箱中备用。
采用Trizol Reagent(Invitrogen,Carlsbad,CA,USA)方法分别提取上述春尺蠖雌、雄成虫样品的总RNA,1%琼脂糖凝胶电泳检测总RNA质量。RNA检测分别采用NanoPhotometer spectrophotometer(IMPLEN,CA,USA)和Agilent 2100 bioanalyzer(Agilent Technologies,CA,USA)精确检测RNA样品的纯度和完整性,来保证转录组测序对样品的要求。
利用真核生物mRNA中多含有polyA尾的特征,取检测合格的RNA样品1.5 μg,加入Oligo(dT)的磁珠富集mRNA,而后加入试剂破碎缓冲剂(fragmentation buffer),已富集的mRNA被打断成多个短小的片段,随后以其为模板,加入六碱基随机引物(random hexamers)和缓冲液、dNTPs、RNase H和DNA polymerase I等原料先后合成cDNA第1和2链;合成的cDNA双链经AMPure XP 磁珠纯化,而后修复其末端并加A尾及测序接头,再次利用AMPure XP 磁珠选择cDNA片段。经PCR富集构建的cDNA文库合格后,采用Illumina Hiseq 2500平台进行测序。
高通量测序获得的原始数据中包含少量带有测序接头或测序质量较低的读数(reads),为了保证数据分析的质量及可靠性,需要对原始数据中带接头(adapter)、含N(N表示无法确定碱基信息)和低质量reads(Qphred≤20的碱基数占整个read长度的50%以上的reads)经过原始数据过滤、测序错误率检查、GC含量分布检查,获得后续分析使用的高质量读数(clean reads)。利用转录组de novo组装软件Trinity对clean reads进行组装,clean reads被组装得到的集合为该物种的Unigenes,为了获取全面的基因功能信息,使用BLAST软件将序列信息与Nr,Nt,Pfam,KOG,Swiss-prot,KEGG和GO七大公共数据库进行比对(设定e值<10-5)从而获取该Unigenes序列的蛋白功能注释信息。
结合转录组数据中的基因功能注释和blastp结果,鉴定出嗅觉相关蛋白基因,同时利用DNAMAN 6.0 软件对蛋白序列进行多重序列比对。
利用MEGA 6.0软件中的邻接法(Neighbor-Joining)构建系统进化树,p距离,重复运行1000次。
经Illumina HiSeq 2500高通量测序平台上机测序后,共产生48 893 742 条原始读数(raw reads)(雌虫23 367 873条,雄虫25 525 869条,表1),经处理后,共获得46 510 487条chean reads,数据共计13.95 GB(GenBank登录号:PRJN648143),春尺蠖雌、雄成虫两样品的Q30(碱基正确识别率为99.9%)百分比均≥ 93.68%,GC含量均≥43.51%。
为了使转录本更加准确、可靠,将测序所得序列经Trinity软件对其拼接、组装,共得到Unigenes 37 542 条,平均长度为1328 bp,N50长度为2241 bp;拼接出的Unigenes大多数长度分布在300~1000 bp,其中,长度在 301~1000 bp的Unigenes为22 980条,占比61.21%,长度大于1000 bp的 Unigenes为14 562 条,占比 38.79%(表2)。从上述转录组测序和组装结果来看,测序质量较高、序列组装的完整性较好。
将组装好的Unigenes 分别与Nr、Nt、Pfam、KOG、Swiss-prot、KEGG和GO七大据库比对分析(表3),注释到Nr数据库13 757条,占比36.64%,数量最多;注释到KEGG数据库5444条,占比14.5%,数量最少;至少成功注释到一个数据库的Unigenes数量为17 296条。
表1 春尺蠖转录组测序数据统计
表2 春尺蠖转录组组装质量统计
表3 春尺蠖转录组基因注释统计
在Nr数据库的注释结果中对Unigenes的物种分布统计(图1)显示,春尺蠖转录组Unigenes注释到的物种涉及233种,其中与斜纹夜蛾Spodopteralitura(2237个,占16.3%),棉铃虫Helicoverpaarmigera(2107个,占15.3%)注释到的基因信息较多,均在2000个以上。在34个物种中注释到的基因信息均在10个以上,其余物种注释到的信息均在个位数。
图1 Nr数据库中注释的春尺蠖Unigenes的物种分布Fig.1 Species distribution of Apocheima cinerariusunigenes in the Nr database
春尺蠖转录组中共有11 174个Unigenes 分别被注释到GO数据库中的细胞组分(Cellular component)、分子功能(Molecular function)和生物过程(Biological process)3大类的55个功能组(图2)。在细胞组分中,细胞部分(Cell part)和细胞(Cell)所注释到的Unigenes数量最多,均为3557个;在分子功能中,在结合(Binding)组中注释到的Unigenes数量最多,为6199个,其次为催化活性(Calytic activities),为4483个;在生物过程中,细胞过程(Cellular process)组中注释到的Unigenes数量最多,共有6418个,其次为代谢过程(Metabolic processes),为5569个。
图2 春尺蠖转录组Unigenes GO功能注释Fig.2 Annotated Unigenes in the transcriptome of Apocheima cinerarius in GO database
根据基因参与的KEGG代谢通路分为5个分支:A.细胞过程(运输和分解代谢,细胞群,细胞运动,细胞生长和死亡); B.环境信息处理(膜运输,信号转导,信号分子和相互作用); C.遗传信息处理(折叠、分类和降解,复制和修复,转录,翻译); D.代谢(氨基酸代谢,其它次生代谢产物的生物合成,碳水化合物代谢,能量代谢,糖生物合成与代谢,脂肪代谢,辅助因子和维生素的代谢,其它氨基酸的代谢,萜类和多酮的代谢,核苷酸代谢,槪貌,生物降解和代谢); E.有机系统(循环系统;发育,消化系统,内分泌系统,环境适应,排泄系统,免疫系统,神经系统,细分为感官系统) According to the KEGG metabolic pathway involved by genes,it can be divided into five branches: A.Cellular Processes(Transport and catabolism; Cellular commiunity; Cell motility; Cell growth and death);B.Environmental Information Processing(Membrane transport; Signal transduction;Signaling molecules and interaction);C.Genetic Information Processing(Folding,sorting and degradation;Replication and repair;Transcription;Translation); D.Metabolism(Amino acid metabolism; Biosynthesis of other secondary metabolites; Carbohydrate metabolism; Energy metabolism;Glycan biosynthesis and metabolism; Lipid metabolism;Metabolism of cofactors and vitamins;Metabolism of other amino acids; Metabolism of terpenoids and polyketides; Nucleotide metabolism; Overvivew;Xenobiotics biodegradation and metabolism);E.Organismal Systems(Circulatory system; Development;Digestive system; Endocrine system;Environmental adaptation;Excretory system; Immune system; Nervous system; Sensory system)图3 春尺蠖转录组KEGG 代谢通路Fig.3 KEGG pathways in the transcriptome of Apocheima cinerarius
为了与生物学现象相关联,对其进行科学的解释,将Unigenes与KEGG数据库比对分析,共发现有5444个基因注释到230个代谢通路,其归属于细胞过程(A,Cellular Processes),环境信息处理(B,Environmental Information Processing),遗传信息处理(C,Genetic Information Processing),代谢(D,Metabolism),有机系统(E,Organismal Systems) 5个分支(图3),其中,注释到代谢分支上的基因数最多,为1674个,其次为有机系统,为1494个,其余分支注释上的基因均小于1000个,而细胞过程分支上注释到的基因数最少,只有780个。
从转录组数据中共发现注释信息为嗅觉相关基因70个,包括22个OBPs、23个CSPs、14个ORs(包括13个普通受体和1个共受体ORco),8个IRs和3个SNMPs(表4)。
对鉴定得到22个气味结合蛋白(OBPs)基因,命名为AcinOBP1~AcinOBP22。从序列比对分析(图4)得知,除AcinOBP3、AcinOBP7、AcinOBP19和AcinOBP21~AcinOBP22外,其余17个OBP均具有完整的开放阅读框(ORF),其中AcinOBP1、AcinOBP2、AcinOBP4~AcinOBP6、AcinOBP9~AcinOBP11、AcinOBP12~AcinOBP13、AcinOBP16~AcinOBP17、AcinOBP20具有6个保守的半胱氨酸,属于Classic OBP;AcinOBP8、AcinOBP14和AcinOBP18均缺少第2和第5个半胱氨酸,具有4个保守的半胱氨酸,属于Minus-C。鉴定得到的22个OBPs氨基酸一致性为18.35%。鉴定得到23个化学感受蛋白基因(CSPs)基因(图5),命名为AcinCSP1~AcinOBP23,所有的CSPs均具完整的ORF,同时包含4个保守的半胱氨酸,序列一致性为18.15%。
表4 春尺蠖转录组中与嗅觉相关基因统计
阴影部分C表示保守的半胱氨酸残基Shaded part C indicates cysteine residues图4 春尺蠖OBPs基因氨基酸序列比对Fig.4 Alignment of amino acid sequences of OBPs of Apocheima cinerarius
阴影部分 C 表示半胱氨酸残基Shaded part C indicates cysteine residues图5 春尺蠖CSPs基因氨基酸序列比对Fig.5 Alignment of amino acid sequences of CSPs of Apocheima cinerarius
本研究将春尺蠖与茶尺蠖Ectropisoblique、国槐尺蠖Semiothisacinerearia、家蚕Bombyxmori、亚洲玉米螟Ostriniafurnacalis4种同鳞翅目昆虫共计139个OBPs构建了系统进化树(图6)。春尺蠖全部22个OBPs集中聚在同一分支上,却没有与同为尺蛾科的茶尺蠖和国槐尺蠖聚为一类。相反,茶尺蠖和国槐尺蠖各个OBPs却分别聚在一支上。
从春尺蠖CSPs基因与茶尺蠖、国槐尺蠖、家蚕、亚洲玉米螟 4种同鳞翅目昆虫的96个CSPs构建的系统进化树结果中可以看出,春尺蠖与茶尺蠖形成了清晰的直系同源谱系,共有9对CSPs聚到同一分支上,包括AcinCSP2/EoblCSP15、AcinCSP3/EoblCSP6、AcinCSP8/EoblCSP10、AcinCSP10/EoblCSP7、AcinCSP12/EoblCSP8、AcinCSP14/EoblCSP21、AcinCSP15/EoblCSP9、AcinCSP18/EoblCSP1、AcinCSP23/EoblCSP11。
OBP蛋白来源物种:茶尺蠖(EoblOBP), 国槐尺蠖(ScinOBP),家蚕(BmorOBP),亚洲玉米螟(OfurOBP)Sources species of OBP proteins:Ectropis oblique(EoblOBP),Semiothisa cinerearia(ScinOBP),Bombyx mori(BmorOBP),Ostrinia furnacalis(OfurOBP)图6 春尺蠖OBPs 的系统进化树Fig.6 Phylogenetic tree of OBPs in Apocheima cinerarius
CSP蛋白来源物种: 茶尺蠖(EoblCSP),国槐尺蠖(ScinCSP),家蚕(BmorCSP),亚洲玉米螟(OfurCSP)Source species of CSP proteins: Ectropis oblique(EoblCSP),Semiothisa cinerearia(ScinCSBP),Bombyx mori(BmorCSP),Ostrinia furnacalis(OfurCSP)图7 春尺蠖CSPs系统进化树Fig.7 Phylogenetic tree of CSPs in Apocheima cinerarius
目前,模式生物基因组测序技术日趋完善,其参考序列已被更好的应用于个体研究中,但非模式生物由于缺乏基因组信息参考,传统的克隆研究方法限制了其在分子生物学领域的发展速度。随着高通量测序技术的进步,测序成本逐渐降低,转录组测序技术成为非模式生物挖掘功能基因的最有效途径[8]。与传统的克隆方法相比,这些新技术简单、高效、省时[13-15]。在转录组测序效果分析中,一般认为,N50长度越长,数据组装的完整性越好;Q30大于80%,测序质量可靠[16]。本研究对春尺蠖雌雄成虫进行转录组测序并进行数据组装,共获取37 542条Unigenes,测序样本的Q30均≥93.68%,N50长度为2241 bp,较好满足后续转录组分析要求,可为后续基因注释及生物信息学分析提供可靠保证,同时为获取更多的新基因提供了可能。
通常认为,非模式生物的基因注释方法一般包括:Nt数据库比对注释唯一基因、进行Nr、Swiss-prot等数据库比对注释GO基因、进行KEGG等数据库等比对注释KEGG代谢途径等[17]。本研究对春尺蠖转录组所有组装获得的Unigenes进行功能注释,共有17 296(46.07%)条被成功注释到Nr、Nt、Pfam、KOG、Swiss-prot、KEGG和GO等7大公共据库,其中注释到Nr数据库13 757条,数量最多,占比36.64%,这与大多数昆虫在Nr数据库中的Unigenes注释结果类似,如杨爽等[18]在鳞翅目螟蛾科大蜡螟触角转录组的研究中Nr数据库注释到Unigenes的比例最高,为41.82%。
一般情况,大量基因序列没有获得注释,可能是由于序列片段长度过短而无法获取同源比对结果,属于非编码序列或新基因以及比对的参考基因组不够丰富[19-21]。本研究发现春尺蠖转录组注释中发现,还有20 246条(53.93%)未获得注释,这与宋月芹等[22]在锤胁跷蝽Yemmasignatus触角转录组分析中发现相似,即锤胁跷蝽触角转录组在至少在一个数据库里注释成功的46 224条(40.02%),还有69 267条(59.98%)基因未注释。孟翔等[23]在鳞翅目细蛾科荔枝蒂蛀虫转录组的研究中发现在7大数据库中至少 1 条数据库注释成功的Unigenes 有 22 348条,占总Unigenes 数的32.39%。原因之一可能是上述研究中获取的Unigenes片段较短,有相当大的比例在300 bp以下,但本研究获得的Unigenes片段均在300 bp以上,同时鳞翅目昆虫家蚕、棉铃虫、斜纹夜蛾和烟芽夜蛾等均为已知基因组物种,同源序列比对的参考基因组信息较为丰富,因此,推测测序未获注释的主要原因为序列属于非编码序列或新基因。
多数转录组测序结果表明,注释到Unigenes数最多的往往是已知基因组亲缘关系最近的物种[24],如扶桑绵粉蚧Phenacoccussolenopsis、黄粉虫Tenebriomolitor及梨小食心虫Grapholithamolesta[25-28]。但本研究中得出的结果却不同,同源比对上基因数最多的是同为鳞翅目已知基因组的斜纹夜蛾Spodopteralitura(2237个,16.3%),而非同为尺蠖蛾科未知基因组的茶尺蠖Ectropisoblique(比对数仅有38条),可能是因为亲缘关系更近的茶尺蠖还未获得基因组序列,与已知基因组序列的鳞翅目昆虫相比已知的基因序列信息过少导致,且已有茶尺蠖基因序列大多为单个组织测序所得,而本研究的基因则是以成虫测序获得,所以比对基因的数目较少。
近年来,随着高通量测序技术的快速发展,国内外许多学者通过转录组测序鉴定得到大量嗅觉相关基因[11,18,22,29-32]。本研究通过高通量测序技术对春尺蠖进行转录组测序,结合基因功能注释,春尺蠖Unigenes分别被注释到GO数据库中的细胞组分、分子功能和生物过程3大类的55个功能组,其中注释生物过程和分子功能的Unigenes较多,在细胞过程组中注释到的Unigenes数量最多,共有6418个,其次为结合组中注释到的Unigenes数量最多,为6199个,与大多数昆虫嗅觉基因转录组研究结果一致,但不同来源的测序材料在GO数据库中注释到的Unigenes归类有所不同,这与器官之间的功能差异相关[33]。blastp验证结果,深度挖掘共获取70个与春尺蠖嗅觉相关的靶标基因,包括22个OBPs,23个CSP,14个ORs(包括13个普通受体,和1个共受体ORco),8个IRs和3个SNMPs。本研究获得的70个靶标基因中CSP的占比较高(32.85%),这比其他触角中研究得出的CPS基因占比偏高[34],这可能由于化学感受蛋白在触角等化学感受器官中广泛表达,还在非化学感受器官中也有表达。在已获取的鳞翅目昆虫基因组和转录组信息中也发现各种类型的嗅觉相关基因。如小菜蛾Plutellaxylostella成虫触角转录组中共发现25个OBPs、15个CSPs、54个ORs和16个IRs;二化螟Chilosuppressalis成虫触角转录组中共鉴定出26个OBPs、21个CSPs、47个ORs和20个IRs[35]。相比上述鳞翅目昆虫的转录组研究结果,本研究中鉴定到的春尺蠖嗅觉相关基因大部分均在合理范围之内,而OR和IR数量偏少。这可能是因为其它昆虫的嗅觉相关基因是从触角中转录组中鉴定出来的,而春尺蠖嗅觉相关基因是从成虫转录组中得到的,很多在触角中低表达水平的受体基因无法被检测到。
在本研究中构建的春尺蠖与国槐尺蠖、家蚕、茶尺蠖、亚洲玉米螟的OBPs和CSPs系统进化树结果中,22个AcinOBP全部聚在一个分支上,说明春尺蠖AcinOBP属于直系同源基因,在嗅觉识别中发挥类似的功能[36]。从CSPs进化分析结果可以看出,春尺蠖与茶尺蠖亲缘关系最近,其9个CSPs与茶尺蠖成对聚在同一分支,表明二者在感受外界环境中具有类似的感受系统。
本研究通过高通量测序技术,对春尺蠖雌雄成虫转录组基因进行Unigenes注释及蛋白功能分析,将其Unigenes注释到GO数据库的3大类的55个功能组、经KEGG数据库对比分析后形成了230个代谢通路,共获取嗅觉相关基因70个,并将注释的相关基因与4种春尺蠖的代表性近缘昆虫进行系统进化分析,基于转录组信息验证了与茶尺蠖清晰的直系同源谱系关系,为今后深入研究其嗅觉识别作用机理奠定了基因信息基础,为运用嗅觉基因的转录组学研究结果,应用于春尺蠖预期防治提供了理论依据。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!