当前位置:首页 期刊杂志

小鼠羧酸酯酶CES1A基因生物信息学分析

时间:2024-08-31

陈德祥,朱影影,冯承涛

(1.安徽理工大学 化学工程学院,安徽淮南233100;2.淮南职业技术学院 医学院,安徽淮南233100)

羧酸酯酶(Carboxylesterase,CES)是一种典型的水解酶,具有α/β水解酶的显著特征,属于α/β水解酶超家族.羧酸酯酶可分为CES1和CES2两种活性水解酶,其中,CES1主要在肝脏中表达,而CES2则对肝脏和肠道均有非常好的作用.羧酸酯酶是广泛分布在动物、植物和微生物中水解羧酸酯的酶,在自然界中具有非常重要的作用,尤其在人身体医疗健康中运用较为广泛[1].羧酸酯酶是指作用于可溶性单体底物的酶,其存在于哺乳动物的肝脏中,它不仅可以催化水解环境中的有毒有害物质,还能够代谢包括前体药物在内的多种药物,有研究表明该酶在致癌物质的水解代谢过程中也发挥了较大作用,在对维持机体健康方面有较大的帮助[2].此外,生长发育的调节以及神经递质的传递过程中也都伴随着羧酸酯酶的参与.羧酸酯酶还有合成分解微生物胞内脂的功能,能够有效地避免植物中病原菌对其产生的危害[3].研究表明,在感染和炎症等病理情况下,存在肝脏中多种药物代谢酶的表达水平下降和酶活性水平降低的现象,导致药物的半衰期延长,从而引发因血浆药物浓度上升造成的药物蓄积毒性反应.CES属于I相药物代谢酶,它广泛存在于生物体系当中,能够促进酯类和酰胺的水解,主要涉及在生物体内代谢与清除多种药物、致癌物降解和环境毒素,在保障机体正常发育和维持身体健康方面发挥重要作用[4-6].此外,许多含有羧酸酯结构单元的农药可以被羧酸酯酶水解,利用这一特性可以清除环境中的农药残留,更好地维护环境的生态平衡,从而达到绿色环保的目的.

小鼠体内表达羧酸酯酶的基因主要由2种羧酸酯酶基因组成,包括羧酸酯酶1(CES1)基因和羧酸酯酶2(CES2)基因,根据基因在染色体上的位置来对其进行命名,如CES1A、CES1B、…、CES1H等[7].由于将酯基官能团引入药物结构中,能够促进药物被动转运,提高药物的口服生物利用度.现如今,基于CES1A表达酶的催化水解活性来设计药物的方法已经吸引了科研人员的注意,在研发含有羧酸酯基官能团的前药中,CES1A发挥着重要作用.尽管对CES1A表达酶的水解机理还不是很清楚,但越来越多的文献涉及羧酸酯酶与酯类药物代谢.在对羧酸酯酶的代谢特征、组织分布、含酯基类药物设计等方面进行探索,将为羧酸酯酶的研究发展奠定坚实的基础.

生物信息学是一门与其他学科交互的且具有较好发展前景的前沿学科,其中包括对基因组方面以及蛋白质空间结构方面的分析,除此之外还有对药物先导化合物的设计和发现研究[8-10],极大地拓宽了研究者对生物信息方面知识的了解.笔者利用NCBI、ProtParam、SMART、TMHMM2.0等多个生物信息学平台,对小鼠羧酸酯酶的CES1A基因进行生物信息学分析,探究CES1A基因序列、编码蛋白质结构及其特征,为研究其功能以及在药物设计方面提供一定的线索和依据.

1 材料与方法

1.1 供试材料

借助数据库NCBI(美国国立生物技术信息中心)检索小鼠CES1A基因,将其编码的蛋白质序列(NP_001013786.2)和其mRNA序列(NM_001013764.2)分别下载下来,留作备用.

1.2 试验方法

利用ExPASy数据库分析小鼠CES1A蛋白理化特性[11].用SOPMA软件、I-TASSER(https://zhanglab.ccmb.med.umich.edu/I-TASSER/)和SWISS-MODEL(https://www.swissmodel.expasy.org/)软件分析蛋白结构[12-13],其中前者用于分析二级结构,后二者用于分析三级结构.通过Protscale软件平台(https://web.expasy.org/protscale)预测所表达蛋白质的亲水性与疏水性.利用SMART(http//:smart.embl-heidelberg.de/)数据库预测蛋白的功能结构域[14].利用STRING(https://string-db.org/)数据库构建PPI网络图[15].用SignalP4.1(http://www.cbs.dtu.dk/services/SignalP-4.1)和TMHMM2.0(http://www.cbs.dtu.dk/services/TMHMM2.0)软件分析蛋白的信号肽以及跨膜结构[16-17].利用NetPhos 3.1预测蛋白的磷酸化位点.利用NetNGlyc 1.0(http://www.cbs.dtu.dk/services/NetNGlyc 1.0)预测蛋白的N-糖基化位点.利用网站(http://Imed.med.ucm.es/Tools/antigenic.pl)进行抗原决定簇预测[18].最后将以上所得关于小鼠CES1A蛋白的基因注释和结构域等内容与UniProtKB(https://www.uniprot.org/)数据库所提供的信息进行比对分析.

2 结果与分析

2.1 小鼠CES1A基因序列分析

从NCBI数据库中,得到小鼠CES1A基因mRNA序列(ID:NM_001013764.2),编码区长1 980 bp(位于85~1 776处),以及其编码的蛋白质序列(ID:NP_001013 786.2),共编码563个氨基酸.

2.2 小鼠CES1A基因表达蛋白理化性质分析

经过ProtParam软件分析,小鼠CES1A基因表达蛋白的理化性质如下:

1)小鼠CES1A基因表达蛋白的分子式是C2787H4307N711O825S24,其对应的相对分子质量是61 743.57.

2)小鼠CES1A蛋白的平均亲水系数是-0.081,脂肪系数是84.67.

3)小鼠CES1A基因表达蛋白的消光系数是280 nm(M-1/cm),理论等电点为5.13.

4)小鼠CES1A基因表达蛋白的不稳定系数为34.17,由此可知该蛋白在溶液中相对比较稳定.

5)小鼠CES1A基因表达蛋白在不同物种中表达半衰期不同:在大肠杆菌体内表达半衰期为10 h,在酵母体内表达半衰期为20 h,在哺乳动物网状红细胞体外表达半衰期为30 h.

6)小鼠CES1A基因表达蛋白的氨基酸组成:占据比例最少的是半胱氨酸(Cys),只有1.2%;而亮氨酸(Leu)则达到了10.5%,占据比例最高.

7)小鼠CES1A基因表达蛋白的正负电荷残基总数:带负电荷的残基总数为62,主要是天冬氨酸(Asp)和谷氨酸(Glu);带正电荷的残基总数为45,主要是精氨酸(Arg)和赖氨酸(Lys).

2.3 小鼠CES1A蛋白结构分析

蛋白质的空间结构是其发挥生物学功能的重要影响因素之一.利用SOPMA程序对CES1A基因表达蛋白进行生物学分析,CES1A基因表达蛋白的二级结构如图1所示,其结构中包含188个α螺旋(占比为33.39%)、31个β转角(占比为5.51%)、99个延伸链(占比为17.58%)以及245个无规则卷曲(占比为43.52%).其中:h代表α螺旋,t代表β转角,e代表延伸链,c代表无规卷曲.此外,由I-TASSER和SWISSMODEL软件对小鼠CES1A蛋白三级结构与二级结构进行进一步分析,发现分析结果一致(图2).

图1 小鼠CES1A蛋白二级结构预测Fig.1 Prediction of the secondary structure of mouse CES1A protein

图2 小鼠CES1A蛋白三级结构预测 Fig.2 Prediction of tertiary structure of mouse CES1A protein

2.4 小鼠CES1A蛋白亲水性、疏水性分析

为了解小鼠CES1A表达蛋白的亲/疏水性,借用Protscale工具对其进行分析,结果如图3所示.发现在第409位点处小鼠CES1A蛋白的亲水性最强,得分达到-2.456,在第231位点处疏水性最强,得分为2.711.在该基因编码的氨基酸中,亲水性氨基酸区域分布少于疏水性氨基酸区域分布,另根据氨基酸分值对应亲水性的规律[19],推测该蛋白为亲水性蛋白.

图3 小鼠CES1A蛋白疏水性分析Fig.3 Hydrophobicity analysis of mouse CES1A protein

2.5 小鼠CES1A蛋白功能结构域和基因网络通路分析

使用SMART分析小鼠CES1A蛋白功能结构域,如图4所示,该蛋白仅存在1个保守性结构域,位于第287~301氨基酸残基处,将所预测的结构域与UniProtKB数据库提供的CES1基因的结构域进行比对,发现二者结果基本一致.利用String数据库检索CES1A表达的相关蛋白,将检索条件设定为10个蛋白交互,发现CES1A表达的蛋白与Gnpda1、Pdf、Esd等3个蛋白形成网络,并做出相应的PPI网络图,如图5所示.经该软件结果分析,发现该PPI网络图共有4个节点,3条边,平均节点度为1.5,PPI浓缩P值为0.565.

图4 小鼠CES1A蛋白功能结构域分析Fig.4 Functional structure domain analysis of mouse CES1A protein

图5 CES1A蛋白PPI网络图 Fig.5 The network diagram CES1A protein PPI

2.6 小鼠CES1A蛋白信号肽和跨膜结构预测

通常情况下,信号肽一般由16~26个氨基酸残基组成,且位于蛋白质的N端[20].小鼠CES1A蛋白信号肽由SignalP 4.1软件预测,结果见图6.从图中可得,综合剪切位点分值(C值)曲线并无较大的波动,故C值比较平均;Y在10到20之间波动较大;信号肽分值(S值)在剪切位点前后有明显的变化,在剪切位点之前较高,且趋于平滑,而在剪切位点之后则出现骤降,最终S值接近于0.根据文献报道,判断剪切位点的依据是Y值的最大值是否大于0.5,结果显示,小鼠CES1A基因所表达的信号肽在第1~19位氨基酸之间,故该基因的信号肽切割点在16~17 bp位之间.图7显示的是由TMHMM2.0软件预测的小鼠CES1A蛋白的跨膜结构,该图显示小鼠CES1A蛋白外侧、内侧均趋于平稳,并不存在跨膜运输,故不存在跨膜结构.

图6 小鼠CES1A蛋白信号肽预测Fig.6 Prediction of the signal peptide of mouse CES1A protein

图7 小鼠CES1A蛋白跨膜结构预测Fig.7 Prediction of the transmembrane structure of mouse CES1A protein

2.7 小鼠CES1A蛋白磷酸化点分析及其N-糖基化位点分析

经NetPhos3.1预测,小鼠CES1A所表达的蛋白共含57个磷酸化位点,分别为26个丝氨酸位点(位于第22、39、76、88、113、123、129、146、150、158、179、185、221、226、228、233、245、314、339、367、375、378、390、405、472和484处),25个苏氨酸位点(位于第80、81、125、128、151、180、252、259、260、271、289、296、297、319、320、377、387、394、442、461、476、492、530、557和561处),和6个酪氨酸位点(位于第37、112、122、449、471、518和524处)(图8).经NetNGlyc1.0预测,小鼠CES1A表达的蛋白含3个N-糖基化位点,如图9所示,这3个N-糖基化位点分别位于第78、388和489处.

图8 小鼠CES1A蛋白磷酸化位点预测Fig.8 Prediction of phosphorylation sites of mouse CES1A protein

图9 小鼠CES1A蛋白N-糖基化位点预测Fig.9 Prediction of N-glycosylation sites of mouse CES1A protein

2.8 小鼠CES1A蛋白抗原决定簇分析

利用网络在线工具Predicting Antigenic Peptides对小鼠CES1A蛋白抗原决定簇进行预测,由图10可知,小鼠CES1A表达蛋白的平均抗原倾向指数为1.033 0,共含有22个抗原决定簇区域,分别位于4~31 aa,34~69 aa,83~102 aa,105~121 aa,131~146 aa,151~157 aa,159~176 aa,191~202 aa,211~219 aa,223~237 aa,245~256 aa,263~276 aa,278~286 aa,299~309 aa,313~329 aa,340~348 aa,375~387 aa,391~399 aa,420~434 aa,445~455 aa,466~476 aa位及538~546 aa位氨基酸残基.以上结果表明小鼠CES1A蛋白含有较多的优势抗原表位结构,抗原倾向指数高(图10).

图10 小鼠CES1A蛋白抗原决定簇预测Fig.10 Prediction of antigenic determinant of mouse CES1A protein

3 讨论与结论

羧酸酯酶能够催化水解一些酰胺类和酯类化合物,故常常添加到清洗剂中以提升洁净效果,此外它还对含有相应化学结构的农药残留有一定的降解作用,这一特性赋予其在生产和科学领域有很高的应用价值,从而使科研工作者对羧酸酯酶产生了极大的兴趣和密切的关注.目前市场上已经存在利用羧酸酯酶来对残留农药进行降解的肥料和清洁剂产品.为了增加药物的生物利用度,降低药物不良反应发生率,以基于羧酸酯酶的前药活化策略,来进行前药设计已经逐渐成为新型抗肿瘤药物的研究热点,在医药研发领域具有重要意义.

综上所述,笔者主要运用了NCBI、ProtParam和ExPASy等多个方法和手段,对小鼠CES1A基因的基本性质进行了深入研究,研究结果如下:

1)小鼠CES1A基因编码区长1 980 bp,编码563个氨基酸.其表达蛋白的分子式为C2787H4307N711O825S24,分子质量为61 743.57 u,脂肪系数为84.67.

2)小鼠CES1A表达蛋白质的基本结构:该蛋白的二级结构主要由α螺旋(占比为33.39%)和无规卷曲(占比为43.52%)构成,其在第1~19位氨基酸之间存在信号肽,无跨膜结构,是亲水性蛋白.

3)小鼠CES1A表达蛋白质有57个磷酸化位点和3个N-糖基化位点,含有22个抗原决定簇区域.

通过对羧酸酯酶生物信息学分析,为药物设计和药物代谢机制以及癌症治疗方面提供理论依据,具有指导意义.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!