时间:2024-09-03
李 明,段世博,侯秀真,张荣菊,党万里,郑新英,金 燕
妊娠期糖尿病(gestational diabetes mellitus,GDM)是指妊娠期发生或首次发现的不同程度的糖代谢异常。 相关流行病学报道,其发病率存在较大差异(1%~14%),较为一致的结果是其发病率近年来出现了明显的上升趋势[1-2]。 我国尚缺乏系统的全国范围内的GDM 发病率数据,但区域相关流行病学研究认为,GDM 发病率约为5%,而约1/4 ~3/4 GDM 患者会出现各种母婴并发症[3]。 同时,首次妊娠发生GDM,则二次妊娠GDM 发生率高达35.6%~69.0%,其后代成年后患2 型糖尿病的危险明显增高[2]。 GDM 发病具体机制至今尚无定论,相关研究结论也不一致。 大多数研究认为GDM 的发生与胰岛素抵抗和胰岛B 细胞分泌降低有关,其中遗传基因易感性、胰岛素信号系统障碍可能是发病基础[4]。 因此,筛选GDM 相关基因,预测其功能有望成为预防和治疗GDM 的关键靶点。
1.1 数据库选择 分别选取基因表达谱数据库(Gene Expression Omnibus,GEO)[5],用于对筛选出的差异基因进行生物功能富集分析;蛋白-蛋白相互作用数据库STRING[7]用于构建筛选差异表达基因的互相作用;Cytohubb 软件[8],用于对STRING 构建网络中筛选关键基因。
1.2 方法
1.2.1 数据筛选 首先对选入的数据集进行数据下载,采用R 软件Lima 包对差异表达基因进行筛选,筛选条件为基因差异表达大于2 倍(Log2FC >1),容错率为5%(P<0.05)。
1.2.2 功能富集分析 基因本体论(Gene Ontology,GO)[9]和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEEG)分析[10],预测其可能功能及信号通路。
1.2.3 蛋白网络构建及hub 基因筛选 采用STRING 分析筛查出的差异表达基因编码蛋白间的相互作用关系。 筛选条件为:相互作用来源Textmining,Co-expression,Neighborhood,Gene Fusion 和Cooccurrence;相互作用数值<50;置信度0.4。
1.2.4 免疫组化 验证选取30 例GDM 患者和30名正常分娩孕妇为研究对象,采用免疫组化方法对关键基因编码蛋白在GDM 患者胎盘组织及正常妊娠产妇胎盘组织中的表达水平进行检测。 染色强度:细胞着色强度则以多数阳性细胞呈现的染色(棕黄色)计分。 未着色或与背景一致浅棕色为0 分;强着色:着色强度和己知阳性切片相同计3 分;浅着色:着色浅、但与阴性对照切片有明显区别计1 分;染色强度在浅着色和强着色之间者为中等着色计2分。 阳性细胞百分数:高倍镜(×400)下随机选取10个视野,每个视野计数10 个细胞,取平均值作为阳性细胞百分数。 小于5%的细胞呈阳性或细胞显色与背景一致计0 分;弱阳性:5%~25%的细胞呈阳性计1 分;阳性:26%~50%的细胞呈阳性计2 分;强阳性:大于51%的细胞呈阳性计3 分。 根据这两项指标的积分和分为4 级,即阴性(-)为0 分,弱阳性(+)为1~2 分,阳性(++)为3~4 分,强阳性(+++)为5~6 分。
1.3 统计学处理 应用STATA 10.0 软件进行统计分析,计量资料均数±标准差(±s)表示,两组间比较使用t 检验,多组间比较使用单因素方差分析;计数资料用率表示,行χ2检验;P<0.05 为差异有统计学意义。
2.1 差异表达基因筛选 共2 个数据集GSE51546(https:/ /www.ncbi.nlm.nih.gov/geo/query/acc.aglacc=GSE5154t)[11]和GSE87295 (https:/ /www. ncbi.nlm.nih.gov/geo/query/acc.cgi)纳入本次分析,2 个数据集中共差异表达基因4 个[TACSTD2,磷脂酰肌醇3-激酶(phosphatidylinositide 3-kinase,PI3K),COLEC12 和IGFBP6],图1。
图1 差异表达基因筛选
2.2 层次聚类分析 GDM组与对照组呈现出明显的相关基因聚类表达。 4 个基因中GDM 患者和对照组中均呈现明显的聚类趋势,图2。
图2 筛选出的4 个差异表达基因的聚类热图
2.3 差异表达基因的功能富集 上述差异表达基因产物主要位于细胞质和细胞接合器,主要分子功能为磷酸转移酶活性,醇基作为受体和蛋白激酶,主要参与体内相关蛋白信号转导。 KEGG 通路分析显示,差异基因主要参与了PI3K-AKT 信号通路、糖代谢途径相关通路和胰岛素信号通路,表1。
表1 基因功能富集分析
图3 差异表达基因蛋白-蛋白相关作用互作网络图
2.4 差异表达基因蛋白-蛋白互作网络 筛选出的4 个差异表达基因编码蛋白-蛋白相互作用网络(图3)显示,整个网络中54 个蛋白节点,共574 个相互作用链接,平均连接度为21.3,聚集度为0.74。2.5 GDM 蛋白-蛋白互作网络关键基因筛选 根据蛋白-蛋白互作网络筛选出PI3K、TAL1 和LYL1为GDM 差异表达蛋白-蛋白网络中的关键基因,其中PI3K 在3 个关键基因中作用最为重要,图4。
图4 GDM 蛋白-蛋白互作网络关键基因筛选
2.6 免疫组化验证结果 PI3K 阳性表达细胞为合体滋养细胞胞质中出现均匀一致棕黄色颗粒,细胞核不着色。 GDM组中,PI3K 阳性表达21 例,其中(+)12 例,(++)6 例,(+++)3 例,阳性表达率为70.0%(21/30);正常妊娠组阳性表达率为100%(30/30)。 GDM组中PI3K 的阳性表达低于正常妊娠组,差异有统计学意义(χ2=22.47,P<0.01,表2)。
表2 PI3K 在GDM组与正常妊娠组中的表达
GDM 是临床中最为常见的一类妊娠合并症,其发病率在不同地区不同年龄妊娠人群中存在较大差异。 同时,其确切发病机制仍不完全清楚。 目前研究认为其发病主要是随着孕周的增加,到妊娠中、晚期,孕妇体内抗胰岛素样物质增加,如胎盘生乳素、雌激素、孕酮、皮质醇和胎盘胰岛素酶等使孕妇对胰岛素的敏感性随孕周增加而下降,从而出现血糖升高。
生物信息大数据挖掘能够对已有的相关基因芯片和测序数据进行筛选和二次分析。 根据不同的需要设置筛选条件,从而得出相应的结论,为临床相关疾病的诊断、治疗和基础研究提供思路和方向[12-13]。生物信息学分析是进行临床及基础研究不可或缺的重要信息学手段。 近年来随着基因表达谱芯片及二代测序技术的不断进展,产生了海量基因表达数据,为生物信息学技术深入分析提供了基础。 本研究中,入选了2 个关于GDM 的数据集并进行筛选,同时对差异表达的基因进行重叠分析,对2 个数据集中差异表达基因进行研究。 2 个数据集中差异表达基因4 个(TACSTD2,PI3K,COLEC12 和IGFBP6)。这些差异基因表达蛋白主要定位于细胞质和细胞接合器,主要分子功能为磷酸转移酶活性,醇基作为受体和蛋白激酶参与了PI3K-AKT 信号通路、糖代谢途径相关通路和胰岛素信号通路。 其中PI3K 在GDM网络中作为最关键的基因发挥重要的作用。 同时免疫组化也证实PI3K 蛋白在GDM 患者和正常妊娠产妇胎盘中存在明显的差异表达。
在胰岛素信号转导通路中,胰岛素受体底物蛋白激活PI3K 主要与胰岛素的代谢效应有关。 在胰岛素抵抗状态下,胰岛素刺激引起的PI3K 信号传导途径作用下降,而MAPK 介导的信号传导作用则正常[14-15]。 胰岛素的代谢功能和血糖调节主要受胰岛素受体/胰岛素受体底物-1/PI3K/磷脂酰肌醇依赖蛋白激酶/蛋白激酶B(AKT)/葡萄糖转移因子4(GLUT4)信号路径的影响,即PI3K-AKT 信号通路。 所以当信号路径中任意一个信号分子或环节发生异常时均可导致糖尿病。
因此,PI3K 在GDM 患者中存在明显的差异表达,并可能在GDM 发生发展中发挥重要作用。PI3K 可能成为治疗和预防GDM 的关键靶点。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!