当前位置:首页 期刊杂志

基于DIA LC-MS的高淀粉型与低淀粉型粉葛叶片的定量蛋白质组学差异

时间:2024-05-22

黄琦 程建峰 朱卫丰 褚怀亮 赵文峰 葛菲 吴波 丁立军 张建华 余聪

摘要 [目的]寻求粉葛生长发育的蛋白调控机制。[方法]以高淀粉型赣葛1号(鲜葛根含淀粉20%,干葛根含淀粉35%)和低淀粉型赣葛2号(鲜葛根含淀粉14%,干葛根含淀粉25%)为材料,采用基于全扫描数据非依赖性采集高分辨率色谱-质谱(DIA LC-MS)的定量蛋白质组学技术得到差异蛋白质,并对差异蛋白进行GO富集、KEGG通路和KOG分析。[结果]2个不同粉葛叶片中有178个蛋白(101个上调和77个下调)存在显著差异,主要涉及分子功能,但|log2(FC)|>5.0的差异蛋白仅占11.2%。GO富集分析表明,差异蛋白主要富集在代谢过程、催化活性、水解酶活性、细胞部分、细胞内部分、细胞质部分和细胞内细胞器类别。KEEG富集代谢途径集中在苯丙氨酸生物合成、植物体内的MAPK信号通路、次生代谢物生物合成、丙酮酸代谢和脂肪酸代谢。KOG分析显示,差异蛋白功能主要归为核苷酸转运和代谢、核糖体结构和生物发生、能量产生和转换、信号转导以及翻译后蛋白修饰、周转和伴侣机制。差异程度极大的蛋白依次为上调的类LHC Ⅱ型1叶绿素a-b结合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制剂前体、凝集素类蛋白和几丁质酶同源物及下调的类溶酶体Pro-X羧肽酶、预测的类dCTP焦磷酸酶1、富含半胱氨酸的受体类蛋白激酶25和色氨酸转氨酶相关蛋白4。[结论]研究结果为粉葛的生长发育、营养成分和活性物质的合成及调控、遗传改良及分子育种等提供数据支撑和技术途径。

关键词 粉葛;高淀粉型;低淀粉型;定量蛋白组学;差异蛋白;DIA LC-MS

中图分类号 R284  文献标识码 A  文章编号 0517-6611(2023)14-0168-10

作者简介 黄琦(1984—),男,江西横峰人,高级农艺师,硕士,从事葛新品种选育及高产高效栽培利用研究。

*通信作者,教授,博士,博士生导师,从事植物生理生態研究。

粉葛(Pueraria thomsonii)是豆科葛属植物,多年生落叶藤本[1]。粉葛具有解肌退热、生津止渴、透疹、升阳止泻、通经活络、解酒毒之功效[2],目前常应用于临床治疗一些高血压、高血脂、高血糖。粉葛中含有大量的维生素和微量元素,用于治疗风热感冒、麻疹、痢疾、腹泻、吐血、尿血等疾病,还可以增加免疫功能和抗衰老,已被用于保健食品和生物医药等领域[3]。粉葛是我国传统的药食同源植物,其根为肉质,粗壮肥大,最丰富的营养物质为淀粉,为鲜重的15%~20%、干重的25%~35%,干重含量最高可达47%[4-5]。粉葛的葛根产量及淀粉含量与品种特性及栽培措施密切相关。张应等[4]研究表明,苕葛1号干重淀粉含量最高(46.39%),地金2号干重淀粉含量最低(29.92%),5—12月淀粉含量逐月增加;黄荣韶等[6]认为,保留3条根2条枝时,粉葛块根的淀粉含量最高;赵婧文等[7]研究表明,粉葛中的淀粉含量与葛根素含量呈显著负相关;顾彩霞[8]研究显示,云南地区野生葛根淀粉含量较高(12.12%~21.80%),河北地区淀粉含量较低(4.41%~10.86%),穴施25 g磷肥时粉葛淀粉含量显著提高了1.78倍,粉葛块根中淀粉含量与土壤中速效磷和速效钾含量呈显著正相关;朱盼等[9]研究发现,不同产地粉葛不同部位的化学成分含量差异较大,粉葛不同部位可以发挥药用、食用的不同作用,实现对其的综合利用;何明慧等[10]研究表明,粉葛块根中的淀粉含量随有机肥用量的增加呈先升后降的趋势,以6 000 kg/hm2较合适。但人们对粉葛中淀粉合成的内在调控机制研究较少,限制了粉葛品种的遗传改良和高淀粉含量的良种选育。

蛋白质是生命代谢活动的直接体现者,所有生命体性状表达功能均由蛋白质承担,随着众多植物基因组学和转录组学研究的不断深入,作为在蛋白质水平上解释基因表达调控机制的蛋白质组学是后基因组时代的重要研究领域,对蛋白质的功能分析、鉴定及翻译后修饰的研究将会极大地阐明基因功能,更加客观准确地揭示生命现象[11-13]。基于全扫描数据非依赖性采集高分辨率色谱-质谱(data independent acquisition liquid chromatography-mass spectrometry,DIA LC-MS)的定量蛋白质组学技术由蛋白质组学届Aebersold教授开创[14],该技术融合了传统蛋白质组学“鸟枪法”(shotgun)和质谱绝对定量“金标准”选择反应监测/多反应监测(SRM/MRM)技术的优势和特点,且DIA技术将质谱整个全扫描范围分为若干个窗口,高速、循环地对每个窗口中的所有离子进行选择、碎裂、检测,从而无遗漏、无差异地获得样本中所有离子的全部碎片信息,具有全景式动态扫描、更大的识别率、更高的重现性和灵敏度、更少的缺失值、数据可回溯等优势[15-18]。但DIA LC-MS技术也存在需要建立高质量的DIA蛋白光谱库、数据获取比较昂贵、数据分析相对复杂和需要一定的专业知识等不足[19-23],故目前主要用于生物医学和药学上[22-30],在植物上的应用较少。鉴于此,为揭示淀粉含量存在明显差异的2个粉葛品种叶片在蛋白水平的差异,该研究选取了高淀粉型赣葛1号(鲜葛根淀粉含量20%和干葛根含淀粉35%)和低淀粉型赣葛2号(鲜葛根淀粉含量14%和干葛根含淀粉25%)为材料,采用DIA LC-MS定量蛋白质组学技术来解析它们间的蛋白差异,为粉葛的生长发育、营养成分和活性物质的合成及调控、遗传改良及分子育种等提供数据支撑和技术途径。

1 材料与方法

1.1 供试材料

选用2个淀粉含量存在明显差异的粉葛品种,分别为高淀粉型赣葛1号(鲜葛根淀粉含量20%和干葛根含淀粉35%)和低淀粉型赣葛2号(鲜葛根淀粉含量14%和干葛根含淀粉25%),取样部位为主藤顶部功能叶,采自江西绿色生态葛研究所种植基地。

1.2 试验原理

试验共2组样品,3个生物学重复。将6个样品中提取的蛋白等量混合为一个新的样品进行建库,在这个基础上进行数据库检索,再通过数据依赖采集技术进行数据采集建库,之后将6个样品依次进行非数据依赖采集对样本进行相对定量分析。在准备样品期间,所有待测样品中都添加iRT肽段进行一定时间矫正和质谱峰提取。采集到的DIA数据通过Spectronaut 14软件进行数据归一化和蛋白质的相对定量,通过单向方差分析测试计算p值。

1.3 样品前处理

1.3.1 样品准备。

在液氮中进行样品研磨,随后加入2 mL细胞裂解液,于冰上超声裂解1 h后高速离心30 min(8 000 r/min,4 ℃)。加入等体积的Tris-HCl苯酚饱和溶液(pH 7.5),混合液于4 ℃摇匀(约30 min)。高速离心15 min(4 ℃,8 000 r/min),取上层酚相。重复萃取1次。加入5倍體积丙酮溶液于-20 ℃沉淀过夜。沉淀蛋白用丙酮溶液冲洗2次,冻干,用含1% SDS的8 mol/L尿素溶液重溶。

1.3.2 蛋白酶解。

将每种条件下100 μg蛋白质转移到新的艾本德(Eppendorf)管,用8 mol/L尿素将最终体积调节至100 μL。加入2 μL 0.5 mol/L TCEP,在37 ℃孵育1 h。然后向样品中加入4 μL 1 mol/L碘乙酰胺,在室温避光下持续孵育40 min。之后,在样品中加入5倍体积的-20 ℃预冷丙酮,在-20 ℃下过夜沉淀蛋白质。沉淀物用1 mL预冷的90%丙酮水溶液洗涤2次,然后重新溶解在100 μL 100 mmol TEAB中。以1∶50(酶∶蛋白质,质量比)的比例加入序列级修饰的胰蛋白酶,在37 ℃下过夜酶解蛋白质。肽混合物通过除盐柱除盐,通过皮尔斯肽段定量试剂盒测定其最终浓度并冻干。

1.4 建立数据库

1.4.1 高pH反相分离。

将肽段混合物在缓冲液A(20 mmol/L甲酸铵水溶液,用氨水调节pH至10.0)中重新溶解,然后用Ultimate 3000系统连接反向柱进行高pH分离,使用线性梯度进行高酸碱度分离,在40 min内缓冲液B(80%乙腈中加入20 mmol/L 甲酸铵,用氨水调节pH至10.0)从5%到45%。柱子在初始条件下重新平衡15 min,柱流速保持在1 mL/min,柱温保持在30 ℃。共收集到8个馏分,每个馏分在真空浓缩器中干燥,以便下一步操作。

1.4.2 Nano-HPLC-MS/MS分析。

除盐冻干后的肽段被重新溶解在溶剂A(0.1%甲酸水溶液)中,由配备在线纳喷离子源的LC-MS/MS分析。色谱柱为C18(3 mm×50 mm×3 μm),进行120 min梯度分离。色谱梯度如表1所示,其中,流动相A为0.1%甲酸水溶液,流动相B为含0.1%甲酸的乙腈溶液。色谱柱流速维持在400 nL/min,电喷雾电压为2 kV。

1.4.3 搜库。

原始数据由Spectronaut 14(Biognosys AG)在默认设置下处理和分析,生成一个初始数据库,其中包含44 057个母离子、32 067个肽段、5 830个蛋白质和5 642个蛋白质组。搜库参数固定修饰为Carbamidomethyl(C),可变修饰为methionine氧化。母离子和肽段水平的假阳性率设置为1%。

1.5 DIA数据采集与分析

1.5.1 Nano-HPLC-MS/MS数据采集。

将肽段重新溶于溶剂A(0.1%甲酸水溶液)中,从中取出9 μL并加入1 μL 10×iRT肽段,混合后用nano-LC分离,再由在线电喷雾串联质谱分析。上样量为2 μL,进行120 min梯度分离,柱的流量保持在400 nL/min,采用2 kV的电喷电压。色谱梯度如表1所示,其中流动相A为0.1%甲酸水溶液,流动相B为含01% 甲酸的乙腈溶液。

1.5.2 数据分析。

1.5.2.1 差异表达蛋白筛选。

DIA的原始数据由Spectronaut 14(Biognosys AG)以默认设置参数进行处理和分析,保留时间预测类型设置为动态iRT。Spectronaut 14根据广泛的质量校准确定数据提取,且根据iRT校准和梯度稳定性动态确定理想的提取窗口。通过过滤器的所有选定前体都用于定量,除了3个干扰最小的离子外,MS2干涉将去除所有干扰碎片离子。经单因素方差分析后,如果某个蛋白表达的p值<0.05且差异倍数绝对值>1.5,则判定为差异表达蛋白。

1.5.2.2 差异蛋白GO分析。

使用Blast2GO version 5进行功能注释,采用GOATOOLS进行差异蛋白功能富集。GO分析根据三点(分子功能、细胞器组成和生物过程)注释和分类基因及其对应的产物来获取蛋白质的功能信息。GO分析后根据挑选出的差异基因,计算这些差异基因与GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO 存在一个特定p值,p值越小表示差异基因在该GO 中富集程度越大。

1.5.2.3 差异蛋白KEGG分析。

通路分析使用KOBAS(http://kobas.cbi.pku.edu.cn/)进行。与GO分析类似,p值越小表示差异基因在该KEGG中富集程度越大。当p值小于某一个阈值时(一般设为0.05),认为该功能是可信的,同时根据p值进行错误发现率(FDR)校正计算后,获得校正后的p值,可根据实际需要选取p值或校正后的p值来判定可信度。

1.5.2.4 差异蛋白KOG分析。

KOG数据库(EuKaryotic Orthologous Groups)包括来自7个真核生物基因组的蛋白质,包括3种动物(智人、黑腹果蝇和秀丽隐杆线虫),1种植物(拟南芥),2种真菌(粟酒裂殖酵母和酿酒酵母),1种细胞内微孢子虫(寄生虫)。 KOG数据库由4 852个直系同源簇组成,其中包括59 838个蛋白质,655个基因产物。

KOG提供了4个功能组,每个功能组又细分为由字母表中的字母确定的KOG分类。在每个分类中,直系同源或旁系同源蛋白质组被分配一个KOG ID。对KOG分类的考察揭示了所有分析物种中存在的保守核心,约占KOG集合的20%。

2 结果与分析

2.1 蛋白鉴定与分布

图1显示,大部分蛋白质表达没有变化,少部分表现为上调和下调。根据获得数据分析发现,一共鉴定到5 111个蛋白,相对于赣葛1号,赣葛2号中有2 625个蛋白上调、2 271个蛋白下调和215个蛋白没变化;符合原始p值< 0.05且差异倍数绝对值>1.5标准的,赣葛2号中有308个蛋白上调、214个蛋白下调;符合调整后p值< 0.05且差异倍数绝对值>1.5标准的,赣葛2号中有101个蛋白上调、77个蛋白下调;这说明造成赣葛1号和赣葛2号间本质差异的蛋白主要是由178个蛋白引起的。

2.2 差异蛋白GO分析

图2显示,在生物过程(biological process)类别的20个二级分类中,第一梯队从多到少依次是参与代谢过程(metabolic process)、小分子代谢过程(small molecular metabolic process)、碳水化合物代谢过程(carbohydrate metabolic process)的蛋白,第二梯队从多到少依次为参与碳水化合物衍生物代谢过程(carbohydrate derivative metabolic process)、生物过程负调节(negative regulation of biological process)、催化活性调节(regulation of catalytic activity)、代谢过程负调节(negative regulative of metabolic process)、大分子代谢过程负调节(negative regulation of macromolecule metabolic process)、药物分解代谢过程(drug catabolic process)、水解酶活性调节(regulation of hydrolase activity)、催化活性负调节(negative regulation of catalytic activity)、分子功能负调节(negative regulation of molecular function)、水解酶活性负调节(negative regulation of hydrolase activity)和氨基糖代谢过程(aminoglycan metabolic process)的蛋白,第三梯队从多到少依次为参与含氨基葡萄糖化合物催化过程(glucosamine-containing compound catabolic process)、几丁质代谢过程(chitin metabolic process)、几丁质分解代谢过程(chitin catabolic process)、氨基糖分解代谢过程(amino sugar catabolic process)、氨基聚糖分解代谢过程(aminoglycan catabolic process)和含氨基葡萄糖化合物代谢化过程(glucosamine-containing compound metabolic process)的蛋白。在分子功能(molecular function)类别的20个二级分类中,第一梯队从多到少依次是參与催化活性(catalytic activity)、水解酶活性(hydrolase activity)、作用于酯键的水解酶活性(hydrolase activity,acting on ester bonds)、作用于糖基键的水解酶活性(hydrolase activity,acting on glycosyl bonds)、水解O-糖基化合物的水解酶活性(hydrolase activity,hydrolyzing O-glycosyl compounds)的蛋白,第二梯队从多到少依次为参与酶调节剂活性(enzyme regulator activity)、分子功能调节剂(molecular function regulator)、裂解酶活性(lyase activity)、酶抑制剂活性(enzyme inhibitor activity)、丝氨酸型肽酶活性(serine-type peptidase activity)、丝氨酸水解酶活性(serine hydrolase activity)和几丁质酶活性(chitinase activity)的蛋白,第三梯队从多到少依次为参与几丁质结合(chitin binding)、内肽酶抑制剂活性(endopeptidase inhibitor activity)、内肽酶调节剂活性(endopeptidase regulator activity)、肽酶抑制剂活性(peptidase inhibitor activity)、激素结合(hormone binding)和肽酶调节剂活性(peptidase regulator activity)的蛋白,第四梯队从多到少依次为参与缬氨酸-tRNA连接酶活性(valine-tRNA ligase activity)和胺裂解酶活性(ammoina-lyase activity)的蛋白。在细胞组分(cellular component)类别的20个二级分类中,第一梯队从多到少依次是参与细胞部分(cell part)、细胞内部分(intracellular part)、细胞质部分(cytoplasmic part)和细胞内细胞器(intracellular organelle)的蛋白,第二梯队从多到少依次为参与胞质溶胶(cytosol)、胞外区域(extracelluar region)、叶绿体部分(chloroplast part)、质体部分(plastid part)、细胞壁(cell wall)、外部封装结构(external encapsulating structure)、叶绿体基质(chloroplast stroma)和质体基质(plastid stroma)的蛋白,第三梯队从多到少依次为参与植物型细胞壁(plant-type cell wall)、质膜锚定成分(anchored component of plasma membrane)、质外体(apoplast)和膜锚定成分(anchored component of membrane)的蛋白,第四梯队从多到少依次为参与胞质外RNase复合物的泌体(cytoplasmic exosome,RNase complex)、胞质外核外泌体(nuclear exosome,RNase complex)、外泌体(exosome,RNase complex)和外泌核酸酶复合物(exoribonuclease complex)的蛋白。总体来看,最主要的差异蛋白发生在代谢过程中的催化活性和细胞组分中的细胞器发生过程中(图3)。

2.3 差异蛋白KEGG通路分析

将富集到的KEGG通路按照其所属的分类进行归类,如图4所示,左边的纵坐标显示富集到的具体的代谢通路,右边的纵坐标由外向内依次表示富集到的代谢通路所属的一级和二级分类名称的缩写,括号中的数字显示该通路富集的p值。在一级通路上,代谢(A)占绝大部分,遗传信息处理(B)和环境信息处理(C)分别只有蛋白的“折叠、排序和降解(BC)”和“信号转导(CB)”1个二级通路,而代谢可分为总体和概览(global and overview maps,AA)、碳水化合物代谢(carbohydrate metabolism,AB)、脂代谢(lipid metabolism,AD)、氨基酸代谢(amino acid metabolism,AF)、其他氨基酸代谢(metabolism of other amino acids,AG)、糖的生物合成和代谢(glycan biosynthesis and metabolism,AH)、辅因子和维生素的代谢(metabolism of cofactors and vitamins,AI)、萜类和聚酮化合物的代谢(metabolism of terpenoids and ployketides,AJ)和其他次生代谢物的生物合成(biosynthesis of other secondary metabolites,AK)9个二级通路,其中蛋白数目占总蛋白百分数最多的代谢通路有次生代谢物的生物合成(biosynthesis of secondary metabolites)、氨基酸糖和核苷酸糖类代谢(amino sugar and nucleotide sugar metabolism)、苯丙氨酸生物合成(phenylpropanoid biosynthesis)、植物的MAPK信号途径(MAPK signaling pathway-plant)、RNA降解(RNA degradation)、丙酸代谢(propanoate metabolism)、淀粉及蔗糖代谢(starch and sucrose metabolism)等。所得的具体的富集KEGG通路见表2,所有的通路均与糖类、脂肪酸、氨基酸及一些次生代谢物的合成有关,位居前5位的已知代谢途径是苯丙氨酸的生物合成、植物体内的MAPK信号通路、次生代谢物的生物合成、丙酮酸代谢、脂肪酸代谢。

2.4 差异蛋白KOG分析

图5为使用KOG数据库对差异蛋白进行基于序列相似度的功能分类注释及预测,以柱形图分别展示上/下调蛋白的不同KOG功能分类情况,红色表示上调蛋白,黑色表示下调蛋白,X轴为各种COG分类,Y轴标明属于该类别的蛋白数量。由图5可知,在赣葛2号中,上调蛋白数目远多于下调蛋白数目,其中位居前列的上调蛋白质数目所属类别从多到少依次为仅一般的功能预测(general function prediction only,R),核苷酸的转运和代谢(nucleotide transport and metabolism,F),翻译、核糖体结构和生物发生(translation,ribosomal structure and biogenesis,J),能量产生和转换(energy production and conversion,C),翻译后修饰、蛋白质周转、伴侣(posttranslational modification,protein turnover,chaperones,O),信号转导机制(signal transduction mechanisms,T);位居前列的下调蛋白质数目所属类别从多到少依次为仅一般的功能预测(general function prediction only,R),翻译后修饰、蛋白质周转、伴侣(posttranslational modification,protein turnover,chaperones,O),碳水化合物的运输和代谢(carbohydrate transport and metabolism,G),能量产生和转换(energy production and conversion,C),脂质运输和代谢(lipid transport and metabolism,I),未知功能(function unknown,S)。

2.5 差异表达蛋白分析

表3表明,在赣葛2号的178个差异蛋白中,上调蛋白101个,下调蛋白77个,上调和下调蛋白中分别有91和66个被描述,涉及生物过程的上调和下调蛋白分别为56和40个,涉及分子功能的上调和下调蛋白分别为80和58个,涉及细胞组分的上调和下调蛋白分别为55和28个;在|log2(FC)|>5.0的差异蛋白中,上调蛋白13个,下調蛋白7个,上调和下调蛋白中分别有13和6个被描述,涉及生物过程的上调和下调蛋白分别为6和4个,涉及分子功能的上调和下调蛋白分别为12和4个,涉及细胞组分的上调和下调蛋白分别为6和3个;在|log2(FC)|>10.0的差异蛋白中,上调蛋白5个,下调蛋白2个,上调和下调蛋白中分别有5个和1个被描述,涉及生物过程的上调和下调蛋白分别为2和1个,涉及分子功能的上调和下调蛋白分别为5和1个,涉及细胞组分的上调和下调蛋白分别为2和0个;这说明差异蛋白主要与分子功能有关,其次为生物过程和细胞组分,且只有少数差异蛋白的调节水平较高。

为了深入挖掘差异蛋白及功能,将GO注释分类中每一类的|log2(FC)|位列前3的上调和下调差异蛋白列于表4。由表4可知,在生物过程类别中,上调程度最大的为Unigene 0019578编码的类LHC Ⅱ型1叶绿素a-b结合蛋白(chlorophyll a-b binding protein of LHC Ⅱ type 1-like),其次为Unigene 0027341编码的几丁质酶同源物(chitinase homologue)和Unigene 0048557编码的MLP类蛋白423(MLP-like protein 423);下调程度最大的为Unigene 0028984编码的类溶酶体Pro-X羧肽酶(lysosomal Pro-X carboxypeptidase-like)、其次为Unigene 0021523编码的预测的类dCTP焦磷酸酶1(predicted:dCTP pyrophosphatase 1-like)和Unigene 0036013编码的富含半胱氨酸的受体类蛋白激酶25(cysteine-rich receptor-like protein kinase 25)。在分子功能类别中,上调程度最大的为Unigene 0000855编码的kunitz家族胰蛋白酶和蛋白酶抑制剂前体(kunitz family trypsin and protease inhibitor precursor),其次为Unigene 0000863编码的kunitz家族胰蛋白酶和蛋白酶抑制剂前体(kunitz family trypsin and protease inhibitor precursor)和Unigene 0068213编码的凝集素类蛋白(lectin-like protein);下调程度最大的为Unigene 0036605编码的色氨酸转氨酶相关蛋白4(tryptophan aminotransferase-related protein 4),其次为Unigene 0066349编码的类发病相关蛋白1(pathogenesis-related protein 1-like)和Unigene 0008388编码的α-葡萄糖苷酶(Alpha-glucosidase protein)。在细胞组分类别中,上调程度最大的为Unigene 0071598编码的可能的木葡聚糖内转糖酶/水解酶蛋白6(probable xyloglucan endotransglucosylase/hydrolase protein 6),其次为Unigene 0027340编码的几丁质酶同源物(chitinase homologue)和Unigene 0025707编码的动态蛋白相关蛋白4C(dynamin-related protein 4C);下调程度最大的为Unigene 0045570编码的Auxin结合蛋白ABP19a部分(Auxin-binding protein ABP19a,partial),其次为Unigene 0064846编码的可能酯酶PIR7A亚型X1(probable esterase PIR7A isoform X1)和Unigene 0008951编码的胁迫诱导蛋白SAM22(stress-induced protein SAM22)。综合看来,差异程度巨大的蛋白依次为上调的类LHC Ⅱ型1叶绿素a-b结合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制剂前体、凝集素类蛋白和几丁质酶同源物及下调的类溶酶体Pro-X羧肽酶、预测的类dCTP焦磷酸酶1、受体类蛋白激酶25和色氨酸转氨酶相关蛋白4。

3 结论与讨论

Wilkins 等[31]提出“蛋白质组学(proteomics)”概念,是指从整体水平上研究蛋白质的组成和调控规律,包括蛋白质的表达水平、翻译后修饰的种类和蛋白间的相互作用等,分为定性蛋白质组学和定量蛋白质组学[32]。近年来,高分辨率和灵敏度的质谱设备及数据分析软件不断涌现,为蛋白质组学研究从定性转向定量分析提供了良好的软硬件基础[33]。定量蛋白质组学研究方法可分绝对定量和相对定量两类,因绝对定量需要已知含量的标记肽段和高成本而存在应用局限,故目前常用的是相对定量来比较样本间的蛋白质差异[34-35]。近些年来发展的数据非依赖性采集(data independent acquisition,DIA)结合了基于数据依赖性采集(data dependent acquisition,DDA)与选择反应监测(Selected reaction monitoring,SRM)的特点,具有无需目标肽段、通量无上限、均匀采集信息、快速灵敏、高准确性、大重现性、数据可回溯、定性确证和定量离子筛选等优势[36-37]。

DIA技术刚开始建立不久,因需要事先建立高质量的DIA蛋白光谱库、数据获取昂贵和数据分析复杂等问题使得其主要被生物医学和药学领域。随着近些年的不断改进完善和迅速发展,在植物研究中也逐渐被采用,但主要集中在大宗作物的籽粒成分、抗病性和渗透胁迫等,在药食同源植物上应用极少。Bromilow等[38]利用DDA和DIA相结合的方法对小麦面筋蛋白质组进行全面分析,结合人工筛选的谷蛋白序列数据库,共鉴定出2 736个谷蛋白肽,而2个平台仅鉴定出157个肽,其中127份和63份谷蛋白肽分别含有至少1个和3个独特肽段;在63种严格鉴定的蛋白中,包括26种麦胶蛋白(4种 ω-、14种 α-和8种 γ-麦胶蛋白)和37种谷蛋白(29种LMW谷蛋白和8种HMW谷蛋白)。Riebel等[39]DIA分析发现,德国成熟Dornfelder葡萄浆果中的712个蛋白质,其中650个可以被Blast2GO软件注释,大部分蛋白质均与应激反应有关,所有糖酵解关键酶均在成熟葡萄果实中检测到。Fan等[40]应用DIA研究了番茄发病反应前后期的蛋白质组变化,在发病反应早期,与伴侣直接相关的蛋白被防御蛋白调控;在后期,不仅防御蛋白被高度诱导,且一套病原体相关分子模式触发免疫(PTI)和效应触发免疫(ETI)相关蛋白也被高度诱导。Xie等[41]对壳聚糖处理后的水稻幼苗进行DIA分析,结果表明,壳聚糖可能上调水稻苗期植物生长相关的钙离子结合、光合作用、RNA结合和分解代谢蛋白。Wang等[42]利用DIA技术对渗透胁迫下西藏青稞的蛋白质组学进行比较分析,在所有样品中共鉴定和定量了6 921个蛋白,一些激素代谢相关基因和植物激素脱落酸诱导基因主要受渗透胁迫的影响,活性氧调节蛋白活性增强。Sun等[43]基于DIA的定量蛋白质组学揭示,共鉴定和定量了6 913个蛋白,筛选出3 513个差异丰富蛋白(DAPs),其中640个在生热阶段中高度丰富的蛋白质主要参与三羧酸循环等碳代谢过程,枸橼酸合成酶是蛋白-蛋白相互作用(PPI)网络中连接最紧密的蛋白,交替氧化酶在花托中特别丰富;莲花生热作用涉及三羧酸循环代谢、淀粉和蔗糖代谢、脂肪酸降解和泛醌合成等复杂的蛋白调控网络。该研究显示,采用DIA LC-MS定量蛋白组学技术鉴定到高淀粉型和低淀粉型粉葛叶片中的5 111个蛋白,其中符合差异蛋白标准的是178个(101个上调和77个下调),仅占鉴定蛋白的3.48%;在差异蛋白中,与分子功能有关的最多(138个),其次是生物过程(106个)和细胞组分(83个),未被归类的23个;这说明极少蛋白造成了不同淀粉含量粉葛叶片及品质间的较大差异,一种蛋白参与或调控多个生理生化过程,但绝大部分的调控程度相对较小。GO和KEGG富集分析发现,差异蛋白主要集中在物质代谢(苯丙氨酸、丙酮酸和脂肪酸)和MAPK信号通路2个方面,主要通过调控核酸代谢、核糖体生物发生、能量代谢、信号转导以及翻译后蛋白的修饰、周转、伴侣来实现。综合分析发现,低淀粉型粉葛赣葛2号叶片中的类LHCⅡ型1叶绿素a-b结合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制剂前体、凝集素类蛋白和几丁质酶同源物的上调程度极大,下调程度极大的是类溶酶体Pro-X羧肽酶、预测的类dCTP焦磷酸酶1、富含半胱氨酸的受体类蛋白激酶25和色氨酸转氨酶相关蛋白4,至于它们的内在调控机制有待于深入的分子生物研究去验证。

DIA LC-MS定量蛋白组学技术虽然具有很多的优点,但仅依靠其对生物系统进行探究还是不够全面的,最好要与其他组学(如基因组学、转录组学、翻译后修饰组学和代谢组学)进行有机结合才能达到更全面和系统的分析结果,构建完整的基因表达和蛋白精准调控网络,深度挖掘物种特征和信号调控网络,从而更好地理解各项生命活动[44-50]。今后该研究组也将在该研究获得的粉葛蛋白组学的基础上,深入开展与其他组学的整合分析,从多个组学的角度对粉葛的植物特征进行解析,为粉葛的生长发育、营养成分和活性物质的合成及调控、遗传改良及分子育种等提供数据支撑和技术途径。

参考文献

[1] 中国科学院中国植物志編辑委员会.中国植物志:第41卷[M].北京:科学出版社,1995:226-227.

[2] 国家药典委员会.中华人民共和国药典:2020年版 一部[S].北京:中国医药科技出版社,2020:289,333.

[3] 于钦辉,杜以晴,孙启慧,等.基于功效和物质基础的野葛、粉葛解热和抗病毒作用研究进展[J].中华中医药学刊,2021,39(9):89-94.

[4] 张应,李隆云,舒抒,等.不同产地、品种及采收期粉葛可溶性糖和淀粉的含量测定[J].中药材,2013,36(11):1751-1754.

[5] 何紹浪,张昆,成艳红,等.江西省粉葛种植产业发展现状及对策[J].江西中医药,2020,51(12):7-10.

[6] 黄荣韶,黎礼丽,朱丹青,等.整枝和修根对粉葛产量和品质影响[J].农业与技术,2017,37(2):56-58.

[7] 赵婧文,张建逵,魏巍,等.粉葛中淀粉含量与葛根素含量的相关性研究[J].中国中医药现代远程教育,2018,16(15):95-97.

[8] 顾彩霞.不同区域葛品质评价及施肥对粉葛品质的影响[D].北京:北京林业大学,2019.

[9] 朱盼,谢娟平.不同产地粉葛不同部位中7种化学成分的含量测定与比较[J].化学与生物工程,2019,36(7):59-64.

[10] 何明慧,杨远宁,王艳,等.有机肥对粉葛营养元素和产量品质的影响[J].中国农学通报,2020,36(16):79-83.

[11] REUBENKALU J I,EKEOKORO O N.Recent advances in plant proteomics towards stress adaptation and crop improvement[J].International journal of agriculture science and research,2020,10(4):71-80.

[12] OKOLI E E,NWORJI M J,OKORONKWO C M.Potentials of proteomics in plant improvement[J].International journal of scientific advances,2021,2(1):80-84.

[13] JORRIN NOVO J V.Proteomics and plant biology:Contributions to date and a look towards the next decade[J].Expert review of proteomics,2021,18(2):93-103.

[14] AEBERSOLD R,MANN M.Mass spectrometrybased proteomics[J].Nature,2003,422(6928):198-207.

[15] DOERR A.DIA mass spectrometry[J].Nature methods,2015,12(1):35.

[16] ONG S E,MANN M.Mass spectrometrybased proteomics turns quantitative[J].Nature chemical biology,2005,1(5):252-262.

[17] WANG J,TUCHOLSKA M,KNIGHT J D,et al.MSPLITDIA:Sensitive peptide identification for dataindependent acquisition[J].Nature methods,2015,12(12):1106-1108.

[18] BICHMANN L,GUPTA S,ROSENBERGER G,et al.DIAproteomics:A multifunctional data analysis pipeline for dataindependent acquisition proteomics and peptidomics[J].Journal of proteome research,2021,20(7):3758-3766.

[19] CANTERBURY J D,MERRIHEW G E,GOODLETT D R,et al.Comparison of data acquisition strategies on quadrupole ion trap instrumentation for shotgun proteomics[J].Journal of the American society for mass,2014,25(12):2048-2059.

[20] TSOU C C,AVTONOMOV D,LARSEN B,et al.DIAUmpire:Comprehensive computational framework for dataindependent acquisition proteomics[J].Nature methods,2015,12(3):258-264.

[21] SCHUBERT O T,GILLET L C,COLLINS B C,et al.Building highquality assay libraries for targeted analysis of SWATH MS data[J].Nature protocols,2015,10(3):426-441.

[22] MEYER J G,SCHILLING B.Clinical applications of quantitative proteomics using targeted and untargeted dataindependent acquisition techniques[J].Expert review of proteomics,2017,14(5):419-429.

[23] KRASNY L,HUANG P H.Dataindependent acquisition mass spectrometry(DIAMS)for proteomic applications in oncology[J].Molecular omics,2021,17(1):29-42.

[24] MEYER J G,MUKKAMALLA S,STEEN H,et al.PIQED:Automated identification and quantification of protein modifications from DIAMS data[J].Nature methods,2017,14(7):646-647.

[25] PIAZZA I,BEATON N,BRUDERER R,et al.A machine learningbased chemoproteomic approach to identify drug targets and binding sites in complex proteomes[J].Nature communications,2020,11(1):1-13.

[26] 李文娟,萬祎,李桐,等.基于数据非依赖型采集质谱技术的血液脂质分子高通量分析[J].生态毒理学报,2017,12(2):46-55.

[27] 童译庆,吴春荣,刘建军,等.利用定量蛋白组学对脓毒症外周血单个核细胞差异蛋白的研究[J].中华急诊医学杂志,2018,27(11):1251-1259.

[28] 王陈龙,邱峰,操龙斌,等.基于DIA LC-MS对脓毒症患者外周血差异蛋白的研究分析[J].检验医学与临床,2020,17(18):2600-2603.

[29] 陈雯,刘智文,游小龙,等.基于DIA/SWATH的质谱定量技术研究皮肤鳞状细胞癌患者的血清蛋白质组学[J].实用癌症杂志,2020,35(12):1928-1931.

[30] 阿尔孜古丽·吐尔逊,杨丽菲,郑树涛,等.基于DIA LC-MS对Ⅲ期食管鳞癌和食管良性疾病患者外周血外泌体差异蛋白的研究[J].新疆医科大学学报,2021,44(6):659-663.

[31] WILKINS M R,APPEL R D,VAN EYK J E,et al.Guidelines for the next 10 years of proteomics[J].Proteomics,2006,6(1):4-8.

[32] DUPREE E J,JAYATHIRTHA M,YORKEY H,et al.A critical review of bottomup proteomics:The good,the bad,and the future of this field[J].Proteomes,2020,8(3):1-26.

[33] NOOR Z,AHN S B,BAKER M S,et al.Mass spectrometrybased protein identification in proteomicsA review[J].Briefings in bioinformatics,2021,22(2):1620-1638.

[34] ARUL A B,ROBINSON R A S.Sample multiplexing strategies in quantitative proteomics[J].Analytical chemistry,2019,91(1):178-189.

[35] PAPPIREDDI N,MARTIN L,WHR M.A review on quantitative multiplexed proteomics[J].ChemBioChem,2019,20(10):1210-1224.

[36] CHO K C,CLARK D J,SCHNAUBELT M,et al.Deep proteomics using two dimensional data independent acquisition mass spectrometry[J].Analytical chemistry,2020,92(6):4217-4225.

[37] SANTOS M D M,CAMILLOANDRADE A C,KURT L U,et al.Mixeddata acquisition:Nextgeneration quantitative proteomics data acquisition[J/OL].Journal of proteomics,2020,222[2022-03-17].https://doi.org/10.1016/j.jprot.2020.103803.

[38] BROMILOW S N L,GETHINGS L A,LANGRIDGE J I,et al.Comprehensive proteomic profiling of wheat gluten using a combination of dataindependent and datadependent acquisition[J].Frontiers in plant science,2016,7:1-13.

[39] RIEBEL M,FRONK P,DISTLER U,et al.Proteomic profiling of German Dornfelder grape berries using dataindependent acquisition[J].Plant physiology & biochemistry,2017,118:64-70.

[40] FAN K T,WANG K H,CHANG W H,et al.Application of dataindependent acquisition approach to study the proteome change from early to later phases of tomato pathogenesis responses[J].International journal of molecular medicine,2019,20(4):1-20.

[41] XIE X,YAN Y L,LIU T,et al.Dataindependent acquisition proteomic analysis of biochemical factors in rice seedlings following treatment with chitosan oligosaccharides[J/OL].Pesticide biochemistry and physiology,2020,170[2022-03-17].https://doi.org/10.1016/j.pestbp.2020.104681.

[42] WANG Y L,SANG Z,XU S H,et al.Comparative proteomics analysis of Tibetan hullless barley under osmotic stress via dataindependent acquisition mass spectrometry[J].GigaScience,2020,9(3):1-12.

[43] SUN Y Y,ZOU Y,JIN J,et al.DIAbased quantitative proteomics reveals the protein regulatory networks of floral thermogenesis in Nelumbo nucifera[J].International journal of molecular sciences,2021,22(15):1-19.

[44] WALLEY J W,SARTOR R C,SHEN Z X,et al.Integration of omic networks in a developmental atlas of maize[J].Science,2016,353(6301):814-818.

[45] FABRES P J,COLLINS C,CAVAGNARO T R,et al.A concise review on multiomics data integration for terroir analysis in Vitis vinifera[J].Frontiers in plant science,2017,8:1-8.

[46] GUTIERREZ D B,GANTBRANUM R L,ROMER C E,et al.An integrated,highthroughput strategy for multiomic systems level analysis[J].Journal of proteome research,2018,17(10):3396-3408.

[47] 秦愛,郑晓敏,王坤.基于质谱的植物蛋白质组学研究方法[J].植物科学学报,2018,36(3):470-478.

[48] WANG S B,WEI J L,LI R D,et al.Identification of optimal prediction models using multiomic data for selecting hybrid rice[J].Heredity,2019,123(3):395-406.

[49] ZANDER M,LEWSEY M G,CLARK N M,et al.Integrated multiomics framework of the plant response to jasmonic acid[J].Nature plants,2020,6(3):290-302.

[50] SHRESTHA V,YOBI A,SLATEN M L,et al.Multiomics approach reveals a role of translational machinery in shaping maize kernel amino acid composition[J].Plant physiology,2022,188(1):111-133.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!