Diabetes Care | 血浆蛋白组学预测糖尿病的发生

View :1819

♦ 研究背景及简介

Ⅱ型糖尿病的发病机制涉及长期的行为和基因的相互作用,对血浆蛋白质组的详细描述有可能帮助我们更好理解糖尿病发展中的动态变化。之前关于糖尿病风险的蛋白质组学研究主要集中在选定蛋白质和白人群体。在更大队列和多种族人群样本中开展更广泛的蛋白质组学研究应该能够提供更多的见解和更广泛的普遍性。同时,采用发现队列和独立验证队列结合的设计方式,应该会增加新的血浆标志物的识别、潜在分子途径和新的治疗靶点的线索,从而对糖尿病风险预测进行更好的优化。

2023年1月27日,来自美国和新加坡的研究团队在Diabetes Care(IF=17.1),发表题为“Proteomic Predictors of Incident Diabetes: Results From the Atherosclerosis Risk in Communities (ARIC) Study”的研究成果。该研究在8923名中年社区动脉粥样硬化风险(ARIC)研究参与者中,对4955种血浆蛋白质与糖尿病发病的相关性进行了分析和内部队列验证。同时,在新加坡多民族队列(MEC)嵌套病例对照(624名受试者,1214名对照受试者)中对结果进行了外部独立验证。鉴定了47种预测糖尿病发生的血浆蛋白质,建立了3种蛋白质的因果效应,并确定了对诊断和治疗具有潜在意义的糖尿病相关炎症和脂质通路,提高了我们对糖尿病发病机制的更深认识。

图1. 文章标题

实验样本及设计

发现队列:6010名北美社区动脉粥样硬化风险(ARIC)研究参与者(1990-1992);

内部验证队列:2913名ARIC研究参与者(1990-1992);

外部验证队列:外部独立验证队列来自新加坡多民族(MEC)巢式病例对照研究,对照组1214名,糖尿病组624名(2004-2010);

样本类型:血浆样本;

◊研究方法:蛋白质组学。

图2. 本研究方案路线示意图

文章结果

◊糖尿病相关蛋白组的非靶向发现

发现队列的6010例参与者在中位19年的随访中,有1435例确诊为糖尿病患者。在血浆蛋白组学结果中,初步分析有596种蛋白质与糖尿病发生风险相关。在对人口统计学和eGFR进行调整后,有544种蛋白质与糖尿病事件相关。在对生活方式和心脏代谢危险因素进行额外调整后,还有312种蛋白。随着BMI的进一步调整,有140种蛋白与糖尿病风险相关。其中ADIPOQ、SLITRK3、IGFBP2、APOF和HTRA1相关性最大。

图3. 糖尿病风险相关蛋白火山图

◊糖尿病相关蛋白质的内部验证和外部验证

在内部验证样本(n=2913)中,有712例确诊为糖尿病。在发现集鉴定到的140 种蛋白质中,有64种蛋白质在内部验证队列中与糖尿病事件具有统计学意义(P < 0.05/140),其中包括25种已知的与糖尿病事件相关的蛋白质。对于这64种蛋白质,进一步在来自新加坡的外部队列MEC(对照组1214名,糖尿病组624名)中进行了验证。在验证到的63种蛋白质中,有47种与糖尿病事件具有统计学意义,其中包括22种新的和25种已知的糖尿病相关蛋白。

图4. 发现集和验证集比较的散点图

◊糖尿病风险的预测模型

在发现队列的弹性回归模型中,蛋白质数据模型对于20年糖尿病风险预测的C-Statistic为0.718(95%CI 0.704、0.732)。由弹性网络选择的模型4中的27种蛋白质经过协变量(包括空腹血糖和HbA1c)分析后在发现队列的C-Statistic为0.770(95%CI 0.758、0.783)。

在内部验证样本中,预测模型(包括模型4协变量加上27种蛋白质)的判别能力0.731(95%CI 0.711、0.750),超过了模型4协变量的判别(ΔC-Statistic 0.011,P=0.04),但是低于发现队列中的判别能力(C-Statistic 0.770)。

表1. 糖尿病风险预测模型

◊蛋白质通路分析

研究人员采用Ingenuity Pathway Analysis(IPA)通路分析,显示急性期反应信号通路是最重要的生物通路。其它的炎症途径如补体激活、STAT3信号通路、白细胞介素15(IL15)的产生以及脂肪代谢,也是最具代表性的生物途径之一。在上游调控因子分析中,发现促炎性细胞因子IL17a被确定为糖尿病相关蛋白网络的顶级上游调节因子。而另一个顶级上游调节因子是肿瘤坏死因子,它是一种细胞因子和炎症信号的主要调节因子。

◊遗传分析

研究人员通过蛋白组关联分析和全基因组关联分析的双孟德尔随机化分析,确定了模型3中64种蛋白质中的3种SHBG、ATP1B2和GSTA1在糖尿病发病中的因果作用(P<0.05)。

表2. SHBG、ATP1B2和GSTA1在糖尿病发病中的因果作用

◊小结

该研究在两个不同的队列中,经过严格调整后,确定了22种新的和25种与糖尿病发病相关的蛋白质,并通过了内部队列和外部独立队列的验证。提高了糖尿病的风险预测,超过了传统的风险因素和普遍的血糖评估。而通路分析也确定了关键的生物学机制,包括全身炎症和脂质代谢的改变。同时,通过遗传分析确定了三种蛋白质与糖尿病的发生有直接的因果关系。该研究对糖尿病的诊断和治疗具有潜在意义。

文章链接:https://doi.org/10.2337/dc22-1830

♦ 研究背景及简介

Ⅱ型糖尿病的发病机制涉及长期的行为和基因的相互作用,对血浆蛋白质组的详细描述有可能帮助我们更好理解糖尿病发展中的动态变化。之前关于糖尿病风险的蛋白质组学研究主要集中在选定蛋白质和白人群体。在更大队列和多种族人群样本中开展更广泛的蛋白质组学研究应该能够提供更多的见解和更广泛的普遍性。同时,采用发现队列和独立验证队列结合的设计方式,应该会增加新的血浆标志物的识别、潜在分子途径和新的治疗靶点的线索,从而对糖尿病风险预测进行更好的优化。

2023年1月27日,来自美国和新加坡的研究团队在Diabetes Care(IF=17.1),发表题为“Proteomic Predictors of Incident Diabetes: Results From the Atherosclerosis Risk in Communities (ARIC) Study”的研究成果。该研究在8923名中年社区动脉粥样硬化风险(ARIC)研究参与者中,对4955种血浆蛋白质与糖尿病发病的相关性进行了分析和内部队列验证。同时,在新加坡多民族队列(MEC)嵌套病例对照(624名受试者,1214名对照受试者)中对结果进行了外部独立验证。鉴定了47种预测糖尿病发生的血浆蛋白质,建立了3种蛋白质的因果效应,并确定了对诊断和治疗具有潜在意义的糖尿病相关炎症和脂质通路,提高了我们对糖尿病发病机制的更深认识。

图1. 文章标题

实验样本及设计

发现队列:6010名北美社区动脉粥样硬化风险(ARIC)研究参与者(1990-1992);

内部验证队列:2913名ARIC研究参与者(1990-1992);

外部验证队列:外部独立验证队列来自新加坡多民族(MEC)巢式病例对照研究,对照组1214名,糖尿病组624名(2004-2010);

样本类型:血浆样本;

◊研究方法:蛋白质组学。

图2. 本研究方案路线示意图

文章结果

◊糖尿病相关蛋白组的非靶向发现

发现队列的6010例参与者在中位19年的随访中,有1435例确诊为糖尿病患者。在血浆蛋白组学结果中,初步分析有596种蛋白质与糖尿病发生风险相关。在对人口统计学和eGFR进行调整后,有544种蛋白质与糖尿病事件相关。在对生活方式和心脏代谢危险因素进行额外调整后,还有312种蛋白。随着BMI的进一步调整,有140种蛋白与糖尿病风险相关。其中ADIPOQ、SLITRK3、IGFBP2、APOF和HTRA1相关性最大。

图3. 糖尿病风险相关蛋白火山图

◊糖尿病相关蛋白质的内部验证和外部验证

在内部验证样本(n=2913)中,有712例确诊为糖尿病。在发现集鉴定到的140 种蛋白质中,有64种蛋白质在内部验证队列中与糖尿病事件具有统计学意义(P < 0.05/140),其中包括25种已知的与糖尿病事件相关的蛋白质。对于这64种蛋白质,进一步在来自新加坡的外部队列MEC(对照组1214名,糖尿病组624名)中进行了验证。在验证到的63种蛋白质中,有47种与糖尿病事件具有统计学意义,其中包括22种新的和25种已知的糖尿病相关蛋白。

图4. 发现集和验证集比较的散点图

◊糖尿病风险的预测模型

在发现队列的弹性回归模型中,蛋白质数据模型对于20年糖尿病风险预测的C-Statistic为0.718(95%CI 0.704、0.732)。由弹性网络选择的模型4中的27种蛋白质经过协变量(包括空腹血糖和HbA1c)分析后在发现队列的C-Statistic为0.770(95%CI 0.758、0.783)。

在内部验证样本中,预测模型(包括模型4协变量加上27种蛋白质)的判别能力0.731(95%CI 0.711、0.750),超过了模型4协变量的判别(ΔC-Statistic 0.011,P=0.04),但是低于发现队列中的判别能力(C-Statistic 0.770)。

表1. 糖尿病风险预测模型

◊蛋白质通路分析

研究人员采用Ingenuity Pathway Analysis(IPA)通路分析,显示急性期反应信号通路是最重要的生物通路。其它的炎症途径如补体激活、STAT3信号通路、白细胞介素15(IL15)的产生以及脂肪代谢,也是最具代表性的生物途径之一。在上游调控因子分析中,发现促炎性细胞因子IL17a被确定为糖尿病相关蛋白网络的顶级上游调节因子。而另一个顶级上游调节因子是肿瘤坏死因子,它是一种细胞因子和炎症信号的主要调节因子。

◊遗传分析

研究人员通过蛋白组关联分析和全基因组关联分析的双孟德尔随机化分析,确定了模型3中64种蛋白质中的3种SHBG、ATP1B2和GSTA1在糖尿病发病中的因果作用(P<0.05)。

表2. SHBG、ATP1B2和GSTA1在糖尿病发病中的因果作用

◊小结

该研究在两个不同的队列中,经过严格调整后,确定了22种新的和25种与糖尿病发病相关的蛋白质,并通过了内部队列和外部独立队列的验证。提高了糖尿病的风险预测,超过了传统的风险因素和普遍的血糖评估。而通路分析也确定了关键的生物学机制,包括全身炎症和脂质代谢的改变。同时,通过遗传分析确定了三种蛋白质与糖尿病的发生有直接的因果关系。该研究对糖尿病的诊断和治疗具有潜在意义。

文章链接:https://doi.org/10.2337/dc22-1830

问询(英文)

公众号