7月10日,Biogen的研究团队与爱丁堡大学学者共同在 Nature Aging 发文,利用英国生物银行(UK Biobank)中的蛋白质水平数据,研究人员评估了这些蛋白质与23种年龄相关疾病及死亡率的关系。
图1 论文截图
- 提纲挈领 -
研究利用UK Biobank数据,分析了47,600名年龄在40至70岁之间的个体的1,468种血浆蛋白质水平,发现963种蛋白质与21种疾病(如2型糖尿病、COPD、阿尔茨海默病等)和全因死亡率有3,209个显著关联。通过Cox回归模型开发的ProteinScore在预测10年内疾病发生风险方面表现优异,尤其在2型糖尿病风险评估中,ProteinScore的AUC值为0.89,显著优于HbA1c(0.85)和多基因风险评分(0.68),显示了蛋白质在疾病风险分层中的巨大潜力。
结果1:
蛋白质与事件结果的关联
研究发现,不同的血浆蛋白水平与23种疾病(包括导致残疾和健康预期寿命缩短的主要原因)和全因死亡率的发生有关。
在调整年龄和性别后,共发现1,211种独特蛋白与23种结果之间有5,273个显著关联;进一步调整健康和生活方式因素后,发现963种独特蛋白与21种结果有3,209个显著关联。
54种蛋白与八种或更多疾病显著相关,其中生长分化因子15(GDF15)与11种疾病相关。敏感性分析显示,这些关联在10年和5年的随访中大多仍然显著。进一步分析还考察了药物使用对结果的影响,发现大部分蛋白与缺血性心脏病的关联在调整药物使用后仍然显著。
图2 英国生物银行中单个蛋白质与事件结果的关联(n=47,600)
结果2:
ProteinScore的开发
研究人员开发了ProteinScores并评估了它们在19种疾病中的性能(每种疾病至少有150个事件病例)。
ProteinScore的AUC值在多种情况下优于或等同于最大集合的26个协变量。六种疾病(包括2型糖尿病、COPD、死亡、阿尔茨海默病、缺血性心脏病和帕金森病)的ProteinScore在包括所有协变量的模型中仍显著提高了预测性能。
结果3:
ProteinScore对2型糖尿病的探索
研究人员以2型糖尿病为案例对ProteinScore进行探索。
通过比较ProteinScore与糖化血红蛋白A1c(HbA1c)在测试样本中的表现,研究人员发现ProteinScore在预测10年内发病的2型糖尿病方面表现优异(AUC=0.89),优于单独使用HbA1c(AUC=0.85)和PRS(多基因风险评分)(AUC=0.68)。
ROC模型比较显示,将ProteinScore与HbA1c结合使用显著提高了预测性能(ROC P<0.0026)。这些结果表明了ProteinScore在2型糖尿病风险评估中的重要性。
图3 ProteinScore对2型糖尿病的探索
结果4:
代谢组评分比较
在对比代谢组学和蛋白质组学特征生成的评分时,研究人员选择了2型糖尿病和全因死亡率进行分析。共有12,050人拥有蛋白质和代谢组学数据。
结果显示,ProteinScore在全因死亡率的预测中(AUC=0.82)优于MetaboScore(AUC=0.69),而两者结合的MetaboProteinScore表现最佳(AUC=0.83)。
在2型糖尿病的预测中,ProteinScore(AUC=0.87)和MetaboScore(AUC=0.85)表现相当,结合后的MetaboProteinScore表现最佳(AUC=0.89)。
总 结
通过大规模蛋白质分析,研究揭示了多种年龄相关疾病的早期生物标志物,并开发了有效的风险评分模型(ProteinScore),显示出蛋白质在疾病风险分层中的巨大潜力。
研究结果表明,结合多种蛋白质数据可以显著提高疾病风险预测的精度,甚至在疾病正式诊断前十年就能提供有价值的风险评估。
特别是,在2型糖尿病和全因死亡率的风险评估中,ProteinScore的表现优于传统的临床标志物和多基因风险评分。研究还强调了蛋白质和代谢组数据结合使用的潜力,为未来的多组学数据整合提供了有价值的参考。