Nature 三连发:UK Biobank 大队列血液蛋白组学

View :2436

10月4日,Nature 一口气连发三篇血液蛋白组学新论文,轻轻敲醒黄金周期间科研er沉睡的心灵……

 

这三篇研究,分别探究了罕见变异(rare variants)与人体血浆蛋白丰度之间的关联、高通量蛋白质组学平台(SomaLogic 和 Olink)与基因组学数据的结合,以及血浆蛋白质组与基因和健康之间的关系。

这些都是极具代表性的大队列血浆蛋白组学研究,有学者甚至称此次 “三连发” 为人类血浆蛋白日(human plasma-protein day)!

 

8月份,我们盘点过Cell及其子刊的蛋白组学 “四连发”:Cell等四篇连发|癌症解谜:蛋白质组与基因组共舞。CPTAC(美国临床蛋白质组学肿瘤分析联盟)在 Cell、Cancer Cell 共发表了4篇关于癌症研究的论文(3篇article和1篇perspective),共同强调了多组学方法在深入理解癌症发生机制、疾病特征以及潜在治疗途径方面的重要性。

 

1 Rare variant associations with plasma protein levels in the UK Biobank

该研究的主要内容是探究罕见变异(rare variants)与人体血浆蛋白丰度之间的关联。论文主要利用了英国生物样本库(UK Biobank)的数据,该库包括了来自 54,219 名参与者的血浆样本,其中涉及了 2,923 种不同的蛋白质。作者通过对这些数据进行基因组学和蛋白质组学的整合分析,揭示了罕见变异与血浆蛋白质丰度之间的关系。

通过对 49,736 名参与者的数据进行分析,研究发现了 5,433 个罕见变异与血浆蛋白质丰度之间的关联。这些关联中有 81% 在之前的同一研究群体中的常见变异研究中未被发现。

对基因水平的分析发现,有 1,962 个基因与特定蛋白质的丰度存在关联。其中,691 个基因与蛋白截断变异(protein-truncating variants)相关,其中 99.4% 的关联表明这些变异与蛋白质水平降低有关。

 

基因水平的变异集合分析(collapsing analyses)

研究者进行了变异水平的广泛分析,发现了 151,491 个显著的基因型-蛋白质关联。这其中包括了 5,433 个罕见变异(MAF ≤ 0.1%)与血浆蛋白质丰度之间的关联。这表明,相较于常见变异,罕见变异在影响血浆蛋白质水平上具有更大的生物学效应。研究发现了 STAB1 和 STAB2 两个基因,它们编码的受体与血浆蛋白清除有关,与多个蛋白质存在关联,具有多效性。

论文的主要发现之一是,罕见变异在血浆蛋白质丰度中扮演着重要角色,而这在之前的研究中很少被认识到。这些罕见变异的关联通常比常见变异更为明显,因此更容易解释和理解。论文还强调了该研究在药物发现和临床应用方面的潜力。通过了解罕见变异如何影响特定蛋白质的水平,研究者为新药物的研发提供了线索。

总的来说,这项研究揭示了罕见变异在血浆蛋白质丰度中的重要作用,为了解疾病机制、寻找临床生物标志物和药物靶点提供了重要线索。该研究还提供了一个公开可访问的资源,可以帮助研究人员进行进一步的研究和发现。

论文链接:
https://www.nature.com/articles/s41586-023-06547-x

 

2 Large-scale plasma proteomics comparisons through genetics and disease associations

高通量蛋白质组学平台的发展使得我们能够测量大量的血浆蛋白质,从而了解蛋白质与基因组和疾病之间的关系。该研究主要探讨了高通量蛋白质组学平台(SomaLogic 和 Olink)与基因组学数据的结合,以及它们在疾病研究中的应用和差异。

该研究使用了来自 UK Biobank 的 50,000 多名参与者的血浆样本,结合基因型和表型数据,进行了 Olink Explore 3072 和 SomaScan v4 两个高通量蛋白质组学平台的关联研究。

 

通过各种检测方法测量蛋白质水平

研究者将参与者按照不同祖源(英国或爱尔兰、非洲和南亚)进行了分层,他们发现了蛋白质水平与特定祖源相关的变异。而且,与蛋白质水平相关的变异在非洲祖源组中的连锁不平衡平均较低,这使得关联信号的定位得以改善。这种跨祖源的信号精细化也有助于提高相关疾病信号的精确性,即使这些疾病仅在一个祖源组中进行研究。

在两个平台上,研究者发现了大量的 cis pQTLs,但是两者之间的顶级关联变异通常不在高度连锁不平衡(LD)。这表明,尽管 cis pQTLs 可以提供血浆蛋白质由特定基因编码的强有力证据,但是它们不能指示测量的是哪种蛋白质亚型。两个平台之间的pQTL差异可能影响研究疾病时蛋白质水平与基因组学数据的整合结果。

这篇论文为我们理解蛋白质水平与基因组和疾病之间关系的复杂性提供了深入的见解。该研究的主要贡献在于,通过比较两个主流高通量蛋白质组学平台的数据,揭示了它们在测量血浆蛋白质水平时存在的异同。这对于疾病研究和药物发现具有重要意义,因为选择不同的平台可能导致截然不同的结论。该研究也指出了在整合蛋白质水平和遗传学数据时需要注意平台之间的差异,以避免误导性的结论。

论文链接:
https://www.nature.com/articles/s41586-023-06563-x

 

3 Plasma proteomic associations with genetics and health in the UK Biobank

这项研究来自 Pharma Proteomics Project,这是一个由 13 家生物制药公司组成的合作项目,旨在分析 54,219 名 UK Biobank 参与者的血浆蛋白质组数据,探索血浆蛋白质组与基因和健康之间的关系。这是迄今为止规模最大的蛋白质组学研究之一。

论文提供了该项目的详细概述,包括技术和生物学验证、对蛋白质组中疾病特征的洞察以及针对各种人口统计和健康指标的预测建模。

 

UKB PPP 概述

该研究使用了基于抗体的邻位延伸分析技术(antibody-based proximity extension assay),这是一种高通量的蛋白质测量方法。相较于以往的研究,该研究具有更大的样本规模和更广泛的蛋白质覆盖范围。

通过对 2,923 种蛋白质进行了全面的蛋白质定量位点(pQTL)映射,研究人员发现了 14,287 个主要的遗传关联,其中 81% 是先前未描述的,这一发现拓宽了我们对蛋白质与基因之间关系的认识。研究还对非欧洲人群进行了独立的遗传关联研究,发现了祖先特异性的蛋白质定量位点(pQTL),为了解不同人群之间的生物学差异提供了线索。

该研究提供了血浆蛋白质组的遗传结构的更新描述,并结合随着样本量和蛋白质组学测量范围随时间增加的预期 pQTL 发现率进行了分析。研究还提供了对跨越多个生物领域的转录 pQTL 的深入洞察,突出了对细胞因子和补体网络等多种蛋白质的结构域-受体相互作用和通路扰动的遗传影响,并揭示了ABO血型和FUT2分泌物状态对具有胃肠组织富集表达的蛋白质的远距离上位效应。

此外,研究还展示了这些数据在药物发现中的效用,扩展了蛋白质靶标的遗传代理效应(例如 PCSK9)对其他终点的影响,并梳理了与 COVID-19 易感性相关的基因和蛋白质在基因座上的特异性。为系统性因果推断和治疗靶点的发现提供了更系统的基础。

论文指出,不同的蛋白质组学技术(抗体、适配体、质谱等)可以相互补充,共同揭示蛋白质的多样性和复杂性。随着技术的进步,未来的研究将更加注重蛋白质异构体、后翻译修饰引起的蛋白质形态和单细胞蛋白质组学研究。

这项研究的意义在于,它为我们提供了一个更为全面的人体蛋白质组学图谱。通过深入挖掘蛋白质与基因、疾病和健康之间的关系,研究人员将能够更好地了解生物体内复杂的调控网络。这不仅有助于疾病机制的解析,还为新药物的发现和疾病治疗提供了理论基础。未来,随着技术的不断进步和不同研究领域的融合,我们可以期待更多精彩的研究成果。

论文链接:
https://www.nature.com/articles/s41586-023-06592-6

 

问询(英文)

公众号