2月19日,丹麦哥本哈根大学诺和诺德基金会蛋白质研究中心的 Matthias Mann、Simon Rasmussen团队,及诺和诺德基金会基础代谢研究中心的Torben Hansen团队,在 Nature Genetics 发表了一项大规模蛋白质谱研究。
研究利用基于质谱的蛋白组学,系统分析了儿童和青少年血浆蛋白的变异及其遗传调控机制,发现年龄、性别、BMI及遗传因素(特别是pQTLs)显著影响蛋白水平,并揭示了多种蛋白与疾病的因果关系,为精准医学和生物标志物研究提供了新依据。

图1 文章截图
「提纲挈领」
研究用基于质谱的蛋白质组学分析了2,147名儿童和青少年的血浆蛋白,共鉴定出1,216种蛋白,并在1,000名儿童和558名成人中进行了复现。
结果显示,70%的蛋白水平受年龄、性别或BMI影响,超过三分之一的蛋白水平受pQTLs(蛋白质数量性状位点)调控,共发现1,252个pQTL,其中62%为顺式pQTL(cis-pQTL)。
孟德尔随机化分析揭示了345对蛋白-疾病因果关系,其中41个基因与33种心血管代谢疾病相关。pQTL的稳定性在儿童和成人中分别达97%和91%,并可提高疾病预测和生物标志物准确性。
本研究填补了儿童血浆蛋白变异的研究空白,为精准医学和药物开发提供了新思路。
01
发现与复制队列
本研究的发现队列包含2,147名5至20岁的儿童和青少年,其中部分来自普通人群,部分来自丹麦Holbæk儿童肥胖诊所。
为了验证研究结果,研究人员额外纳入了1,000名儿童和青少年,以及558名成年患者和健康对照组。
研究使用数据非依赖性采集(DIA)技术和 Orbitrap Astral 质谱仪对血浆蛋白进行高通量检测,并结合SNP基因分型评估遗传因素、年龄、性别和BMI对血浆蛋白水平的影响。
经过严格的质量控制,最终鉴定出1,216种血浆蛋白,数据完整度达到91%。研究人员还评估了年龄、性别、BMI和520万个SNP对血浆蛋白水平的影响,确保了结果的可靠性和稳定性。

图2 研究概述和蛋白质组学工作流程
02
人口和健康因素对血浆蛋白组的影响
研究发现,58%的血浆蛋白水平受年龄、性别或BMI-SDS(体重指数标准差评分)影响,其中40%与年龄相关,32%与性别相关,22%与BMI-SDS相关。
IGF1等生长相关蛋白在青春期达到峰值后下降,骨骼生长相关蛋白(如ACAN、COL1A1等)在青春期后减少,而炎症相关蛋白(如CRP、补体蛋白C3、急性期蛋白A2M等)在肥胖儿童中水平较高。
此外,研究还发现CD5L和IGHM的性别差异显著,这与女性体内IgM水平较高的现象一致。
研究进一步证明,血浆蛋白可以作为生物年龄和BMI的预测指标,并通过50种蛋白组合,准确预测了个体年龄和BMI。

图3 与年龄、性别和BMI-SDS相关的血浆蛋白
03
SNP对血浆蛋白组的影响
研究测试了520万个SNP与1,216种血浆蛋白的关联,最终鉴定出1,252个pQTLs,影响327种蛋白。
这些遗传变异主要位于非编码区,并以顺式pQTL(cis-pQTLs)为主,表明局部基因调控在血浆蛋白水平变化中的重要性。此外,研究发现25%的pQTLs影响多个蛋白,64%的蛋白受多个pQTLs调控,其中部分pQTLs来自不同染色体。
这些结果强调了遗传因素对血浆蛋白水平的广泛影响,并验证了基于质谱的蛋白组学的高稳定性。

04
血浆蛋白水平的方差分解
研究进一步分析了pQTL、年龄、性别和BMI-SDS对蛋白水平的相对贡献。结果显示pQTLs平均解释了11%的蛋白水平变异,其中63%的蛋白受遗传因素影响大于年龄、性别和BMI-SDS的总和。
此外,通过将队列分为5-9岁、10-14岁和15-20岁三个年龄段,研究发现pQTLs的影响在各个年龄段保持高度稳定(Pearson相关系数0.95-0.98)。
这些结果表明,遗传因素在儿童和青少年的蛋白调控中起着持续作用,并证明基于质谱的蛋白组学能够有效解析蛋白水平的遗传和环境调控因素。
05
pQTL效应大小
研究人员分析了pQTL的效应大小,发现143个pQTL对71种蛋白的影响超过两倍,其中顺式pQTL(cis-pQTL)通常具有更大效应。
此外,错义突变、5′和3′非翻译区变异及转录因子结合位点的效应较强,说明这些区域在蛋白表达调控中的重要性。某些蛋白(如MST1、PROCR、BST1、IL1RAP、APOE和LPA)受遗传变异的显著影响,可能对临床和生物标志物研究具有重要意义。例如,rs2232613-T突变导致LBP水平下降四倍,可能影响先天免疫。
研究强调,在解读临床和生物标志物数据时,应考虑遗传因素对蛋白水平的影响,以提高研究的准确性。
06
整合pQTL与GWAS数据
研究人员将pQTL数据与GWAS关联分析整合,对比35项已发表研究,发现了643个新pQTL,涉及213种蛋白,其中140种蛋白此前未有遗传调控报道。
研究进一步鉴定162个pQTL与疾病相关性状相关。例如,APOB水平降低可能减少非酒精性脂肪肝风险,MASP1水平升高与2型糖尿病相关。此外,APOE-ε4等位基因与阿尔茨海默病和抑郁症相关,可能通过SPTBN4和HTR1D蛋白发挥作用。
通过孟德尔随机化分析,研究揭示了345对蛋白-疾病因果关系,其中101对(41个基因-33种疾病)得到共定位分析验证。
这些结果表明,整合高置信度pQTLs和GWAS数据有助于解析遗传变异如何影响疾病发生,并提供潜在的治疗靶点。
07
pQTL在儿童和成人中的高复现率及稳定性
研究在1,000名儿童和558名成人中验证了pQTL的稳定性,结果显示97%的pQTL在儿童中复现,91%在成人中复现,这表明大多数pQTL的遗传效应不受年龄阶段限制。
此外,pQTL的效应方向和大小在发现队列与复现队列之间高度一致(Pearson’s r = 0.97-0.98)。
研究还进一步探讨了pQTL在生物标志物研究中的应用,发现TGFBI和LBP蛋白的pQTL信息可提高肝纤维化和炎症的诊断准确性。
这些结果表明,pQTL信息可用于优化生物标志物的预测能力,但其具体影响需个别评估。
-
本研究通过大规模的蛋白质谱研究分析了儿童和青少年血浆蛋白的遗传调控因素,发现年龄、性别、BMI及pQTLs等遗传因素显著影响血浆蛋白水平,并鉴定了1,252个pQTLs。研究结果为疾病预测、精准医学和药物靶点发现提供了新的思路。
同时,研究也存在一定局限性,例如横断面设计限制了对个体血浆蛋白随时间变化的观察,以及样本年龄主要集中在12岁,5岁及20岁个体较少,可能影响极端年龄段的结果准确性。
研究人员指出,未来可以通过扩大样本量、开展纵向研究、优化蛋白质谱技术等方向进一步深化研究。