蛋白质谱进展简报|基因预测肿瘤类型;肠道微生物转录特征;结直肠癌;糖皮质激素

View :1232

基于基因组数据的肿瘤类型预测,为临床癌症治疗提供信息

2020年发表在JAMA oncology的文章,描述了一种多标签机器学习应用于肿瘤分类和溯源的方法,该方法旨在从肿瘤样本获取的DNA信息数据中预测肿瘤类型,包括基因alterations和inferred features。

来自凯特琳癌症中心的DNA测序数据,包括7791名病人,囊括22种肿瘤类型的数据被用于训练分类器。通过对训练集和独立测试集做5-fold交叉验证来确定预测精度。为了确保分类器的准确性,在构建每个分类树时,从每种肿瘤中抽取的样本数量相等,并且与最小肿瘤类型样本的80%接近的样本数目。最后使用多项逻辑回归校准分类器的结果。在不平衡的数据集中,使用cohen's kappa替代准确性评估分类器的性能。使用给定的基因特征组合,分类器返回每种肿瘤类型的校准概率。

最终结果为,血浆游离DNA的基因组分析在60例中准确预测了45例(75.0%),141名未知原发部位癌症患者中,预测了95个可能的起源组织,准确率为67.4%,表明基因数据整合多标签机器学习可以应用于包括作为癌症筛查辅助等不同需求场景。
https://jamanetwork.com/journals/jamaoncology/fullarticle/2755639
评述:吕梦葛

宏转录组揭示人类肠道微生物转录特征

剑桥大学 Curtis Huttenhower 团队2018年发表的一篇人类粪便宏转录组文章,该文章分析了来自308个健康人的372个粪便宏转录组和929个宏基因组数据。

他们基于宏转录组数据,确认了在人群中普遍存在(> 80% samples)的metatranscriptome pathwyas,发现这些pathways在不同人中由不同的species表达,并且基于转录组的core pathways与基于基因组的不同。与核心功能相反,“可变”pathways具有species-specific 特点 (e.g., Transcription of cell structure, secondary metabolites and co-factor synthesis pathways for Bacteroides spp.)。

最后,作者利用时间序列数据,发现inter-microbial species interactions(BAnOCC)在粪便菌群生态系统中是稳定的。这篇文章在宏转录组水平初步揭示了人类粪便微生物生态学的核心、个体特异性、微生物特异性和时间可变的转录特征。
https://www.nature.com/articles/s41564-017-0084-4
评述:孙莹莹

♦ 超微量空间组织蛋白质组学研究框架

德国Max Delbrück Centrum for Molecular Medicine in the Helmholtz Association空间蛋白质组学研究组Fabian Coscia团队于2023年05月23日在BioRxiv上发表了 “超微量空间组织蛋白质组学研究框架” 的预印本论文。

作为Matthias Mann团队空间蛋白质组学方法开发的早期成员以及Deep Visual Proteomics (DVP; Nat. Biotechnol., 2022, 40: 1231-1240) 的共同第一作者。Coscia团队针对目前基于激光显微切割(LCM/LMD)所遇到的少量或单个细胞形态学信息维持以及蛋白质鉴定覆盖率不足等问题,开发出了一套稳健且扩展性强的工作流程。这一工作流程主要针对临床FFPE样本,将高内涵成像(QuPath/BIAS),激光显微切割(LMD 7),优化的样本前处理方法以及超高灵敏度质谱(timsTOF SCP)进行了有机的整合。

通过使用该方案,基于timsTOF SCP的高灵敏度性能(与timsTOF pro2相比,针对近单细胞的极微量样本,有177%的肽段与99%的蛋白质鉴定量上的提升),该团队能从单个鼠肝细胞中鉴定到2000个蛋白质,并从50个细胞含量的组织中稳定鉴定到近5000个蛋白质。随后将该方法应用到了人扁桃体中,借助于免疫细胞染色定位,共收集到了146个微区域,平均鉴定到了1952个蛋白质,并在空间水平解析了其异质性。

本工作是继DVP工作的一次方法学的更新,提供了组织水平上单细胞分辨率的样本处理与分析方案。但是由于其处理极微量样本,对于临床FFPE样本处理上的关键问题,如有效的解交联,以及如何同时有效的还原烷基化等没有得到有效的解决;另外,基于LCM/LMD的样本处理上的膜片完整性与样本损耗等问题是技术自身存在的基本问题,也会在一定程度上限制该方法学的应用。
https://doi.org/10.1101/2023.05.13.540426
评述:董振

多物种的蛋白质组学图谱的比较

Mann组2020年在Nature上发表了一篇绘制100个物种蛋白质组图谱的文章。使用高灵敏度质谱结合有别于传统c18填充柱的chip-based色谱方法,作者实现了200万条多肽和34万个蛋白的鉴定。作者发表的数据极大的填补了Uniprot数据库中缺乏实验验证蛋白的空缺,尤其是在细菌和真菌领域。

因为大量物种中的蛋白缺乏注释,物种之间蛋白组的比较显得尤为困难。作者使用EggNOG5.0数据库对检测到的蛋白和肽段进行功能预测并进行注释,得到了物种,蛋白结构和功能之间的关联并且完成可视化。结果发现所有物种中,相当高的比例的蛋白用于蛋白质的稳态和折叠,这凸显了在生命的所有分支中维持蛋白质结构的生物学挑战。

同样,参与能源供应的蛋白比例普遍较高,从光合作用,铁硫代谢到碳水化合物代谢不等。此外,尽管没有进行翻译后修饰富集,使用pFind对数据进行分析仍然得到了大约3万个磷酸化位点。这是第一次大范围跨物种蛋白组的比较。提示蛋白的测序深度和蛋白对整个基因组的覆盖度在跨物种的比较重非常重要,可以大幅度提高数据质量。
https://www.nature.com/articles/s41586-020-2402-x
评述:肖琦

♦ 结直肠癌蛋白质基因组联合分析

2019年5月2日,休斯顿贝勒医学院的Zhang Bing团队首次对结直肠癌前瞻性队列进行了蛋白质基因组联合分析,相关研究发表于Cell

该团队前瞻性地收集了110名结直肠癌(CRC)患者的癌、癌旁组织和血液样本,对癌组织进行了全外显子组测序、拷贝数阵列、RNA测序、microRNA测序、LFQ蛋白质组数据采集,并对癌和癌旁进行了TMT标记的蛋白质组以及磷酸化蛋白质组数据采集,前所未有的多维度信息表征以及联合分析,揭示了Rb磷酸化是结直肠癌的致癌驱动力和潜在的治疗靶点,表明了糖酵解是克服微卫星不稳定性高(MSI-H)肿瘤对免疫检查点阻断的潜在耐药性靶点。

该项研究结果证实了蛋白质基因组整合在发现新型癌症生物学方面的价值,并进一步证明了蛋白质基因组学在治疗假设生成中的效用。
https://www.sciencedirect.com/science/article/pii/S0092867419302922?via%3Dihub
评述:李薇

糖皮质激素促进乳腺癌转移

2019年发表在Nature的论文,题目短小精悍一语中的讲出了核心发现——糖皮质激素促进乳腺癌转移,常用药、发病率高的肿瘤、恶性程度高的肿瘤阶段,以上三点可以体现本研究的重要性。

作者首先对17例肿瘤进行PDX荷瘤,经过培养以后发生多器官转移,然后对不同器官转移的肿瘤进行细胞分选,然后行转录组分析。结果显示了癌症部位特异性表型和远处转移中糖皮质激素受体(GR)活性的增加相关。

进一步,作者用地塞米松对MDA-MB 231细胞的在体外、体内进行验证,分别采取shRNA敲低GR的表达或者GR的拮抗剂进行竞争性抑制,确定GR激活导致预期的GR靶基因的表达,这在地塞米松停药后是可逆的。

接下来作者模拟了临床治疗方案,紫杉醇或者紫杉醇+地塞米松,通过裸鼠成瘤实验进一步证明地塞米松增强了转移,降低了小鼠的总体存活率。此外,作者通过双光子活体成像回答了GR信号是否也影响原发肿瘤的生长的问题。

后面作者通过蛋白质组学、磷酸化蛋白质组学方法分析了GR激活与不激活的差异蛋白,结合转录组数据,作者锚定到ROR1蛋白,该蛋白在前期他人的研究已经证明过与乳腺癌相关(注意:这里没有因为被报道相关而削弱文章的发现)。然后作者再次使用shRNA敲低ROR1观察肿瘤大小和生存。最后证明GR激活后增加的肿瘤转移定植是通过ROR1介导的。
https://www.nature.com/articles/s41586-019-1019-4
评述:孙耀庭

人体口腔和肺部微生物组的关联分析

2016年4月来自New York University School of Medicine的Michael D. Weiden团队通过对口腔微生物组与肺微生物组的关联分析揭示了微生物对肺器官炎症反应的影响。

作者基于49例BALF样本进行微生物16S rRNA测序分析并对微生物功能进行解析,基于加权UniFrac的PCoA结果表明肺BAL样品可以分为两簇:SPT型和BPT型。

通过多种方法(其中LEfSe、STAMP对微生物功能富集,基于SparCC的功能共线性分析)发现肺SPT型表现为一类特殊的炎性细胞因子(Th-17淋巴细胞)升高,同时肺SPT型表现出下呼吸道细胞免疫反应,基于微生物群和功能分析特征揭示呼吸道菌群对肺粘膜表面炎症反应的影响,为后续口腔和肺部疾病之间的关系研究提供了有益借鉴。 
https://www.nature.com/articles/nmicrobiol201631
评述:崔国杰

高级别浆液性卵巢癌预后模型

2023年3月国立首尔大学的Marie Lee组发表在MCP的文章: Proteomic Discovery of Plasma Protein Biomarkers and Development of Models Predicting Prognosis of High-Grade Serous Ovarian Carcinoma。

作者收集分析了20个初诊为高级别浆液性卵巢癌(HGSOC)病人的血浆样本作为discovery cohort, 把他们根据无进展生存期(PFS)分成了两组:良好预后组(PFS ≥ 18个月,n=10)和不良预后组(PFS < 18个月, n=10)。

他们对血浆样本采用溶液内两步酶解法进行制备后跑90min的BoxCar方法(QE-HFX,90min gradient),一共鉴定到了1912个蛋白,定量了1082个protein groups。他们通过差异表达分析找到了96 个在两组间有显著上下调的蛋白,然后通过p值校正和比对之前做的HGSOC组织蛋白组学研究的结果选出了18个蛋白。根据对应的ELISA能否买到和检测到蛋白,他们选出了6个蛋白在HGSOC独立验证队列(n=202)上做ELISA验证,发现其中两个蛋白显著与PFS相关且与discovery上的结果一致。

最后,他们在5个蛋白(去掉一个ELISA结果和discovery蛋白质组结果冲突的蛋白)和3个临床的信息(年龄,FIGO, 残余病灶)中用stepwise selection进一步选出了4个特征在验证队列上建立预测18个月PFS的模型, AUC可达到0.779。

本文结合和蛋白组发现标志物和ELISA验证两部分,在血液中找出了两个显著和预后相关蛋白,建立了方便转化的PFS预测模型,但模型还需在新的队列上验证
https://www.sciencedirect.com/science/article/pii/S1535947623000117
评述:岳靓

基于基因组数据的肿瘤类型预测,为临床癌症治疗提供信息

2020年发表在JAMA oncology的文章,描述了一种多标签机器学习应用于肿瘤分类和溯源的方法,该方法旨在从肿瘤样本获取的DNA信息数据中预测肿瘤类型,包括基因alterations和inferred features。

来自凯特琳癌症中心的DNA测序数据,包括7791名病人,囊括22种肿瘤类型的数据被用于训练分类器。通过对训练集和独立测试集做5-fold交叉验证来确定预测精度。为了确保分类器的准确性,在构建每个分类树时,从每种肿瘤中抽取的样本数量相等,并且与最小肿瘤类型样本的80%接近的样本数目。最后使用多项逻辑回归校准分类器的结果。在不平衡的数据集中,使用cohen's kappa替代准确性评估分类器的性能。使用给定的基因特征组合,分类器返回每种肿瘤类型的校准概率。

最终结果为,血浆游离DNA的基因组分析在60例中准确预测了45例(75.0%),141名未知原发部位癌症患者中,预测了95个可能的起源组织,准确率为67.4%,表明基因数据整合多标签机器学习可以应用于包括作为癌症筛查辅助等不同需求场景。
https://jamanetwork.com/journals/jamaoncology/fullarticle/2755639
评述:吕梦葛

宏转录组揭示人类肠道微生物转录特征

剑桥大学 Curtis Huttenhower 团队2018年发表的一篇人类粪便宏转录组文章,该文章分析了来自308个健康人的372个粪便宏转录组和929个宏基因组数据。

他们基于宏转录组数据,确认了在人群中普遍存在(> 80% samples)的metatranscriptome pathwyas,发现这些pathways在不同人中由不同的species表达,并且基于转录组的core pathways与基于基因组的不同。与核心功能相反,“可变”pathways具有species-specific 特点 (e.g., Transcription of cell structure, secondary metabolites and co-factor synthesis pathways for Bacteroides spp.)。

最后,作者利用时间序列数据,发现inter-microbial species interactions(BAnOCC)在粪便菌群生态系统中是稳定的。这篇文章在宏转录组水平初步揭示了人类粪便微生物生态学的核心、个体特异性、微生物特异性和时间可变的转录特征。
https://www.nature.com/articles/s41564-017-0084-4
评述:孙莹莹

♦ 超微量空间组织蛋白质组学研究框架

德国Max Delbrück Centrum for Molecular Medicine in the Helmholtz Association空间蛋白质组学研究组Fabian Coscia团队于2023年05月23日在BioRxiv上发表了 “超微量空间组织蛋白质组学研究框架” 的预印本论文。

作为Matthias Mann团队空间蛋白质组学方法开发的早期成员以及Deep Visual Proteomics (DVP; Nat. Biotechnol., 2022, 40: 1231-1240) 的共同第一作者。Coscia团队针对目前基于激光显微切割(LCM/LMD)所遇到的少量或单个细胞形态学信息维持以及蛋白质鉴定覆盖率不足等问题,开发出了一套稳健且扩展性强的工作流程。这一工作流程主要针对临床FFPE样本,将高内涵成像(QuPath/BIAS),激光显微切割(LMD 7),优化的样本前处理方法以及超高灵敏度质谱(timsTOF SCP)进行了有机的整合。

通过使用该方案,基于timsTOF SCP的高灵敏度性能(与timsTOF pro2相比,针对近单细胞的极微量样本,有177%的肽段与99%的蛋白质鉴定量上的提升),该团队能从单个鼠肝细胞中鉴定到2000个蛋白质,并从50个细胞含量的组织中稳定鉴定到近5000个蛋白质。随后将该方法应用到了人扁桃体中,借助于免疫细胞染色定位,共收集到了146个微区域,平均鉴定到了1952个蛋白质,并在空间水平解析了其异质性。

本工作是继DVP工作的一次方法学的更新,提供了组织水平上单细胞分辨率的样本处理与分析方案。但是由于其处理极微量样本,对于临床FFPE样本处理上的关键问题,如有效的解交联,以及如何同时有效的还原烷基化等没有得到有效的解决;另外,基于LCM/LMD的样本处理上的膜片完整性与样本损耗等问题是技术自身存在的基本问题,也会在一定程度上限制该方法学的应用。
https://doi.org/10.1101/2023.05.13.540426
评述:董振

多物种的蛋白质组学图谱的比较

Mann组2020年在Nature上发表了一篇绘制100个物种蛋白质组图谱的文章。使用高灵敏度质谱结合有别于传统c18填充柱的chip-based色谱方法,作者实现了200万条多肽和34万个蛋白的鉴定。作者发表的数据极大的填补了Uniprot数据库中缺乏实验验证蛋白的空缺,尤其是在细菌和真菌领域。

因为大量物种中的蛋白缺乏注释,物种之间蛋白组的比较显得尤为困难。作者使用EggNOG5.0数据库对检测到的蛋白和肽段进行功能预测并进行注释,得到了物种,蛋白结构和功能之间的关联并且完成可视化。结果发现所有物种中,相当高的比例的蛋白用于蛋白质的稳态和折叠,这凸显了在生命的所有分支中维持蛋白质结构的生物学挑战。

同样,参与能源供应的蛋白比例普遍较高,从光合作用,铁硫代谢到碳水化合物代谢不等。此外,尽管没有进行翻译后修饰富集,使用pFind对数据进行分析仍然得到了大约3万个磷酸化位点。这是第一次大范围跨物种蛋白组的比较。提示蛋白的测序深度和蛋白对整个基因组的覆盖度在跨物种的比较重非常重要,可以大幅度提高数据质量。
https://www.nature.com/articles/s41586-020-2402-x
评述:肖琦

♦ 结直肠癌蛋白质基因组联合分析

2019年5月2日,休斯顿贝勒医学院的Zhang Bing团队首次对结直肠癌前瞻性队列进行了蛋白质基因组联合分析,相关研究发表于Cell

该团队前瞻性地收集了110名结直肠癌(CRC)患者的癌、癌旁组织和血液样本,对癌组织进行了全外显子组测序、拷贝数阵列、RNA测序、microRNA测序、LFQ蛋白质组数据采集,并对癌和癌旁进行了TMT标记的蛋白质组以及磷酸化蛋白质组数据采集,前所未有的多维度信息表征以及联合分析,揭示了Rb磷酸化是结直肠癌的致癌驱动力和潜在的治疗靶点,表明了糖酵解是克服微卫星不稳定性高(MSI-H)肿瘤对免疫检查点阻断的潜在耐药性靶点。

该项研究结果证实了蛋白质基因组整合在发现新型癌症生物学方面的价值,并进一步证明了蛋白质基因组学在治疗假设生成中的效用。
https://www.sciencedirect.com/science/article/pii/S0092867419302922?via%3Dihub
评述:李薇

糖皮质激素促进乳腺癌转移

2019年发表在Nature的论文,题目短小精悍一语中的讲出了核心发现——糖皮质激素促进乳腺癌转移,常用药、发病率高的肿瘤、恶性程度高的肿瘤阶段,以上三点可以体现本研究的重要性。

作者首先对17例肿瘤进行PDX荷瘤,经过培养以后发生多器官转移,然后对不同器官转移的肿瘤进行细胞分选,然后行转录组分析。结果显示了癌症部位特异性表型和远处转移中糖皮质激素受体(GR)活性的增加相关。

进一步,作者用地塞米松对MDA-MB 231细胞的在体外、体内进行验证,分别采取shRNA敲低GR的表达或者GR的拮抗剂进行竞争性抑制,确定GR激活导致预期的GR靶基因的表达,这在地塞米松停药后是可逆的。

接下来作者模拟了临床治疗方案,紫杉醇或者紫杉醇+地塞米松,通过裸鼠成瘤实验进一步证明地塞米松增强了转移,降低了小鼠的总体存活率。此外,作者通过双光子活体成像回答了GR信号是否也影响原发肿瘤的生长的问题。

后面作者通过蛋白质组学、磷酸化蛋白质组学方法分析了GR激活与不激活的差异蛋白,结合转录组数据,作者锚定到ROR1蛋白,该蛋白在前期他人的研究已经证明过与乳腺癌相关(注意:这里没有因为被报道相关而削弱文章的发现)。然后作者再次使用shRNA敲低ROR1观察肿瘤大小和生存。最后证明GR激活后增加的肿瘤转移定植是通过ROR1介导的。
https://www.nature.com/articles/s41586-019-1019-4
评述:孙耀庭

人体口腔和肺部微生物组的关联分析

2016年4月来自New York University School of Medicine的Michael D. Weiden团队通过对口腔微生物组与肺微生物组的关联分析揭示了微生物对肺器官炎症反应的影响。

作者基于49例BALF样本进行微生物16S rRNA测序分析并对微生物功能进行解析,基于加权UniFrac的PCoA结果表明肺BAL样品可以分为两簇:SPT型和BPT型。

通过多种方法(其中LEfSe、STAMP对微生物功能富集,基于SparCC的功能共线性分析)发现肺SPT型表现为一类特殊的炎性细胞因子(Th-17淋巴细胞)升高,同时肺SPT型表现出下呼吸道细胞免疫反应,基于微生物群和功能分析特征揭示呼吸道菌群对肺粘膜表面炎症反应的影响,为后续口腔和肺部疾病之间的关系研究提供了有益借鉴。 
https://www.nature.com/articles/nmicrobiol201631
评述:崔国杰

高级别浆液性卵巢癌预后模型

2023年3月国立首尔大学的Marie Lee组发表在MCP的文章: Proteomic Discovery of Plasma Protein Biomarkers and Development of Models Predicting Prognosis of High-Grade Serous Ovarian Carcinoma。

作者收集分析了20个初诊为高级别浆液性卵巢癌(HGSOC)病人的血浆样本作为discovery cohort, 把他们根据无进展生存期(PFS)分成了两组:良好预后组(PFS ≥ 18个月,n=10)和不良预后组(PFS < 18个月, n=10)。

他们对血浆样本采用溶液内两步酶解法进行制备后跑90min的BoxCar方法(QE-HFX,90min gradient),一共鉴定到了1912个蛋白,定量了1082个protein groups。他们通过差异表达分析找到了96 个在两组间有显著上下调的蛋白,然后通过p值校正和比对之前做的HGSOC组织蛋白组学研究的结果选出了18个蛋白。根据对应的ELISA能否买到和检测到蛋白,他们选出了6个蛋白在HGSOC独立验证队列(n=202)上做ELISA验证,发现其中两个蛋白显著与PFS相关且与discovery上的结果一致。

最后,他们在5个蛋白(去掉一个ELISA结果和discovery蛋白质组结果冲突的蛋白)和3个临床的信息(年龄,FIGO, 残余病灶)中用stepwise selection进一步选出了4个特征在验证队列上建立预测18个月PFS的模型, AUC可达到0.779。

本文结合和蛋白组发现标志物和ELISA验证两部分,在血液中找出了两个显著和预后相关蛋白,建立了方便转化的PFS预测模型,但模型还需在新的队列上验证
https://www.sciencedirect.com/science/article/pii/S1535947623000117
评述:岳靓
问询(英文)

公众号