欧米合作|西湖大学罗定存、郭天南团队等利用机器学习对甲状腺乳头状癌进行风险分层

阅读量 :1059

近日,杭州市第一人民医院肿瘤外科罗定存教授团队牵头联合西湖大学生命科学学院郭天南教授团队及青岛大学烟台毓璜顶医院郑海涛教授团队,开展多维度机器学习辅助甲状腺乳头状癌风险分层队列研究取得突破性进展,在国际外科学权威期刊 International Journal of Surgery (IF=15.3)上发表题为 Risk stratification of papillary thyroid cancers using multidimensional machine learning 的研究论文。西湖欧米负责该研究的生信分析工作。

杭州市第一人民医院肿瘤外科罗定存教授为本文主要通讯作者,肿瘤外科助理研究员李远慧博士为第一作者。该工作得到了国家自然科学基金、浙江省基础公益研究计划项目和杭州市医药卫生科技计划重大项目的支持。

研究团队采用机器学习方法,利用蛋白质、基因、免疫和临床这四维度信息成功构建甲状腺乳头状癌术前风险评估分类器(PRAC-PTC),能够良好区分低危和中高危甲状腺乳头状癌患者,并在回顾性和前瞻性研究中有效验证。

图1 论文截图


研究背景

甲状腺乳头状癌(PTC)是目前发病率增长最快的恶性肿瘤,成为公众普遍关注的健康问题。PTC总体预后比较好;然而,同属PTC不同个体间却有着不一样的预后,35-50%PTC患者容易出现转移, 10-20%患者即使积极手术仍然面临复发的风险,更有一些患者无法治愈甚至死亡。

如何准确地对PTC患者进行风险分层,尤其是在术前阶段的评估,目前尚无有效客观评估手段。术前精准评估PTC的风险程度,可为临床精准治疗提供决策依据,指导临床医生采取保守、积极或者激进措施处理低、中和高危PTC患者,从而降低过度治疗或治疗不足。


研究样本及技术方法

研究团队从多中心收集558例PTC临床样本,其中包含发现集(274例FFPE样本)、回顾性验证集(166例FFPE样本)和前瞻性验证集(118例FNA样本)。利用压力循环技术(PCT)及数据非依赖的质谱采集技术(DIA-MS)对FFPE样本和FNA样本进行蛋白质组学测定,构建不同风险PTC蛋白质图谱。

图2 实验设计及蛋白质组学工作流程图


结果1:
蛋白质组学技术揭示不同风险PTC具有差异性蛋白表达

研究团队在PTC组织中鉴定到5774个蛋白。高危和低危PTC的差异表达蛋白(DEPs)分析显示:与低危组相比,高危组鉴定到97个上调DEPs,这些蛋白富集在RAF1突变相关信号,从蛋白水平证明了BRAFV600E突变在PTC发展过程中的重要作用。

图3 PTC样本蛋白质组学分析

 

结果2:
特征选择与PTC术前风险评估分类器(PRAC-PTC)的构建

研究人员收集蛋白质组学、BFAFV600E突变、血液免疫指标以及临床特征,纳入了5790个变量,进行机器学习模型构建。结果表明,使用XGBoost算法筛选出的17个特征变量可达到最佳预测性能,该模型被命名为甲状腺乳头状癌术前风险评估分类器(PRAC-PTC)。进一步经过多中心回顾性队列和前瞻性队列对模型预测效能进行验证。

图4 PRAC-PTC模型构建与验证

 

结果3:
PRAC-PTC评估效能的回顾性验证和前瞻性验证

研究人员对比了PRAC-PTC和不同年资临床医生术前PTC风险评估效能。结果发现,PRAC-PTC诊断性能(准确度、敏感性、特异性等)优于高年资临床医生。进一步,研究人员采用PRAC-PTC辅助临床医生进行PTC风险评估。结果显示,在PRAC-PTC的辅助下,高年资临床医生诊断准确性在回顾性研究和前瞻性研究中分别提升24.6%和25.6%。

图5 PRAC-PTC预测效能评估


总 结

本研究收集PTC患者术前容易获取的临床、免疫、基因和蛋白四个维度信息,通过人工智能构建PTC术前风险评估分类器(PRAC-PTC);经多中心临床验证,本研究所建的PRAC-PTC模型显著提升了临床医生术前PTC风险评估的准确性,在未来有望为PTC患者提供精准的诊疗服务。

文章链接:
https://journals.lww.com/international-journal-of-surgery/fulltext/2024/01000/risk_stratification_of_papillary_thyroid_cancers.40.aspx

 

问询(中文)

公众号