Nat Methods|SpatialGlue:融合多组学数据和空间信息的高分辨率组织解析新方法

阅读量 :549

6月21日,新加坡科技研究局(A*STAR)分子与细胞生物学研究院(IMCB)的研究人员与合作团队在 Nature Methods(IF:36.1)发表 Deciphering spatial domains from spatial multi-omics with SpatialGlue 一文,介绍了空间多组学数据分析工具SpatialGlue。

图1 论文截图

- 提纲挈领 -

文章提出了一个名为 SpatialGlue 的图神经网络(GNN)模型,可通过整合蛋白质组学在内的多组学数据和空间信息更高分辨率地解析组织样本的空间域。通过一系列实验,SpatialGlue 展示了在模拟数据和实验数据上的优越性能,包括在人类淋巴结和小鼠脑组织等数据集上超越了现有的多种方法。该模型通过双重注意力机制,在不同组学和空间信息之间进行有效的权重分配,从而准确地标记和分离不同的细胞类型和解剖结构。实验结果表明,SpatialGlue 在多个评价指标上(如Moran’s I和Jaccard相似度)均优于其他方法,并在多组学数据整合和空间域解析中表现出更高的准确性和稳定性。

 

随着空间组学技术的发展,现在可以从同一组织切片中获取多种类型的数据。要充分利用这些数据,需要空间信息化的数据整合方法。目前只有少数方法(如MEFISTO)尝试整合空间多组学数据,但这些方法的应用范围有限。其他方法主要针对单一模式或不考虑空间信息,难以处理多组学数据的重要性差异。

研究展示了 SpatialGlue 在不同组织类型和技术中的应用,捕捉了更多解剖细节,并更准确地解析了如大脑皮层层等空间域。此外,SpatialGlue还能识别出原始数据中未标注的细胞类型,如脾脏中的巨噬细胞子集。该方法能扩展至更大规模数据,适用于三种组学模式的整合,提供了细胞和组织特性的全面视图。

 

SpatialGlue模型结构及工作原理

SpatialGlue模型是一种基于图神经网络(GNN)的深度学习模型,能够通过整合多组学数据和空间信息,以更高的分辨率解析组织样本的空间域。模型的输入数据可以是细胞或捕获位置(beads, voxels, pixels, bins or spots)的特征矩阵,以及相应的空间坐标。

模型在整合数据时,首先在组学内部和空间信息内进行注意力机制,然后在组学之间进行整合。SpatialGlue使用空间坐标和组学数据在每个组学内学习低维嵌入,通过构建空间邻近图和特征相似图来捕捉细胞异质性。

在组学内部和组学之间,使用注意力聚合层来整合图特定表示,生成最终的跨组学整合表示。随后,可以使用聚类方法识别生物学上相关的空间域,这些空间域由在空间上和测量的组学上都一致的细胞组成。

图2 用于空间多组学数据分析的可解释深度双重注意力模型


结果1:
SpatialGlue与现有方法的对比

研究介绍了SpatialGlue模型在模拟和实验空间多组学数据上的基准测试情况。通过使用有真实标签的模拟数据和实验数据,研究人员对比了SpatialGlue与其他七种方法(如Seurat、totalVI、MOFA+等)的性能。实验表明,SpatialGlue在所有指标上表现最佳,并能够清晰恢复所有空间因子,而其他方法恢复部分因子时存在较高噪声。

此外,SpatialGlue在多模态扩展性方面表现良好。在人体淋巴结数据集上,SpatialGlue同样表现优异,能够有效识别不同区域,并在各种指标上超过其他方法。

总体而言,SpatialGlue展示了其在多组学数据整合和空间域解析上的显著优势和稳定性。

 

结果2:
小鼠大脑解剖结构解析

研究人员应用SpatialGlue模型分析了小鼠大脑表观基因组及转录组数据,展示了其在分辨空间域方面优于原始研究方法。

首先,使用空间ATAC-RNA-seq数据集,结合Allen人脑图谱进行解剖区域注释。SpatialGlue能够清晰地捕捉解剖结构并区分更多皮层层次,表现优于Seurat等对比方法,并在Moran’s I得分和Jaccard相似性上表现最佳。

随后,研究人员使用RNA-seq和CUT&Tag数据进行类似分析,结果显示SpatialGlue再次捕捉到主要结构且噪声最少。

进一步分析显示,SpatialGlue有效整合各模态信息,识别出已知标志性基因和组蛋白修饰峰值,成功生成生物相关性高的聚类,展示其在多模态信息结合方面的优势。

图3 SpatialGlue 以更高的分辨率解剖空间表观基因组转录组小鼠大脑样本

 

结果3:
解析小鼠胸腺结构和脾脏巨噬细胞亚群

研究人员展示了SpatialGlue模型在多种技术平台上的广泛适用性,通过应用于Stereo-CITE-seq和SPOTS获取的数据,准确解析了小鼠胸腺结构和脾脏巨噬细胞亚群。

首先,利用Stereo-CITE-seq分析小鼠胸腺数据,捕获了mRNA和蛋白质的亚细胞分辨率,展示了胸腺中皮质和髓质的清晰区分,SpatialGlue在分离皮质-髓质交界和不同皮质层面上表现优越。

在小鼠脾脏数据集中,研究人员使用了SPOTS技术捕获的蛋白质和转录组数据进行分析。通过聚类分析揭示了丰富的B细胞、T细胞和巨噬细胞亚群,其中SpatialGlue在保持距离保真度和Jaccard相似度上表现最佳,成功识别出了未被原始研究注释的巨噬细胞亚群。

进一步分析显示,SpatialGlue利用其学习到的模态权重有效地整合了RNA和蛋白质数据,帮助区分和注释了各种细胞群集和标志物表达模式,从而为探索细胞类型间的空间关系提供了深入见解。

图4 SpatialGlue 准确整合了来自小鼠胸腺(使用Stereo-CITE-seq获取的RNA和蛋白质)和小鼠脾脏(使用SPOTS获取的RNA和蛋白质)的多模态数据

总 结

总的来说,SpatialGlue模型在整合多组学数据和空间信息方面表现卓越,能够更准确地解析组织样本的空间域和细胞类型,为生物医学研究提供了强有力的工具。

 

文章链接:
https://www.nature.com/articles/s41592-024-02316-4?utm_medium=external_display&utm_source=stork&utm_content=email&utm_term=null&utm_campaign=CONR_JRNLS_AWA1_CN_CNPL_0034V_STKRE

 

问询(中文)

公众号