2023年11月6日,美国斯克里普斯研究所(Scripps Research Institute)的 Gary Siuzdak 团队在 Nature Methods 上发表了新的文章 METLIN-CCS: an ion mobility spectrometry collision cross section database。
这篇文献介绍了一个名为 METLIN-CCS 的离子迁移谱碰撞截面数据库。该数据库包含了来自离子迁移谱数据的超过27,000种小分子标准的碰撞截面(CCS)值,代表了79个化学类别,为小分子表征和离子迁移谱机器学习提供了独特资源。
METLIN-CCS 数据库
在过去的二十年里,由于大家越来越关注小分子如何直接影响个人和群体健康,代谢组学(metabolomic)和暴露组学(exposomic)的研究大幅增加。这些研究凸显了小分子的潜力,包括主要代谢物、次生代谢物和异生素(xenobiotics)。
尽管质谱(MS)通常是鉴定小分子的首选技术,但正交分析方法对于更可靠的鉴定至关重要。离子迁移谱(ion mobility spectrometry,IMS)的使用近年来因其对色谱、质谱和串联质谱(MS/MS)数据的正交性而增加。离子迁移谱数据通过电场牵引力和与缓冲气体分子碰撞产生的摩擦阻力之间的相互作用来分离离子而生成。由此产生的CCS值提供了一种基于大小的特征,有助于进一步促进实验小分子的鉴定。
METLIN 目前提供了超过900,000个分子标准的实验MS/MS和中性丢失数据。新的可下载 METLIN-CCS 数据库包含了各种分子的CCS值,使研究人员能够比较其实验CCS值,以进行分子鉴定确认。
METLIN-CCS 数据库的设计有三个目的:(1)创建一个包含数千个CCS值的可下载资源,(2)提供一个用于训练机器学习模型的数据基准集,(3)探索每个标准的聚合特性,以提供有关分子离子在源和整个仪器中的行为的信息。
METLIN-CCS 数据库的生成经历要五个步骤。首先,通过对超过30,000种小分子标准进行三重测量,并在正负离子化模式下的成功率达到了90%。这些标准代表了79个不同的分子类别。每个标准最初都通过LabCyte声波沉积法沉积到384孔板中,然后注入到一台Agilent液相色谱和一台 timsTOF Pro 用于氮气缓冲气体中的捕集离子迁移谱(trapped ion mobility spectrometry,TIMS)和四极时间飞行质谱分析。
然后,原始数据加载到 Skyline 中进行CCS计算,由此产生了超过25万个初始CCS值。经过基于三重测量的唯一离子物种具有小于2%的变异系数值的质量控制评估后,保留了185,589个CCS值,对应61,863个独特的分子种和27,633个标准,构成了 METLIN-CCS 数据库。由于目前公开可用的小分子实验生成的CCS值不到5,000个,因此这个数据库的产生是一个重要的贡献。
为了验证实验中获得的 TIMS CCS 值,研究人员将其与先前生成的漂移管离子迁移谱(DTIMS)CCS值进行比较。这种比较很重要,因为DTIMS被认为是CCS值的黄金标准,这是由于DTIMS能够应用多个不同的电场,并根据第一原则确定减少迁移率K0。
由于TIMS采用 trapped and ramping approach,无法应用多个电场,所以需要校准来确定CCS值。DTIMS和TIMS值的比较显示,脂质的平均CCS变化为±1.03%,表明在这些分子类型的两种IMS技术之间存在良好的相关性和相似的CCS值。因此,研究人员进一步评估了使用TIMS获得的所有CCS值。
总体而言,观察到了61,863个独特的分子离子类型,对应于25,919个[M+H]+,17,450个[M+Na]+ 和18,494个[M–H]– 离子,共计27,633个标准。所有离子类型的CCS值形成了两条明显的趋势线,其中3,822个CCS值在顶部趋势线上,其他58,041个在底部趋势线上(图1b)。使用校准离子,他们还观察到顶部趋势线上的离子在IMS分离区域内作为1+或1–二聚体移动,并在IMS分离之后但在检测之前分解为带电的单体离子,这与先前的观察结果相符。
总的来说,可下载的 METLIN-CCS 数据库包含了27,633个分子标准的CCS值(.tsv和.csv格式),数据生成于正负离子化模式(例如[M+H]+、[M+Na]+和[M–H]–)。此外,由于三重测量,来自超过160,000个单独数据集的IMS数据应有助于设计机器学习算法并探索新型分子类型。
论文链接:
https://www.nature.com/articles/s41592-023-02078-5