研究方法系列 | 代谢组学原始数据预处理平台XCMS Online
大家在刚开始做代谢组学时往往会遇到第一个难题就是质谱的下机原始数据不会处理的情况,当然很多仪器厂商例如Waters, Thermo, AB都有付费的商业配套软件,不过大多数实验室都没有购买。所有今天我给小伙伴介绍的是免费的原始数据预处理在线平台XCMS Online。首先是它的网址:https://xcmsonline.scripps.edu/landing_page.php?pgcontent=mainPage(建议大家最好用google、edge、火狐浏览器打开,不推荐360)。这是网页打开后的界面,跳动的画面给人的第一映像是不是像星空中的一系列星座连在一起。
言过正传首先当然是注册了,界面里点击Sign Up,当然注册也是非常的简单,一些基本信息填写就可以了,163,QQ邮箱这些都是可以的,没有限制要求。
接下来就是要跟大家讨论的是各个品牌仪器原始数据上传的问题(很重要!!!)XCMS目前支持的文件格式包括:
· mzXML
· mzData
· .cdf NetCDF (AIA/ANDI)
· .d folders (Agilent; Bruker)
· .wiff files (AB SCIEX)
· .RAW folders(Waters)
· .RAW files (Thermo)
当然这已经包含了所有主流的质谱仪器厂家,如果你是其他格式的文件还是可以通过ProteoWizard 软件进行转换具体操作可以参考官方的推荐https://xcmsonline.scripps.edu/docs/fileformats.html不过这个软件我在下载的过程中也遇到问题就是不翻墙下不了。
如果上述准备工作都做好后,恭喜你可以正式开始上传你的数据到XCMS上了。XCMS给每个账户的存储内存是40 GB,对于一般我们的实验完全足够了。接下来数据上传:点击Stored Datasets-Add-DatasetName(更改文件名)(注意:数据需要一组数据设置一个文件名的进行上传!),建议就按照你的药理学分组命名进行上传。建议大家找个网速好的地方进行上传,因为平台的服务器在国外,所以学校内的很多校内网可能上传会非常慢。
数据上传完后接下来就可以进行创建工作然后进行分析了。主要分为三步,包括:第一步:创建一个工作;第二步:选择参数集;第三步:提交。
第一步:创建一个工作,在主界面点击点击Create Job(包含五种分析模式)。我们最常用的是Multigroup,如果想要了解具体的可以查看Help关于这方面的介绍。下一步就是选择你要处理的分组数据了点击Select Dataset,QC组数据也是要上传的并且在QC后面勾选。点击Next.
第二步:选择参数集,点击Parameters,找到你使用的那台仪器型号,XCMS是根据不同仪器会有一个参数优化的。这一步的主要目的是设置原始数据预处理过程中的峰提取、保留时间校正、平滑、面积归一化、注释等一些列操作。当然XCMS对于刚刚接触的小白非常友好,你只需要选择你的仪器品牌和类型,它自动给你配置参数。点击Next.
第三步:提交。这是最后一步了,直接点击提交就好了。提交结束后,你会在邮箱里收到一份XCMS的邮件,说明你任务提交成功。接下来大家就可以安心的等待任务完成的通知了。
接下来数据预处理完后,就可以结果下载了。在主界面点击View Results,可以查看你提交的项目。点击View,就可以简单看到一些PCA,色谱图等信息。直接点击Download Results就可以下载了。
最后下载完的结果包含很多内容,我们最主要需要就是其中关于代谢物色谱峰的面积归一化面积的数列矩阵,就是下图中的XCMS.Diffreport.MultiClass表格。到此代谢组学原始数据处理完成。
总结一下,XCMS Online数据预处理功能还是非常强大,对于刚开始做代谢组学的小伙伴非常友好。当然由于服务器在国外,所以好多时候网络不稳定,这应该是它最大的毛病。最后:科研不易,且行且珍惜,祝大家的科研之路能够一帆风顺。