TCGA甲基化分析数据库
TCGA数据库是一个包括33种癌的各个组学的数据库。我们通过TCGA数据库可以观察每个人的基因表达的变化;甲基化的变化;拷贝数的变化;以及他们的临床信息。MEXPRESS(https://mexpress.be/)是一个可视化TCGA数据库当中患者的临床信息—甲基化—表达之间之间关系的数据库。
输入
这个数据库需要我们输入两个信息。
基因名,我们需要输入想要查询的gene symbol
癌种,我们需要选择想要查询癌症的种类。
然后点击plot
即可。这里我们查询,CDO1
基因在膀胱癌
当中的信息
输出
主要结果
显示的主要结果是一个可视化各个组学信息的热图上。其中最上面的是对于每个信息的注释信息。下面的是具体的结果信息。结果信息包括
临床信息
基因的表达信息
基因的拷贝数变化信息
基因的甲基化位点变化信息。甲基化信息的左边可以看到基因的相关信息包括
基因组长度
;各个不同的转录本
;cg位点的位置
以及CpG岛的位置
默认的样本的排列顺序是按照基因表达量从小到大的顺序排列的。
图中同样给出了默认排序变量和其他变量之间的 统计的结果。具体的统计方法可以查看数据库说明。聚焦
如果我们想要查看某一区域:比如CpG位点
的甲基化变化情况。我们可以用鼠标选上那块区域。然后就可以聚焦查看这段区域的变化了。同样的如果我们想要查看某一个探针的相信信息,直接鼠标点击那个探针即可。
自定义可视化
我们可以通过结果最上面的这个选项可以对可视化的数据进行自定义。主要自定义的内容包括
按照那个变量进行排序:需要注意的是,我们选择那个排序的变量,那么所有的统计结果都会变成和这个排序变量相关的结果
基于某一个类型进行筛选样本。
比如我们想要筛选表达量的样本。那么就可以看到这样一个界面。我们来自己选择即可。
临床性状选择,
我们可以选择想要观察的临床性状
是否显示突变的信息。这个如果选上我们就可以看到基因组上的哪里会有突变
对启动子区高亮。如果选上可以对启动子区产生高亮效果。
甲基化和结果的进一步总结。这里显示的是甲基化和排序变量的总结结果。比如我们排序
性别
.那么就是看不同性别之间甲基化的变化。PS:貌似这个总结只能是二分类的,如果是连续性的变量也会变成二分类来看。
下载,我们可以下载我们自定义好的图片。但是对于数据就没办法下载了。这个如果想要数据还是从TCGA官网下载吧。
数据库总结:
在TCGA数据甲基化分析方面分析而言,这个数据库做的相当可以了。不好的一点就是没有提供数据分析结果下载的地方。这个如果有需要自己下载数据分析吧。数据下载的话, 推荐UCSC XENA吧。