又一个TCGA可变剪切分析利器
关于 TCGA 数据库当中的可变剪切事件而言,其中最出名的还是 [[TCGA Spliceseq-可变剪切相关数据库]]。在 Spliceseq 数据库当中通过 PSI 这个指标来评价了不同基因转录本的占比情况。但是对于对于不同的变异体而言,我们除了想要知道不同变异体的发生概率之外,有时候还想知道不同外显子的表达情况。所以今天就来介绍一个用来可视化不同剪切变异体外显子表达情况的数据库:TSVdb(http://tsvdb.com/index.html)
背景数据集
既然是叫做 TCGA 可变剪切数据库。那么用到的数据还是TCGA数据库的。
数据库使用
对于这个数据库而言,没有太多的复杂功能。我们只需要选择我们想要分析的癌种和基因即可。例如,我们这里想要分析 TP53基因在乳腺癌里面的可变剪切情况。
选择好相对应的癌种和基因之后,就需要选择进行可视化的类型选择了。在这里有外显子以及连接处两种可视化选择。
在外显子可视化当中,主要是来展示每个不同转录本的外显子的表达情况。而在连接处可视化当中,则是对跨越两个外显子的的位置进行可视化。这里我们,可以选择junction 来观察不同转录本连接处的情况。
除了选择可视化的基因类型之外。还需要选择附属的临床信息,在 TSVdb 当中主要可以选择样本类型,种族,性别,临床分期这些基本的信息以及一些癌症特异性的信息,比如乳腺癌的 ER, PR, Her2这三个受体的状态。
这里我们选择:sampletype来进行可视化。
选择好之后就可以看到一个类似于[[MEXPRESS-TCGA甲基化和表达相关分析]]数据库当中可视化的一个交互式的图形。其中左侧是 TP53 的不同转录本信息,右侧上面是乳腺癌的样本类型,下面则是不同的 TP53的整体表达以及不同转录本连接处在不同样本当中的表达情况。
同时,移动鼠标,可以看到每一个连接处代表的具体那个转录本的什么位置,比如下面这个就代表右边数第三个剪切变异体的第二和第三外显子连接处的表达情况。
进一步,点击某一个具体的转录本,可以观察这个转录本在不同的样本类型当中的整体表达情况。
除了观察基本的表达情况,还可以进行预后 分析。在这个部分,可以自定义cut-off值来观察预后的情况。
最后对于这个数据库可视化的图形,都可以保存为 pdf或者 svg格式来进行展示。另外对于分析的基因的具体数据也可以下载下来。
通过下载,也可以发现这个这个里面包括了TP53不同转录本的总体表达情况,也包括了每一个外显子的表达情况。相对来说还是挺全的
总的来说
以上就是这个数据库具体使用方法了。相对来说还是很简单的。另外关于数据下载而言,这个数据库就只能下载具体某一个基因的外显子表达的数据。如果想要下载所有基因的信息的话,则办不到。如果确实想要分析所有基因外显子的情况。那么可以使用 UCSC Xena 下载相对应的外显子表达情况哈。
具体 UCSC XENA的使用。可以参考: [[3.0 UCSC XENA-泛癌全基因数据分析工具推荐]]; [[3.1 如果使用UCSC XENA寻找基因相关课题]]