TCGA线粒体图谱数据库及线粒体基因集介绍
今天主要介绍两个和线粒体有关的数据库,其中一个是基于TCGA数据库构建的The Cancer Mitochondrial Atlas。另外一个是收录了和线粒体有关的基因集的数据库:MITOCARTA3.0。
1. The Cancer Mitochondrial Atlas
我们知道,利用二代测序数据可以检测除了很多和核酸序列有关的数据。之前我们介绍过的基于TCGA的数据来评估肠道微生物的数据库TCMA。对于人类基因组而言,除了染色体具有核苷酸。另外的话,线粒体也包含有核苷酸。因此我们利用TCGA的数据其实也能在一定程度上评价线粒体基因组的变化。因此也就有了这个The Cancer Mitochondrial Atlas (TCMA)这个数据库。
关于这个数据库,主要来自于nature genetics的这篇文章。在这个文章里面。作者使用PCAWG的数据对线粒体基因组的数据进行了整体分析。顺带着,把分析的数据构建了以上那个数据库。
关于这个线粒体基因组数据,里面包括了线粒体基因组突变和拷贝数这些基因组信息的变化。
至于线粒体相关基因的表达,其实都包括了各自肿瘤当中的RNA-seq当中。线粒体基因的命名是MT开头来进行命名的。所以一般MT-XX的都是和线粒体有关的基因。在TCGA当中,一共有37个线粒体相关的基因。
但是,在👆文章的当中,作者是挑选了13个和线粒体有关的基因进行分析。具体选择的标准,就不是很清楚了。
MITOCARTA3.0
MITOCARTA也不能算是一个数据库。这个其实就是一个excel表格。里面包括了人类和老鼠的线粒体蛋白和通路的数据。
我们可以在找到和线粒体有关蛋白和通路。这个数据集包括了1136个和人类线粒体有关的蛋白,1140个和老鼠线粒体有关的蛋白。同时还包括了149个和线粒体有关的通路。
赞 (0)