使用gtex数据库找组织特异性表达基因

组织特异性表达基因在单细胞领域应用比较广泛,毕竟一下子好几千个细胞的表达量矩阵就出来了,通过降维聚类,可以拿到不同的亚群,就需要对这些亚群进行生物学注释,这个时候,如果我们有人类的每个组织的特异性表达基因列表,就很容易操作。

前面其实有粉丝投稿,系统性的介绍了不少工具辅助我们完成这一步细胞亚群功能定位,如下:

单细胞转录组聚类后的细胞类群如何查找数据库来定义

不过我们仍然是可以单独拿出其中一个数据库来探索一下:

关于GTEX数据库

数据量可以说是很可观了,前面我们介绍过很多了:TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手

一期

2015年,GTEx发布了第一个阶段性成果,一次性在Science杂志上发表三篇研究成果,该成果还被选为封面文章。GTEx的研究从175名死者身上采集到了1641个尸检样本,这些样本来自54个不同的身体部位,对几乎所有转录基因的基因表达模式进行了观察,从而够确定基因组中影响基因表达的特定区域。另外两篇文章之一从人所有组织中的基因表达谱进行了描述,证明了组织特异性的某些基因往往决定了组织特异性基因的表达调控;另一篇解释了截短的蛋白变异体如何影响组织中的基因表达。

  • The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humans

  • The human transcriptome across tissues and individuals

  • Effect of predicted protein-truncating genetic variants on the human transcriptome

二期

在2017年,一次性在nature发表4篇研究成果,GTEx研究联盟的研究收集并研究了来自449名生前健康的人类捐献者的7000多份尸检样本,涵盖44个组织(42种不同的组织类型),包括31个实体器官组织、10个脑分区、全血、两个来自捐献者血液和皮肤的细胞系,作者利用这些样本研究基因表达在不同组织和个体中有何差异。题为“Landscape of X chromosome inactivation across human tissues”和“Dynamic landscape and regulation of RNA editing in mammals”的论文,采用GTEx数据探讨了与基因表达相关联的基因变异如何能够调节RNA编辑和X染色体失活现象。

top 50 表达基因功能

我看到:https://gtexportal.org/home/topExpressedGenePage 可以搜索,比如我搜索大脑的最高表达量基因,发现它的确可以把大脑区域和身体其它区域很容易的分开,如下:

不过,问题是这样的分类并不精细,因为脑部区域也是很复杂的,当然,如果你自己写代码,就更容易掌控各种选项了。

(0)

相关推荐