KnockTF:转录因子敲除数据库(一)

很多转录因子预测的数据库是基于转录因子的Chip-seq的数据来进行构建的,这样的结果能说明某一个转录因子结合某一段序列,但是结合并不一定说明可能影响这个基因的表达(高通量测序技术极简介绍),所以最好做一个这个转录因子导入/导出的表达数据来说明对于基因表达的影响。。

KnockTF(http://www.licpathway.net/KnockTF/search.php)数据库就是基于这个目的构建的数据库。这个数据库收录了目前公共数据库当中敲减该转录因子后做的表达谱(芯片、二代测序)的数据,进而来反映这个转录因子变化后对于基因表达的影响。

这个数据库主要提供了4个功能: 浏览功能检索功能分析功能下载功能。由于功能比较多我们分两天来分别介绍(其实是偷懒而已)。

浏览功能

我们在浏览功能当中可以看到整个数据库所有的数据分类。左边主要是数据纳入的基本信息,包括数据来自的数据库、样本种类和转录因子;右边是每个数据集的详细信息,包括数据集ID、涉及转录因子、敲除的方式和实验组织等等

我们可以看到数据库主要纳入了GEOENCODE的公共数据。

我们点击数据集的ID号,可以看到这个数据集相关结果。其中包括六个部分的结果。

  1. 是这个数据集当中转录因子的信息,这个数据当中差异变化最大的基因可视化结果:

  1. 这个数据集所有差异基因的结果,默认是按照logFC的绝对值进行排序。由于是敲减的表达谱,变化的基因不一定是受到这个转录因子的影响,也可能是这个转录因子影响别的基因进而影响这个基因变化的。所以为了明确是不是收到这个基因的影响这个数据库也预测了相关基因启动区、超级增强子区、普通增强子区的可能结合的转录因子。如果这里面没有这个转录因子那就可能是连带效应导致的调控了,例如下面的GPR109B。

  1. 这个数据集富集分析的结果: 其中包括GSEA分析GO分析以及KEGG分析。GSEA点击具体的结果还可以看到GSEA分析的图。GO分析和KEGG分析都是啥?

  1. 设计到ESR1上有的通路,这个数据是基于ComPAT数据库来的。

  1. 该数据集的可视化结果:其中包括一个热图和一个散点图。

  1. ESR1在不同组织当中的表达情况,其中包括GTEx正常组织数据集、TCGA癌症数据集、CCLE细胞系数据集、ENCODE细胞系数据。TCGA、ICGC、GTEx 数据库都是啥?

分析功能

分析功能里面,我们可以基于这个数据集进行基本的分析。其中包括亚网络分析以及转录因子富集分析。

亚网络分析

假如我们有一些基因想要寻找这些基因的共调控关系,就可以用这个功能。我们需要数据目标基因即可。这个功能其实类似于ChEA3数据库。

转录因子富集

如果我们有一堆转录因子想看这些转录因子是否收到受到一个转录因子的影响(并不一定是直接调控),可以使用这个功能。我们需要做的就是输入一堆目标基因,然后基于knock down的表达谱数据来看我们这些基因是不是这个数据集的差异表达基因。

今天就介绍了这个数据库的两个功能。明天对于数据库的检索功能,我们继续讲解。

(0)

相关推荐

  • 长盛不衰的研究热点有了超重磅的数据库!

    解螺旋公众号·陪伴你科研的第2563天 全新重磅数据库 不管是研究肿瘤还是非肿瘤的,不管是生物学专业做基础研究的,还是医学专业做疾病机制研究的,只要你还在研究分子机制,转录因子(TF)一定是每个实验汪 ...

  • 分享一篇一周接收的数据库挖掘文章

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO, SEER数据挖掘. image.png 今天要分享的文章发表在研究生之友 Bioc ...

  • 最强攻略5:史上最全转录调控数据库汇总解读

    一.转录因子介绍 转录因子(Transcription factors)是一群能与基因特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子.转录因子通过识别特定的DNA序 ...

  • 1分钟内找出人类的转录因子敲除后的基因表达谱(KnockTF数据库)

    转录因子(Transcription Factor, TF)及其靶基因在人类疾病和生物学过程中起重要作用,转录因子敲降/敲除前后的基因表达谱分析是获得转录因子靶基因.探索转录因子功能的最重要策略之一. ...

  • KnockTF:转录因子敲除数据库(二)

    昨天我们介绍了这个数据库的其中一部分功能 KnockTF:转录因子敲除数据库(一),今天把这个数据库的其它功能介绍完. 检索功能 这个功能提供了四个选项可以让我们进行检索:基于转录因子.基于目标基因. ...

  • dbCoRC:超实用核心转录因子数据库

    在特定的细胞或组织中,发挥作用的转录因子在调控网络中的地位也是不同的.来自胚胎干细胞和其他细胞模型的研究表明,一小组细胞类型特异性或谱系特异性转录因子(TFs)形成了相互连接的自动调节环,以控制特定细 ...

  • TRRUST:转录因子调控网络专用数据库

    转录调控网络(TRN)的重建是人类遗传学中的长期挑战.已经开发出许多计算方法来从高通量数据推断人类转录因子(TF)和靶基因之间的调控相互作用,TRRUST是迄今为止,最大的可公开免费获得的人类TF-靶 ...

  • TransmiR:转录因子-miRNA调控专用数据库

    miRNA是重要的转录后基因表达调控因子,并在各种生物学过程中发挥关键作用.据报道,miRNA的异常调控与多种疾病的发生和发展有关,包括癌症,心血管疾病等.但是潜在的机制仍然难以明确,部分原因是转录因 ...

  • HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子数据库

    HOCOMOCO是专门研究人和小鼠的数据库,团队从超过5000个针对人类和小鼠转录因子的实验中获得的14000多套ChIP-Seq数据集,基于系统化的基序发现和交叉验证,展示了人类和小鼠转录因子结合模 ...

  • hTFtarget:一个神奇的人类转录因子数据库

    转录因子(TFs)可以通过结合其启动子或增强子的特定DNA序列来调节靶基因的表达.鉴定人中的TF-靶标调控是了解生物学过程(包括发育和发病机制)基础的分子调控机制的基础,而不同条件下的转录因子靶基因的 ...

  • JASPAR:转录因子motif数据库

    motif是一段重复出现在基因序列上的一段片段,通常具有高度重复的碱基序列,是转录因子或者DNA结合蛋白识别并结合的锚定点,就像之前说的,一个DNA结合蛋白可能对应多个motif,motif也会对应多 ...

  • 这题我会--如何弄清转录因子调控的基因(Cistrome DB数据库)

    一个转录因子能同时控制多个基因的表达,同时转录因子的功能作用也可能受多个调控因子的影响.Cistrome DB就是这样的一个数据库,可以展示转录因子的相关调控内容. Cistrome DB历年样本数据 ...