多物种转录因子数据库请君共赏,比JASPAR方便一丢丢哦~备胎更暖心!

AnimalTFDB 3.0使用教程

各位亲爱的小伙伴们大家好~今天我们继续来聊一聊转录因子的故事。有关转录因子的数据库之前弘毅老师给大家介绍过很多,其中就有大名鼎鼎的JASPAR数据库,上周我也安利过TRRUST数据库,但是最近我眉头一皱,发现事情并不简单,这些数据库或多或少总有这样那样的一些瑕疵。JASPAR数据库可以用于预测转录因子与靶基因的结合位点,但是在已知基因往上游预测转录因子的时候需要与UCSC浏览器联合使用,操作略微有点麻烦且预测结果不方便导出分析;TRRUST数据库则是有一个自己的由实验验证过的TF-mRNA基因集,如果输入进行检索的基因未被TRRUST收录,则无法进行分析,因此在分析的时候可能会丢失部分基因。基于以上的一些问题,今天给大家安利另外一款转录因子相关的数据库----AnimalTFDB数据库。

数据库网址为:http://bioinfo.life.hust.edu.cn/AnimalTFDB#!/

大家在使用的时候请不要忘记引用参考文献:

AnimalTFDB 3.0: a comprehensive resource for annotation and prediction of animal transcription factors. Hui Hu$, Ya-Ru Miao$, Long-Hao Jia, Qing-Yang Yu, Qiong Zhang and An-Yuan Guo*. Nucl. Acids Res. Volume 47, Issue D1, 08 January 2019, Pages D33–D38, https://doi.org/10.1093/nar/gky822.

 转录因子系列传送门 

转录因子经典数据库,为你的文章增光添彩

一、AnimalTFDB数据库使用概览

AnimalTFDB数据库最早于2011年11月发表了第一个版本,至今已经更新到了3.0版本,持续维护并更新了7年。值得一提的是,三个版本的数据库更新的文章都发表在了Nucleic Acids Research杂志上,其影响力可见一斑。

AnimalTFDB数据库由华中科技大学郭安源教授团队建立并维护,是一个多物种的全面的数据库,旨在为动物转录因子及其转录辅助因子提供最全面、准确的信息资源,包含来自97个动物基因组的125,135个转录基因和80,060个转录辅助因子基因,并根据转录因子DNA结合结构域(DNA-binding domain, DBD)将转录因子进一步分为73个家族,根据转录辅助因子功能分为83个家族和6个大类。

如上图AnimalTFDB数据库菜单栏所示,Animal TF数据库的主要功能包括以下两点:

1. 提供多种搜索浏览方式,如可以按照“Family”、“Species”或自定义方式“Search”进行检索;

2. 提供两个在线预测工具,如“Predict TF”,“Predict TFBS”,可以分别批量预测转录因子和预测DNA序列上的转录因子结合位点。

其他功能,如Blast是寻找同源基因以及探索研究较少的转录因子的功能;Download提供转录因子及转录辅助因子列表和蛋白序列的下载功能;Document提供Animal TF3.0介绍文档;Citation是Animal TF3.0相关的参考文献。

由于人类转录因子查询的广泛需求,开发团队单独设计了HumanTFDB数据库。该数据库脱胎于AnimalTFDB数据库,功能除了无法检索其他物种的内容,其他与AnimalTFDB数据库完全一样。因此接下来我们以HumanTFDB数据库为例进行功能讲解说明。点击AnimalTFDB数据库右上角“HumanTFDB”或者输入网址http://bioinfo.life.hust.edu.cn/HumanTFDB/#!/,即可进入数据库页面。

二、HumanTFDB数据库功能介绍

1

转录因子家族概览

输入网址或通过AnimalTFDB数据库进入HumanTFDB数据库主页面。可以看到菜单栏与AnimalTFDB数据库类似。下图即为主页面,统计了HumanTFDB数据库收录的转录因子家族及转录辅助因子家族信息。

点击“TF family”跳转到如下页面,展示了根据DBD所划分的不同的TF家族。有关转录因子分类的相关知识大家可以移步初阶体系课转录因子套路课听老谈老师进一步讲解,此处不再赘述。点击图片可以进一步查看该TF家族具体由哪些转录因子组成。

点击“TF Cofactor Family”跳转到如下页面,显示了转录辅助因子家族信息,内容同上。

2

 “Search”功能

接下来我们重点介绍一下检索功能与预测功能。点击“Search”,页面跳转如下:

HumanTFDB数据库一共有四个检索模块,分别为“Search by basic information”,“Search by gene annotation”,“Search by human mRNA expression”以及“Search by human protein expression”。首先我们看第一个“Search by basic information”:

如上图所示,该模块用于检索某一个转录因子的相关信息,可以输入该转录因子的Ensembl Gene ID,Entrez Gene ID,Ensembl Transcript ID,Ensembl Protein ID,Gene Symbol,Gene Alias以及Full name进行检索。我们以转录因子AFF4为例,选择Gene Symbol,输入AFF4,点击“Submit”:

页面跳转后显示了AFF4的基本信息,包括Ensembl ID以及Entrez ID编号,转录因子全称以及属于哪一个转录因子家族等。此处有两处可以点击的超链接,点击“Entrez ID”跳转到NCBI中相关的基因页面,此处我们点击“Ensembl ID”进入该转录因子的详细分析结果页面。整个结果页面内容非常丰富,涵盖了转录因子的方方面面,包括:

(Gene Card,包括但不限于该转录因子基因的名称,类型,染色体位置,蛋白质编号以及序列信息等)

(Gene Model,基因模型)

(Protein Functional Domain,蛋白质功能域)

(Gene Ontology,基因本体论)

(TF相关GWAS表型)

(Phenotype,表型)

(PPI-Protein-Protein Interaction,PPI蛋白互作网络,点击下方“Click to view the PPI network”可以进一步查看网络图)

(Paralog&Ortholg,转录因子的同源分子)

(该TF在不同癌症,组织,细胞系等中的表达情况)

我们继续返回看“Search”的第二个功能,用于查询某一PPI/KEGG/GO条目中的转录因子,以GO中的“GO:0002151”为例,点击“Submit”,结果页面展示了该GO Term中包含的转录因子:

在“Search by human mRNA expression”中可以查询不同肿瘤中的转录因子及转录辅助因子。以ACC为例,点击Submit,该肿瘤中一共有1424个TF以及931个TF辅助因子:

“Search by human protein expression”可以查询不同细胞、组织、器官中的转录因子及转录辅助因子。以Adult Colon为例,点击Submit,该器官中一共有285个TF以及521个TF辅助因子:

3

TF&TFBS预测功能

HumanTFDB数据库一共提供了两种预测模式“Predict TF”以及“Predict TFBS”,前者根据用户给定的蛋白质序列识别其中的TF,支持一次上传高达1000个蛋白质序列。注意,蛋白质序列应以FASTA格式输入,每条序列第一行以>开头,再另起一行输入序列。此处我们以示例序列为例,一共有10条蛋白质序列,点击“Submit”,页面刷新后在右侧出现预测结果。“Number of upload sequences”表示一共上传了10条蛋白序列,“Number of hits”表示其中一共有6条为转录因子。下方表格显示了这些转录因子的名称,家族,比对E值,结构域数量。点击“Alignment information”下方的“show”可以查看详细的比对信息。

接着我们演示已知一个靶基因如何预测其转录因子。点击“Predict TFBS”,同上所述,左侧框内需要输入目的基因的启动子序列。如何获得目的基因的启动子序列请大家参考弘毅老师的JASPAR数据库推文或者零代码生信上篇段位三转录因子课程,此处不再赘述。我们以示例序列为例,同样需要输入FASTA格式的文件,点击“Submit”后,右侧出现预测的结果。表格内显示了所预测的能与目的基因结合的转录因子,“Source”显示了预测依据,HumanTFDB数据库从TRANSFAC, JASPAR, HOCOMOCO 以及hTFtarget等数据库中收集TF基序矩阵。表格还依次显示了转录因子与DNA序列结合的起始和终止位置,是与正义链结合还是反义链,预测的score值,P/Q值以及相应的序列。点击右下方的“Download”可以进行下载进行进一步的分析。

好了,HumanTFDB数据库我们就介绍到这里了。转录因子相关的数据库也有很多,我们一一道来,但是不同的数据库之间各有优劣,大家使用的时候记得多多互相参考借鉴噢~

—END—
撰文丨火  火
排版丨四金兄
值班 | 弘   毅
主编丨小雪球
(0)

相关推荐

  • HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子数据库

    HOCOMOCO是专门研究人和小鼠的数据库,团队从超过5000个针对人类和小鼠转录因子的实验中获得的14000多套ChIP-Seq数据集,基于系统化的基序发现和交叉验证,展示了人类和小鼠转录因子结合模 ...

  • 最强攻略5:史上最全转录调控数据库汇总解读

    一.转录因子介绍 转录因子(Transcription factors)是一群能与基因特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子.转录因子通过识别特定的DNA序 ...

  • JASPAR:转录因子motif数据库

    motif是一段重复出现在基因序列上的一段片段,通常具有高度重复的碱基序列,是转录因子或者DNA结合蛋白识别并结合的锚定点,就像之前说的,一个DNA结合蛋白可能对应多个motif,motif也会对应多 ...

  • cytoscape十大插件之九 - 转录调控王者 iRegulon

    五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧,课程已经结束啦.文末有录播回放学习方式,以及配套授课资料! 下面是cytoscape讲师的笔记 一. ...

  • AnimalTFDB:动物转录因子注释和预测tool

    AnimalTFDB是一个全面的数据库,有经过鉴定.分类和注释的97个物种全基因组水平的125,135个TF基因和80,060个转录辅因子基因,由华中科技大学郭安源教授团队建立并维护其中,根据转录因子 ...

  • 如何预测转录因子靶基因!

    做完转录组分析完之后,一般会找到一些差异表达的基因.差异表达基因中如果有转录因子的话,可以研究一下转录因子调控哪些基因的表达.要预测转录因子调控的靶基因,需要两个步骤: 1. 首先需要知道转录因子的结 ...

  • 各大博物馆馆藏经典“曼生壶”,与君共赏!

    一.故宫博物院 ▲飞鸿延年壶 二.唐云艺术馆 唐云老年影像 ▲井栏壶 ▲合欢壶 ▲合欢壶 ▲石瓢壶 ▲石瓢提梁 ▲匏瓜壶 ▲扁壶 ▲笠式壶(台笠壶) 三.南京博物院 ▲仿古井栏壶 ▲梨形三足壶(横云壶 ...

  • 弘一法师处世箴言与禅画,与君共赏!

    弘一法师 李叔同是著名音乐家.美术教育家.书法家.戏剧活动家,是中国话剧的开拓者之一.他从日本留学归国后,担任过教师.编辑之职,后剃度为僧,法名演音,号弘一,晚号晚晴老人,后被人尊称为弘一法师. 1/ ...

  • 玉中兰花,邀君共赏!

    在令人眼花缭乱的春天里,有一种花,远观热烈蓬勃,近观却清丽雅致. 唐朝诗人白居易观后称:"从此时时春梦里,应添一树女郎花." --那就是玉兰. 玉兰·史 玉兰,有很多别名,一叫木笔 ...

  • 人间最美梅盛时 与君共赏99句梅花诗

    梅花,本是冬日里一道靓丽的风景线.总有那么一朵梅花,美到骨子里,惊艳了时光,温柔了岁月. 当一树傲梅独立霜寒慢慢展现出娇美的时候,雪花也在用一份纯情的爱轻轻滋润着梅花-- 今天美文君撷取梅花一朵,与君 ...

  • 千古奇文,邀君共赏

    说起陈继儒,大家也许不怎么熟悉,他是明代知名文学家.书画家,字仲醇,号眉公.麋公. 有<梅花册>.<云山卷>.<陈眉公全集>.<小窗幽记>等传世. 他有 ...

  • 100种醉美兰花,邀君共赏!

    古人曰: "兰花生於幽谷,不己无人而不芳". 很多人爱"四君子"中的兰花, 不仅是爱它高雅脱俗的气质, 更爱它那无私的奉献. 清香飘然而去, 从不刻意炫耀自己. ...

  • 唐朝最经典的10首绝句,邀君共赏

    绝句,每首四句,短小精悍,在唐朝比较流行. 现小编精选唐朝最经典的10首绝句,邀君共赏. <鹿柴(zhài)> 王维 空山不见人,但闻人语响. 返景入深林,复照青苔上. 空寂的山中寂静的很 ...

  • 灼灼桃花,绝美诗画,与君共赏

    <花卉八开·桃花> 清 邹一桂"东风着意,先上小桃枝",桃花的妖冶美艳在群芳之中可谓是出类拔萃,<诗经>中"桃之夭夭,灼灼其华"之句描述 ...

  • 100种最美兰花,邀君共赏!雅尼《和兰花在一起》

    来源网络版权归原作者 古人曰: "兰花生於幽谷,不己无人而不芳". 很多人爱"四君子"中的兰花, 不仅是爱它高雅脱俗的气质, 更爱它那无私的奉献. 清香飘然而去 ...