HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子数据库
HOCOMOCO是专门研究人和小鼠的数据库,团队从超过5000个针对人类和小鼠转录因子的实验中获得的14000多套ChIP-Seq数据集,基于系统化的基序发现和交叉验证,展示了人类和小鼠转录因子结合模型。目前,HOCOMOCO 共收集了680个人和453个鼠转录因子的结合model,其中包含1302个单核苷酸和576个二核苷酸的位置权重矩阵。这种大规模的分析可以极大地扩展和改善针对人和小鼠转录因子的TFBS模型的非冗余集。
HOCOMOCO
https://hocomoco11.autosome.ru/
01
TF信息查询
HOCOMOCO提供了三种形式让我们查找TF。
第一种:主页左上角快速搜索:
我们可以直接通过主页右上角的搜索框直接搜索转录因子的名称,搜索框后面选择人或小鼠的数据库。
第二种,TF分类关系图:
在主页,可以看到右侧的关系图是TF分类关系图,其中每个蓝圈表示某个TF家族的总的TF数,较小的黄圈表示HOCOMOCO数据库中的TF数及比例。
第三种,人/小鼠模块分类检索:
通过左角Human TFs或者Mouse TFs,它们都可以选择单核苷酸models core,单核苷酸models full或者二核苷酸models数据集。
这里以Human TFs-models core为例,结果展示了转录因子对应的模型和碱基图标和长度、质量和TF家族以及EntrezGEne、UN iProt ID,这些都可以作为排序标准进行调节,同时可以支持搜索,方便我们找到所需要的的转录因子信息。同时可以利用GetSCV保存搜索到的列表。注意,如果需要更多相关model信息,可以通过Select Columns进行Consensus,Uniprot AC等展示。
点击搜索结果的Model,展示具体的转录因子ID,model名称,model类型,motif logo,位置权重矩阵(PWM),比对到的序列等内容,PWM,PFM,比对结果可以下载。
02
HOCOMOCO TOOL
1.MoLoTool
MoLoTool可以查找感兴趣的检索基因结合的转录因子。
如图所示,点击进入后,可以在左上角搜索添加感兴趣的motif;然后在下面输入或者上传需要检索的序列。下方显示MotifID,Sequence,logo等信息。
这个方法可能略显复杂,我们也可以通过检索栏直接检索查找感兴趣的基因结合的转录因子。由于HOCOMOCO提供HGNC ID和EntrezGene ID的检索,直接通过基因的以上两个ID进行检索即可。
2.MACRO-APE
MACRO-APE可进行motif比较与相似motif检索。
我们需要输入两个motif的PCM,PWM 或PPM矩阵才能进行比较。
结果中给出相似系数,相似系数越高,表示两motif越相似。MACRO-APE软件将表示为位置权重矩阵(PWM,也称为位置特定评分矩阵,PSSM)的转录因子结合模型(通常称为基序)与得分阈值进行有效比较。
3.PERFECTOS-APE
这一模块可预测motif中SNVs与SNPs可能的调节作用。
PERFECTOS-APE可以计算不同model的位置分数,在HOCOMOCO,JASPAR,HOMER等数据库中进行检索对应的models进行比较分析。结果包括SNP名称,相关motif名称,突变碱基对,突变碱基P值等。
点击motif,可以看到Model info。
03
Dowloads
HOCOMOCO留存了三个版本的数据资料,分为工具类、序列资料以及github脚本,,都可以下载。
HOCOMOCO转录因子结合模型数据库已成为哺乳动物转录调控序列分析的主要资源库之一,无论是查询转录因子或结合的基因,MoLoTool对DNA序列中HOCOMOCO结合位点的可视化定位。HOCOMOCOTFBS的预测功能到调控序列变体的注释都可为为研究添砖加瓦。本期内容就到这里,感谢大家~
References
HOCOMOCO: towards a complete collection of transcription factor binding models for human and mouse via large-scale ChIP-Seq analysis
END