UCSC基因浏览器 :最早的基因组浏览器
# UCSC
UCSC基因组浏览器是由来自和英国的多机构研究团队University of California Santa Cruz(UCSC)基因组学研究所的跨部门团队Genome Bioinformatics Group开发和维护。它是最早的基因组浏览器,主要是为人类基因组设计的。现在已发展为包括大量的脊椎动物和模型生物的装配体和注释信息,以及用于查看、分析和下载数据的大量工具。
UCSC是目前可以快速而且可靠地显示任何规模的基因组的任何所需部分,以及包含数十种对齐的注释轨迹(已知基因,预测基因,EST,mRNA,CpG岛,染色体条带,物种同源性等)。用户也可以出于教育或科研目的将他们自己的注释信息添加到浏览器中。大多数人在使用CSC基因组浏览器的目的是,访问数据库中的原始信息,根据基因组的位置、ID 等信息进行浏览,网站提供了 80 多个物种的基因组信息,可视化内容齐全,可根据需要加入注释信息。
Kent这个是基因组浏览器的主要设计者,他曾经创建了好几个网站。对他感兴趣可以看看这个https://users.soe.ucsc.edu/~kent/
UCSC Genome Browser
https://genome.ucsc.edu/
UCSC首页
以下,针对UCSC各模块进行介绍。
1.
Genome Browser
Genome Browser查询的自然是与基因组信息相关的内容。点击“Genome Browser”后出现如下界面:
不同的项目采用的基因组版本会有所不同,两个链接进入后看到的画面一致,但提供内容有所不同。在芯片项目中,hsa一般采用的是hg19版本,而在测序项目中一般采用的是hg38版本。在版本选择上需要根据实际情况来选择。
可以选择物种信息、版本、待查询的内容
展现结果如下:可以看到控制面板主要分六大块,每一个大模块上又有很多选项,比如non-coding RNA, CRISPR, ALL SNPs等信息。UCSC基因显示面板是以染色体的起始和终止位点为显示范围,zoom in会放大碱基区域,减少展现出来的区段,zoom out会扩大序列区段,看到周边基因的信息。最细的线代表内含子区域,其箭头方向为读码方向,最粗的部分为外显子区域,中间粗细的部分为UTR区域。我们也可以把染色体上起始位点和终止位点之间的序列全部下载下来,点击最上面的View → DNA → get DNA 即可下载目标区段的DNA序列。我们也可以通过View → PDF/PS 下载基因显示面板里的信息成pdf文件。
每部分功能框又包括几个数据源,每个数据源显示结果可以包括hide、dense、squish、pack和full这五个不同的显示水平,按照前后顺序full是全部显示,hide为隐藏,即越靠下显示结果越多。
2.
Coronavirus Data
现在因为疫情的缘故,网站增加了新冠肺炎专题。里面有加州大学圣克鲁斯分校(UCSC)基因组研究发布的2019-nCoV的完整生物分子代码,供全世界的研究人员使用。
3.
BLAT
跟NCBI的blast功能类似,对序列进行比对。对于DNA序列,BLAT用来设计寻找95%及以上相似至少40个碱基的序列。对于蛋白质序列, BLAT用来设计寻找80%及以上相似至少20个氨基酸的序列。BLAT用于查找mRNA或蛋白质在基因组中的位置,查看基因外显子的结构,显示全长基因的编码区域,分离一个物种的EST,查找基因家族,从其它物种中查找人类基因的同源物。粘贴查询序列以找到其在基因组中的位置。如果由以'>'开头的行和后面的序列名称分隔开,则可以搜索多个序列。
4.
Table Browse
可从基因组浏览器数据库(如refseq、ensemble等)下载数据。直接利用table browser即可下载满足文件格式的所有文件序列:输入表格参数后,点击提交既可以批量得到你所需要的基因组序列,包括但不限于RNA的序列信息、注释信息等。
5.
Variant Annotation Integrator
Variant Annotation Integrator(VAI)是一种研究工具,用于将UCSC数据库中的注释与用户上传的变量调用集相关联。通过基因注释来预测变体对转录本的功能作用。例如,一个变体可能位于一个转录本的编码序列中,但位于同一基因的另一个剪接转录本的内含子中。VAI可以选择过滤结果,以仅保留特定的功能效应类别,变体属性和多物种保护状态。同时网站也特别提醒,VAI只是一种研究工具,仅供已接受过遗传数据解释培训的人员使用,切勿用于做出任何医学决定。如果是个人用户一定要咨询医生的建议。
蛋白质编码基因转录物效应预测表
6.
Data Integrator
Data Integrator在不同的轨道中找到按位置重叠的项目,与Table Browser的交点功能不同,Data Integrator可以输出所有选定轨道的所有字段。一次最多可以查询5条不同的曲目。可以同时合并和导出来自多个轨道的数据。将基因组位置与第一个选定轨道中的项目位置重叠的项目的多个轨道数据组合在一起。根据您的需要,您可以:在查询中包括所有数据源的所有列,或者仅包括您选择的列。在全基因组范围内查询,或仅针对您感兴趣的区域,可以下载到电脑。
综合来说,Geonme Browser是一款强大的工具,在大规模高通量数据的可视化和比较分析研究中发挥着重要的作用。
生物学专业的同学若能掌握它的使用,则将如鱼得水,如虎添翼,这个网站还可以下载作为本地浏览器,可以对自己的测序数据进行更深入的分析和共享使用。如果需要更多帮助看这里:GenomeBrowser的帮助文档http://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html