YM500v2:用于人类癌症miRNA研究的小型RNA测序数据库

YM500v2是用于个人smRNA-seq数据集的miRNA定量,是miR鉴定和新型miRNA预测的集成数据库。YM500v2中包含了YM500之后开发的与miRNA相关的新算法,更重要的是,纳入了8000多个与癌症相关的smRNA-seq数据集(包括原发性肿瘤,成对的正常组织,PBMC,复发性肿瘤和转移性肿瘤的数据集)进入YM500v2。YM500v2数据来源于TCGA,主要是收录RNA测序信息数据库,可用于microRNA研究,是miRNA的表达谱数据以及相关分析。YM500v2可用于靶基因预测、组间差异表达等分析进行处理。

YM500v2的新型miRNA(miRBase R21中未包括的miRNA)不仅可以通过三种独立的算法进行预测,而且可以通过一种新的计算机过滤策略进行清洗,并通过诸如交联免疫沉淀测序(CLIP-seq)之类的wetlab数据进行验证,以减少错误阳性率。此外,还提供了一项新功能“元分析”,使用户可以根据客户定义的样品组和熟练的临床医生整理的许多临床标准,识别实时差异表达的miRNA,鉴定出的癌症miRNA具有基础研究和生物技术应用的潜力。

YM500v2

http://ngs.ym.edu.tw/ym500v2/index.php

YM500v2首页

这个网站比起一般的数据库都要特别一些,主色是黑色,两侧边的颜色是渐变绿。黑色,带着一些技术的高冷感,绿色,带着养生式的护眼感,非常独特哈。可以看到六个功能模块,分别是:已知miRNA表达水平查询、新的miRNA预测、miRNA异构体分析、5’和3’miRNA搜索、组间miRNA差异表达比较及分析结果下载,以下针对各模块进行逐一介绍。

Known mir(EXpression)

已知miRNA表达水平查询

在Known mir(EXpression)模块,可以输入一个miRNA名称或关键字,也可以在下面输入miRNA 列表(文件),YM500v2还支持miR簇表达、基因组位置搜索。多个miRNA表达查询需要选择标本类型(可多选),查询返回的是样品来源类型及表达量信息,点击 ex pression 按钮之后会自动画出热图及提供表达水平量数据的下载。

单miRNA表达结果

多个miRNA表达查询需要选择标本类型(可多选),会出现样品来源类型及表达量信息,点击 expression 按钮之后会自动画出热图及提供表达水平量数据的下载。

Novel MiR

新miRNA预测

YM500V2提供了两种搜索新颖的miRNA的方法:

A.序列搜索为了在YM500V2数据库中找到新颖的成熟miRNA和相关信息,用户可以根据自己的喜好搜索新颖成熟的miRNA的序列。

B.基因组位置搜索要在YM500V2数据库中找到新的成熟miRNA和相关信息,用户可以搜索特定的基因组位置。例如,染色体:17,位置:36908021。

预测方法是基于miRDeep2,Mireap和miRanalyzer三个软件,只要有一个预测到就会显示出来。此外点击UCSC等数据库链接还能看到序列在基因组的情况。

IsomiR(with RNA Editing)

miRNA异构体分析

上下两个输入框分别为输入miRNA和序列号而设,下面以miR-21-5p为例进行搜索,结果示例如下:

其中核苷酸样本、修整方式、编辑速率可以勾选。点击图中黄色字体MIMAT0000076、MI0000077会出现其在microRNA数据库中的信息内容。点击运行会出现具体的Putative miR Editing Performance、IsomiR Summary、Putative RNA Editing。点击每条异构体会提供表达量分布及每个样品表达水平,显示每个碱基的读取分布等详细信息。

MiR’s arm Switching

5’和3’miRNA搜索

用户可以输入pre-miR name or keyword:

搜索之后返回同一条miRNA前体产生的两条不同miRNA差异表达情况,不同颜色的点代表不同类型的样品,在蓝线之外的就是具有差异表达的样品。

MA plot and scatter plots of tissues

Meta-Analysis

组间miRNA差异表达比较

YM500v2可以让研究人员从两个用户定义的特定样本集中识别差异表达的miRNA。用户可以为一组选择一个或多个数据集。网站支持临床标准,例如ICD-O-3组织学,肿瘤分期,远处转移和淋巴结状态,以便研究人员根据一种或多种临床参数选择明确定义的癌症样品的亚组。用户可以先概述所选样品的详细临床信息,然后再将该数据提交给网站进行实时计算。

可供选择的组织类型

任务完成之后会邮件通知分析完成,打开邮件链接即可看到分析结果(数据只能保存7天),并且所有分析结果都可以下载。

Datasets

数据集下载

YM500v2的数据类型主要有三大类型:Summary、Small RNA Sequencing CLIP Sequencing。

这些样品数据可以下载到本地,支持txt和xls格式。

以上就是YM500v2数据库的介绍,看完是不是觉得很方便有用呢,这个数据库对网速的要求比较高,童鞋们在使用的时候记得找个网速好的地方再开始啊。

(0)

相关推荐