使用miRNAtap数据源提取miRNA的预测靶基因结果

今天我们比较一下另外的一个miRNAtap包,与multiMiR的结果的一致性,以及两个数据库的差异!首先安装miRNAtap包,代码如下:

options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/")) 
options(download.file.method = 'libcurl')
options(url.method='libcurl')

BiocManager::install("miRNAtap",ask = F,update = F)
BiocManager::install("topGO",ask = F,update = F)
BiocManager::install("miRNAtap.db",ask = F,update = F)

在miRNAtap包说明书很清楚的写着,它其实就是综合另外5个流行的数据源,然后总结一下,而且仅仅是支持人和鼠这两个物种哦!

 

首先看看,对指定的一个miRNA进行靶基因提取:

rm(list = ls())
library(miRNAtap)
library(topGO)
library(org.Hs.eg.db)
mir = 'miR-10b'
predictions = getPredictedTargets(mir, species = 'hsa',
                                  method = 'geom', min_src = 2)

head(predictions)
predictions_min = getPredictedTargets(mir, species = 'hsa',
                                      method = 'min', min_src = 2)
head(predictions_min)

两个总结5个数据库结果的方法差异在于靶基因的排名:

 

值得注意的是默认 是5个数据库都采用, i.e. c('pictar','diana','targetscan','miranda','mirdb'),不过也有可能某些miRNA在某些数据库其实是没有记录的。然后算法有3种:

min' is a minimum of ranks, 'max' is a maximum of ranks, and default 'geom'is based on geometric mean of the ranks which proves to be the most accurate method

所以我们就选择默认的geom即可,反正靶基因列表是一样的。

首先看miRNAtap包与multiMiR的结果的一致性

我们这里分别测试人和鼠的各一个miRNA,代码如下:

rm(list = ls())
library(miRNAtap)
library(topGO)
library(org.Hs.eg.db)
mir = 'hsa-miR-18a-3p'
tmp1 = getPredictedTargets(mir, species = 'hsa',
                           method = 'geom', min_src = 2)
head(tmp1) 
library(multiMiR)
example1 <- get_multimir(mirna = 'hsa-miR-18a-3p', summary = TRUE)
tmp2=example1@data
intersect(rownames(tmp1),tmp2$target_entrez)

mir = 'mmu-miR-9-5p'
tmp1 = getPredictedTargets(mir, species = 'mmu',
                           method = 'geom', min_src = 2)
library(multiMiR)
example1 <- get_multimir(mirna = mir, org = 'mmu',summary = TRUE)
tmp2=example1@data
table(tmp2$database)
intersect(rownames(tmp1),tmp2$target_entrez)

简单看了看,两个R包里面记录的同一个miRNA的靶基因重合度还挺高的!

再看看它与miRSystem网页工具结果的差异

进入 http://mirsystem.cgm.ntu.edu.tw/ ,粘贴我们的

值得注意的是,该工具顺便对靶基因进行了生物学功能数据库的注释

 

可以看到预测的靶基因是836个,有趣的是我们明明输入的是小鼠的miRNA,理论上靶基因应该是小鼠的,但是这个网页工具似乎是把人和鼠的基因模糊处理了.

 

同样的,检查可以看到miRSystem网页工具结果和R包也是约30%的重合。(因为不是这个领域,所以我并不清楚,不同数据库结果的30%左右的一致性是好还是坏)

既然是预测,就不可能多个工具完全一致,所以目前主流的做法是,选择5个以上数据库支持的靶基因作为该miRNA的最后列表。

文末友情宣传

强烈建议你推荐我们生信技能树给身边的博士后以及年轻生物学PI,帮助他们多一点数据认知,让科研更上一个台阶:
推荐阅读

(0)

相关推荐

  • circRNA查询?用这个就可以了

    各位小伙伴们,大家好,我是解螺旋先锋班学员火,今天向大家介绍一个操作简单好用,方便上手的预测circRNA-miRNA交互作用的新兴数据库-circBank数据库. circBank数据库基本介绍 c ...

  • miRNA与基因互作数据库

    我们熟知,在特定情况下,microRNA(miRNA)可以直接或间接激活和抑制基因表达.但是,尚没有基于多组学的数据库能够证明对激活与抑制以及正常与癌症状况之间相互作用模式转换的系统数据.今天我们为大 ...

  • miRNA前体、miR-5p、miR-3p

    什么是miRNA? miRNA (microRNA)是一组由基因组编码的长度约20-23个核苷酸的非编码RNA,通过和靶基因mRNA碱基配对引导沉默复合体(RISC)降解mRNA或阻碍其翻译.在miR ...

  • miRandola:细胞外循环miRNA数据库

    非编码RNA在调节各种生物过程中起重要作用,并已显示出作为基于组织分类和预后标志物的希望.在血清,血浆,唾液,尿液和其他体液中的细胞外非编码RNA与各种病理状况有关.非编码RNA以高度稳定的细胞外形式 ...

  • 如何根据转录因子预测靶基因?

    我们以前写过如何寻找基因的启动子和预测转录因子:(工具篇):如何查找基因的启动子及预测转录因子?,今天我们反过来做一个事情:根据转录因子来预测靶基因. 其实我们知道很多转录因子的结合序列是相对保守的, ...

  • miRNA靶基因预测数据库

    好啦,小伙伴们,上次咱们刚介绍过神器starbase,那么今天咱们再来学习一下另一款神器:miRWalk(http://mirwalk.umm.uni-heidelberg.de/).在咱们预测的时候 ...

  • 综合性miRNA靶基因预测数据库

    写在前面 对于miRNA靶基因的预测而言,目前有很多数据库都可以做.这些数据库的区别基本上在于纳入的数据量以及预测的算法不同.预测的结果总是有一些不同的,所以也就导致各个数据库的结果可能不是很一样.我 ...

  • 如何实现miRNA靶基因预测?

    如何实现miRNA靶基因预测?

  • 科研│大连民族大学:miRNA和降解组测序确定了miRNA及其靶基因与硫化氢对鲜切苹果的褐变抑制有关(国人佳作)

    编译:伊一,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读 表面褐变是鲜切苹果货架期的主要限制因素,硫化氢(H2S)处理能有效抑制褐变.然而,鲜切苹果对H2S反应的分子机制却知之甚少.Micro ...

  • 科研 | Industrial crops and products:深度测序鉴定参与樟树萜类生物合成的miRNA及其靶基因

    编译:Jerry,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 樟树具有较高的经济.工业价值.樟树叶片挥发油中的萜类是美容.医药产品的重要原料.然而,樟树中miRNA对萜类生物合成的调控作用尚 ...

  • tRFs靶基因预测数据库

    在前几天的介绍当中,我们通过一篇综述了解到了tRNA的功能.其中在那篇综述当中提到了四个和tRNA有关的数据库.但是综述当中介绍的数据库基本上都是用于查询tRFs的基本信息或者查看tRFs在肿瘤当中的 ...

  • 什么,给你了你这么多miRNA靶基因查询R包和网页工具你居然不知道怎么使用

    前面,我们多次介绍了关于miRNA的靶向基因的查询工具,分别是: microRNAs靶基因数据库哪家强 使用miRNAtap数据源提取miRNA的预测靶基因结果 对miRNA进行go和kegg等功能数 ...

  • miRcode:转录组miRNA靶点预测图谱

    导语 microRNA在细胞中的功能与作用的研究已经相对完善,而长链非编码RNA功能是多种多样的,作为细胞生理作用的重要的调控因子,对于他们的研究才慢慢开始重视.少量的研究小RNA与长链非编码RNA之 ...