不做测序,如何选择一个circRNA进行后续研究
随着高通量测序的越来越火,对于一个基础实验而言,往往第一步都是需要做点儿高通量测序,来发现一些新的东西,才能往下做。如果不这么做的话,好像就感觉差人一步似的。尤其是对于新兴的一些RNA。比如circRNA这样的。
所以今天就来给大家介绍一个在没有做高通量筛选的情况下筛选一个circRNA来进行后续研究的文章。
在这篇文章当中,作者解释道说,由于MAPK通路在肿瘤当中发挥了很重要的作用,所以作者筛选了在MAPK通路中的基因可以形成circRNA。经过后续的基本样本验证最后选择了其中一个circRNA来进行后续的研究。
在介绍了那么多数据库之后,今天我们也就来试着按照作者的思路来,复原一下。如何才能找到某一个通路相关的circRNA。
通路相关基因筛选
如果要寻找某一个通路相关的circRNA的话,那么首先还是需要寻找这个通路当中的那些基因有哪些。对于通路数据库而言,首先想到的是KEGG数据库。这个数据库我们在之前的时候也介绍过。
但是在使用这个数据库的时候,我们确实能找到和MAPK通路。但是只能获得这个通路的一个基本的通路图。并不能下载这个通路当中的所有基因了。
这个时候,就可以使用我们之前在PathCards这个数据库来寻找一下数据库当中的基因。经过筛选,我们发现,一共有两个通路数据库当中记录了MAPK信号通路。同时在下面也可以得到设计这个通路的相关基因是哪些
另外,除了以上获得通路基因的方式。我们还是可以在GSEA提供的官方基因集合(MSigDB)当中,也可以获得。在MSigDB,收集了多种不同的基因基因集(http://www.gsea-msigdb.org/gsea/msigdb/collections.jsp)。其中就包括KEGG数据库当中的所有通路。
我们点击GeneSymbols就可以下载KEGG所有通路的基因集了。下载后的是一个txt文件。在文件当中检索一下,就可以获得MAPK通路当中的基因了。
以上两种方式比较的话,PathCards由于是汇总了多个数据库的结果,所以相对来说可能基因更多也更准确一些。但是PathCards的话可以看到有哪些基因,如果想要下载下来的话,就只能复制粘贴后然后调整各种格式。相比较而言,MSigDB虽然只是包括了KEGG的数据,但是对于数据的整理比较方便。
基因相关circRNA
在获得通路相关基因之后,我们就可以使用circRNA进行。在circRNA当中,我们只需要在list search当中输入通路相关的基因即可获得,这些基因形成的circRNA。
经过输入,我们就可以获得这些基因相关的cricRNA了。
总的来说
以上基本上就是寻找某一个通路可以产生的相关circRNA的基本过程了。总的来说,有时候在寻找一个研究目标的时候,并不一定需要广筛一个才能获得信息。有时候从经典的通路/基因出发去寻找这些东西的新的方向。也是一种方法的。上面的是通过MAPK通路去寻找circRNA。那么同样的,我们其实去找比如说TP53通路,自噬通路这样的circRNA的。