基因PolyA预测

基因在转录的过程受到PolyA的调控,不同的PolyA位点可以导致基因产生不同的3'UTR异构体,进而也就影响了基因3'UTR的功能了。因此一个基因的PolyA的位置对于这个的3'UTR的功能至关重要。
背景介绍

新RNA的裂解和聚腺苷酸化(C / P)对于几乎所有真核mRNA和长非编码RNA(ncRNA)的3'端成熟都是必不可少的,它可以终止转录。其中C/P也称为PolyA位点(PAS)。大多数真核基因带有多个PAS,导致选择性多聚腺苷酸化(alternative polyadenylation, APA)表达。大多数PolyA位点位于mRNA的3'非翻译区(3'UTR)中,从而导致具有不同3'UTR长度的异构体。因此预测一个基因的PolyA对于鉴定3'UTR的异构体至关重要。

之前对于PolyA的预测是基于cDNA序列来进行预测的。这样预测的结果就是可能序列上的预测,但是结果有可能不是一个真正的PolyA。随着高通量测序技术的发展,我们可以通过3'end的测序技术来检测基因的真正的PolyA位置。基于这个目的,所以就有了PolyA_DB(http://exon.njms.rutgers.edu/polya_db/v3/)数据库和polyAsite(http://polyasite.unibas.ch/)。这两个数据库也是前两天那个综述推荐的和3'UTR有关的数据库。

 PolyA_DB

这个数据库支持四个物种的PolyA位点查询,分别是:人、小鼠、大鼠和鸡。我们需要做的就是:
  1. 确定物种

  2. 输入基因名

结果的输出包括一个基因的基本信息
对于PolyA位点的结果也可以通过UCSC浏览器来查看,我们点击图片当中的链接就可以查看具体的信息了
同时数据库也提供了和目标基因相关的所有PolyA位点信息:

对于图片当中的结果解读:

  • PAS type: mRNA中的PAS位置,包括5'UTR,CDS和3'UTR。对于3'UTR中的PAS,它们进一步分为First(3'UTR(F)),Middle(3'UTR(M))和Last(3'UTR(L))。如果3'UTR中只有一个PAS,则称为3'UTR(S)

  • PAS Signal:PAS信号位于PAS上游40 nt之内,包括AAUAAA,AUUAAA,其他AGTAAA,TATAAA,CATAAA,GATAAA,AATATA,AATACA,AATAGA,AAAAAG,ACTAAA),A-rich(AAAAAA)和 None。

  • PSE :(所有样品中)带有表达的样品的百分比。

  • Mean RPM:所有样本中每百万PAS reads的平均reads数。

  • Conserv:PAS是否在其他物种(包括人(H),小鼠(M),大鼠(R)和鸡(C))中也保守,并且我们将在至少两种哺乳动物中保守的PAS定义为哺乳动物保守的PAS。

数据结果下载

这个数据库提供了所有内置数据下载的界面。我们可以下载所有的数据来进行离线的DIY。

 PolyASite

PolyASite数据库也是基于测序数据来预测基因PolyA位点的数据库。恰巧的是,这个数据库刚刚更新,相较于之前纳入的测序的数据扩大了很多。属于目前最新,纳入数据量最大的PolyA相关的数据库了。
数据库的使用,和之前的PolyA_DB一样很简单,我们只需要选择物种,输入感兴趣的目标就行。这个感兴趣的靶标可以是:基因组的位置,基因名,或者ENSID号
输出的结果也就包括具体发现的PolyA位点的具体信息:
结果当中包括了一个Cluster的结果,这个类似于把相近的几个PolyA位点来聚类到一起当作一个范围来考虑了。我们可以点击具体的位点,同样的具体的结果可以在UCSC基因浏览器上可视化。
总结
对于PolyA的确定其实主要的还是来研究其选择性多聚腺苷酸化(alternative polyadenylation, APA),进而研究不同的3'UTR异构体对于机体的影响。目前也有几个APA相关的数据库,我们明天再来介绍一下和APA相关的数据库吧!
(0)

相关推荐

  • ANNOVAR结果说明-SNP/INDEL

    转自 简书 一 结果文件说明 1  VCF (Variant Call Format)是储存Variation结果的文件格式 该文件的#列为文件的详细解读信息 2  *.hg19_multianno. ...

  • 基因3'-UTR序列下载

    可以在ensembl中进行基因3'-UTR序列的下载 在download sequence中选中3'-UTR下载即可

  • miRwalk:搞定miRNA靶点预测及验证的宝藏网站

    miRWalk数据库 (http://mirwalk.umm.uni-heidelberg.de/)是一个综合性的miRNA靶基因数据库,收录了Human.Mouse.Rat.Dog.cow等多个物种 ...

  • TargetScan: miRNA靶基因数据库

    导语 TargetScan是一款预测miRNA结合位点的软件,对于哺乳动物中miRNA结合位点预测的效果非常好.在预测miRNA靶基因之前,首先需要确定转录本的3'UTR区域,TargetScan数据 ...

  • 非编码RNA(Non-coding RNA)是什么?

    非编码RNA(Non-coding RNA)是指不编码蛋白质的RNA,包括miRNA.lncRNA.circRNA.piRNA等.非编码RNA发挥功能的方式很多,可以与蛋白.DNA和RNA相互作用,参 ...

  • 最强攻略2: 史上最全非编码RNA数据库汇总解读

    第一单元 lncRNA数据库 长链非编码RNA(Long non-coding RNA, lncRNA)是长度大于 200 个核苷酸的非编码RNA.研究表明, lncRNA 在剂量补偿效应.表观遗传调 ...

  • 想了解有关肿瘤的这一热门机制?这个重磅数据库来帮你!

    本期直播主题:做网红医生有前途吗?教你打造自己的个人IP! 点击预约按钮,领开播好礼! 解螺旋公众号·陪伴你科研的第2670天 你想了解的数据库 我们之前在介绍肿瘤表观遗传相关数据库MR4Cancer ...

  • 『艾滋病』基因将预测艾滋病治疗药物的有效性

    根据最新的研究结果,科学家发现有一种基因变异将会影响人体对艾滋病药物治疗和化疗的反应性,将来对这一基因的研究将有助于医生确定哪一种治疗方法对某些患者更有效. 根据发表于今年8月4日出版的<柳叶刀 ...

  • 【科】睿昂基因估值预测表,预计首日120元获5万, 分子诊断

    免责申明:以下预测内容仅供参考! 预测表格说明:黄色为打新君预测的开板价格和天数,绿色为低风险区间,红色为高风险区间.在过去的几年里,根据统计数据正确率在72-78%区间,统计口径为开板价格±20%. ...

  • 综合性基因功能预测数据库

    我们在进行研究一个基因之前都要了解这个基因主要是功能是什么,或者它可能的功能是什么.如果要了解一个基因目前的功能的话.可以通过genecards来查找的. 如果想要挖掘这个基因额外的功能的话,那就需要 ...

  • 航母级基因功能预测数据库

    在基于高通量测序的进行基因功能预测的是时候,我们经常需要寻找符合我们研究疾病的数据集.拿肿瘤而言,最常见的的还是 TCGA 数据库.但是一个数据集进行基因功能预测的时候,有可能在后续的实验的时候就会产 ...

  • 基因预后预测数据库

    在进行肿瘤相关研究的时候,如果有这个肿瘤的随访时间和随访的结局,往往都可以进行预后分析.通过预后分析来了解某一个分组(治疗方式,基因突变,基因表达高低)是否影响肿瘤患者的预后.那么如果在基因研究的时候 ...

  • 7分纯生信SCI 基因突变预测免疫治疗疗效

    大家好,今天要和大家分享的是2021年1月发表的一篇文章:"ZFHX3 mutation as a protectivebiomarker for immune checkpoint blo ...

  • 在线基因预测工具介绍-genewise

    基因组项目中基因预测是最重要的一个部分,目前常用的策略有三种,分别为从头预测,基于转录本预测,基于同源蛋白预测. 对于基于同源蛋白预测,最常用的软件是genewise软件.软件的特点是精度较高,但是运 ...

  • 基因变异筛查预测乳腺癌风险

    A massive study of nearly 4,000 variants in a gene associated with cancer could help to pinpoint pe ...

  • tRFs靶基因预测数据库

    在前几天的介绍当中,我们通过一篇综述了解到了tRNA的功能.其中在那篇综述当中提到了四个和tRNA有关的数据库.但是综述当中介绍的数据库基本上都是用于查询tRFs的基本信息或者查看tRFs在肿瘤当中的 ...