基因PolyA预测
新RNA的裂解和聚腺苷酸化(C / P)对于几乎所有真核mRNA和长非编码RNA(ncRNA)的3'端成熟都是必不可少的,它可以终止转录。其中C/P也称为PolyA位点(PAS)。大多数真核基因带有多个PAS,导致选择性多聚腺苷酸化(alternative polyadenylation, APA)表达。大多数PolyA位点位于mRNA的3'非翻译区(3'UTR)中,从而导致具有不同3'UTR长度的异构体。因此预测一个基因的PolyA对于鉴定3'UTR的异构体至关重要。
之前对于PolyA的预测是基于cDNA序列来进行预测的。这样预测的结果就是可能序列上的预测,但是结果有可能不是一个真正的PolyA。随着高通量测序技术的发展,我们可以通过3'end的测序技术来检测基因的真正的PolyA位置。基于这个目的,所以就有了PolyA_DB(http://exon.njms.rutgers.edu/polya_db/v3/)数据库和polyAsite(http://polyasite.unibas.ch/)。这两个数据库也是前两天那个综述推荐的和3'UTR有关的数据库。
PolyA_DB
确定物种
输入基因名
对于图片当中的结果解读:
PAS type: mRNA中的PAS位置,包括5'UTR,CDS和3'UTR。对于3'UTR中的PAS,它们进一步分为First(3'UTR(F)),Middle(3'UTR(M))和Last(3'UTR(L))。如果3'UTR中只有一个PAS,则称为3'UTR(S)
PAS Signal:PAS信号位于PAS上游40 nt之内,包括AAUAAA,AUUAAA,其他AGTAAA,TATAAA,CATAAA,GATAAA,AATATA,AATACA,AATAGA,AAAAAG,ACTAAA),A-rich(AAAAAA)和 None。
PSE :(所有样品中)带有表达的样品的百分比。
Mean RPM:所有样本中每百万PAS reads的平均reads数。
Conserv:PAS是否在其他物种(包括人(H),小鼠(M),大鼠(R)和鸡(C))中也保守,并且我们将在至少两种哺乳动物中保守的PAS定义为哺乳动物保守的PAS。
数据结果下载
PolyASite