三大生信网站做SCI神助攻

打开网址 (http://www.oncolnc.org/),简洁的界面如下:

输入你感兴趣的基因(TP53),点击`Submit`提交,然后选择感兴趣的癌症类型,点击`Yes Please!
继续分析流程,然后选择高表达和低表达的分界线,例如表达处于低于50%的梯度的定义低表达,高于50%的梯度定义高表达,那么就在Lower/Upper Percentile中输入50并提交,最后得到成图。
恭喜!完成了生存曲线的绘制!如果你需要的就是此图,那么就可以保存PDF下载下来使用了。本网站数据来源是TCGA数据库,为了确保生成曲线的准确性,小榴莲也下载过原始TCGA数据自行分析,和网站生成的曲线比对最后得到结果完全一致。

进阶一:生成曲线页面还有一项信息,如下图,记录了TCGA数据库中病例ID、生存信息、表达量。如果觉得网页生成曲线比较丑,可以利用网站提供的生存信息自己绘制出更漂亮的生存曲线。 

进阶二:了解TCGA数据结构的同学们都知道patient ID的绝对重要性,我们可以利用网站给出的数据细节(patient ID),结合TCGA数据库,可以大大降低我们分析TCGA数据的繁琐程度。例如我们如果要探究的是某基因在三阴性乳腺癌/单阴乳腺癌中的表达和生存预后关系,我们只需要下载TCGA中的`clinical data`结合本网站的数据就可以比较轻松地实现,不用过于繁琐地下载分析表达数据。

进阶三:onclnc不是绘制生存曲线最强大的网站,但绝对是最简单上手的网站,除了oncolnc,绘制生存曲线还有强大全面的UCSC Xena网站、数据量丰富的Kmplot网站(但是癌症类型有限)等网站可供选择。下面是一个小总结。

|生存曲线绘制|xena|oncolnc|TCGA自行分析|
|:--:|:-:|:-:|:-:|
|数据时效|低|低|高|
|原始数据下载|yes|yes|yes|
|难易程度|mid|easy|very hard|
|曲线结构调整|no|yes|yes|
(0)

相关推荐