KM-plotter 数据库:基因表达与疾病预后信息好帮手

KM-plotter(https://kmplot.com/analysis/) 是一个在线进行生存分析的网站,数据最全并且是生存分析最权威的网站。在已发表的论文中,生存分析的数据多来自KM Plotter数据库。

网站简介

/数据库功能
可针对54,675 个基因、18,674个癌症样本展开研究,评估在21种癌症中54000个基因对生存率的影响,查看4种肿瘤的预后信息,包括乳腺癌,卵巢癌,肺癌和胃癌的mRNA的预后信息,其中乳腺癌还可以做microRNA的预后信息。目前数据库在mRNA水平的研究数据最充分,miRNA和protein水平的研究也已经有大量数据,而DNA水平的研究尚在研究中。
/数据数据类型
有芯片数据、高通量测序数据,涉及mRNA和miRNA,并且在不断丰富之中。
/网站使用方法
一般是对相关研究数据进行分析(譬如针对GEO数据库数据、TCGA数据库数据进行分析),筛选biomarker之后,再利用该网站对目标基因进行生存分析验证,在分析某一特定基因的预后价值时,Kaplan-meier Plotter数据库以该基因表达量的不同分位数为标准将患者分为两组,通过Kaplan-meimer生存图对两个队列进行比较并计算出HR,95%CI以及logrank P值。从而佐证并丰富实验结果,且图片可以直接用于论文无需后期处理,可以与PrognoScan数据库进行相互补充。

使用操作

菜单操作主要分3块,一块是基因的选择和预后结局指标的选择,一块是GEO芯片的探针选项,另外一块是亚组分析的选项。

模块一:选择基因和预后结局指标

Affy id/Gene symbol--输入基因或者基因对应的探针号;

由于KM-plot可识别70,632个基因符号,包括HUGO基因命名委员会批准的官方基因符号、以前的符号和别名——所有这些都列在结果页面中,由于不同的基因名称可能重叠,Kaplan-meier plotter数据库建议交叉检查所选基因的ID。

输入基因字母,系统弹出待选基因

KM-plo也支持多基因分析。点击“Use multiple genes”按钮,输入多个基因。同时对所有这些生物标志物进行分析(默认设置),或者使用基因的平均表达,勾选“使用所选探测的平均值表达式”单选按钮,最多允许65个基因。网站可以做多个基因联合来区分病人预后的选项Use multigene classifier。

Split patients by--队列分组的依据,包括中位数、分位数等选项,一般是用中位生存时间进行分组;

Survival--输入结局指标,包括RFS、OS、DMFS、PPS等。

模块二:针对基因相应探针序列进行设置

由于一个基因可能会对应多个探针序列,所以有时候你会看到在Affy id/Gene symbol里输入基因时会看到多个Affy id让你选择,第2块内容的选项就是针对这种情况的。

user selected probe set---指分析勾选的那个探针的结果

all probe sets per gene---分析一个基因所对应的所有探针的结果,再取平均值

only JetSet best probe set---指先选择合适的探针集再进行分析。

中部右侧绿色方框的数字显示实时样本数量。

模块三:调试亚组分析结果

用户可以根据自己的需要做相应的亚组分析。左框【Restrict analysis to subtypes】可以更改筛选不同的疾病亚型;右框【Restrict analysis to selected cohorts】---可以更改筛选不同病人的治疗方案。

数据库中只有两种肾癌的亚型,KIRC和KIRP;亚型分析包括,病理阶段stage,性别gender,种族race,分级grade,突变负担Mutation burden;细胞类型包括各种免疫细胞,可以先选择all。

完成基因各系数输入选择后,点击“Draw Kaplan-Meier plot”即可出图。

胃癌基因MET作为案例实践:

点击运行之后就会出现下面的界面,显示你的参数设置和最后想要的KM预后图。

点击Download plot as a PDF,即可得到该基因表达的KM曲线图,放入论文里大功告成了。

值得注意的是:KM Plotter目前只能为四大肿瘤(乳腺癌、卵巢癌、肺癌和胃癌)提供详实的特定基因的高表达和低表达组生存分析,不能选择TCGA特定的数据库。希望在不久的将来,更多瘤种等都能逐步收录进KM Plotter。

(0)

相关推荐