TCGA蛋白分析数据库
功能蛋白质组学是对蛋白质在功能活性水平(例如表达和修饰)的大规模研究。对诸如癌症等复杂疾病的研究表明,遗传改变并不能说明该疾病的所有原因。蛋白质水平和结构的变化也已显示在肿瘤发展和进展中起关键作用,而遗传变化并未反映出这一点。在癌症中,疾病的发展通常需要几种遗传和表观遗传学改变。今天给大家介绍一个用于访问,可视化和分析患者肿瘤样本功能蛋白质组学的综合资源:TCPA(https://www.tcpaportal.org/)。
该网站结合了反向蛋白质阵列(RPPA)和TCGA的蛋白质组数据库,可以后续结合TCGA的临床数据进行分析。
每个体系都包括4个方面,基本操作一致,我们这里以肿瘤样本为例简要介绍一下该数据库的使用。
点击View details。
进入,可以发现具体包含4个在线分析工具:
Summary
主要为各个肿瘤的数据预览。包括数据集所含样本数目、样本来源、蛋白质数目等信息。点击Details列的Show,可以查看该数据集的详细信息。
My Protein
蛋白在所有癌症的分布。下表显示了蛋白质的详细信息,包括相应的基因、验证方式和抗体来源等。
通过底部快速搜索栏进行快速定位,我们可以选择感兴趣的蛋白。
点击View列下的绿色+,可以查看该蛋白在不同肿瘤中的表达情况,以箱式图表示。
Visualization
可视化-网络和热图。可以发现,包含网络可视化及热图可视化
(1)Network Visualization
选择欲要查看的肿瘤类型,由于Adobe在2020年12月31日之后就不再支持Flash Player,所以这部分内容暂时是无法查看的,下面是小编从百度上找到的一张图片,大致内容是这些。
(2)Heatmap Visualization
热图可视化。进入之后,选自自己感兴趣的肿瘤,下面有三个图,K=3,K=4,K=5,分别是指需要分几个cluster,也就是肿瘤分型。
这里选择K=3,选择进入之后就可以得到结果热图,然后左上角Misc-PDF就可以下载PDF格式图片。
Analysis
包括在单个癌症分析和泛癌分析
(1)Individual Cancer Analysis
主要包括蛋白的相关性分析,差异表达及生存分析
1)相关性分析
选择欲要查看的数据集后,底部输入目标蛋白,即可进行查看。
2)差异分析
可以对某个具体肿瘤的不同亚型进行分析,也可以对不同肿瘤进行分析。
3)生存分析
具体操作同上,选择数据集,输入目标蛋白即可。
(2)Pan-cancer Analysis
由于Pathway Centric Analysis数据在更新中,暂时打不开,所以我们就Protein Centric Analysis进行简要介绍。
可以发现主要包括临床分级分期等、DNA、蛋白及RNA相关信息。具体操作同上。
下面是小编随意点的几张结果图片来具体展示。大家需要的时候,输入自己想要查询的蛋白即可。