cytoscape的十大插件之--cytoHubba插件
五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧!见:生信必备技能——Cytoscape
一、软件下载
cytoscape 毋庸置疑是最出名的网络可视化神器,过万的引用率是最强大的口碑,它支持的网络种类很多。比如蛋白互作(PPI)、转录调控网络图(TF-target)、网络聚类模块分析(Module)、miRNA调控靶标基因网络图、竞争性内源RNA网络(ceRNA)、通路交互网络(pathway-crosstalk)。Download Cytoscape
目前已经进化为一个平台,上面可以有成千上万的各种数据分析工具的扩展插件。包括我即将介绍的:
ls -lh /Users/jimmy/CytoscapeConfiguration/3/apps/installed/
-rw-r--r-- 1 jimmy staff 15M Jan 29 17:33 BiNGO-v3.0.3.jar
-rw-r--r-- 1 jimmy staff 6.6M Jan 29 17:13 Bisogenet-v3.0.0.jar
-rw-r--r-- 1 jimmy staff 7.8M Jan 29 17:37 DisGeNET-app-v6.0.2.jar
-rw-r--r-- 1 jimmy staff 3.3M Jan 29 17:27 KEGGscape-v0.8.2.jar
-rw-r--r-- 1 jimmy staff 189K Jan 29 17:15 MCODE-v1.5.1.jar
-rw-r--r-- 1 jimmy staff 246K Jan 29 17:28 WordCloud-v3.1.2.jar
-rw-r--r--@ 1 jimmy staff 47M Jan 29 17:24 cluego-plugin-2.5.3.jar
-rw-r--r-- 1 jimmy staff 17M Jan 29 17:29 clusterMaker2-v1.3.1.jar
-rw-r--r-- 1 jimmy staff 725K Jan 29 17:11 cytoHubba-v0.1.jar
-rw-r--r-- 1 jimmy staff 135K Jan 29 17:28 enhancedGraphics-v1.2.0.jar
-rw-r--r-- 1 jimmy staff 48M Jan 29 17:40 iRegulon-v1.3.jar
-rw-r--r-- 1 jimmy staff 2.0M Jan 29 17:28 stringApp-v1.4.1.jar
这些插件的安装问题,我简单说一下,官网有个下载地址:http://apps.cytoscape.org/ 调用浏览器下载jar文件,但是需要自己移动到cytoscape的APP目录:
mv ~/Downloads/cluego-plugin-2.5.3.jar /Users/jimmy/CytoscapeConfiguration/3/apps/installed/
上面的mac用户代码,对应Windows用户或者linux需要自行探索。(或者我们有视频直播课程,在:生信必备技能——Cytoscape ,感兴趣的可以加入学习)
推荐在这里下载cytoscape的APP:https://apps.cytoscape.org/apps/all 会自动检查自己电脑是否已经安装。
二、cytoHubba插件
1、简介
目的:先用STRING网站构建PPI网络,当存在上百个基因的对应关系时,就需要再利用插件通过拓扑网络算法给每个基因赋值,排序发现其关键基因(hub gene)和子网络
cytoHubba根据nodes在网络中的属性进行排名。它提供了11种拓扑分析方法,包括:
Degrre
Edge Percolated component
Maximum neighborhood component
Density of Maximum Neighborhood Component
Maximal Clique Centrality
six centralities(Botteleneck,EcCentricity,Closeness,Radiality,Betweenness, Stress)
那应该挑选哪种方法进行分析呢?
这篇文章 cytoHubba: identifying hub objects and sub-networks from complex interactome 对酵母菌的必需蛋白进行验证,比较不同方法得出关键基因的精确度以及任意两种评分方法中排名前100位的共同蛋白质的数量 结果:可以看出MCC方法得出来的结论是最佳的,都能得到更多且排名靠前的蛋白质。所以运用这个方法得到我们的关键基因说服力是很强的! 各种方法的具体算法这篇文章也有,我就不具体阐述啦,大家可自行去了解。 https://pubmed.ncbi.nlm.nih.gov/25521941
2、操作演示
2.1 插件下载:
首先点击 App Manager
在 Search
中输入所需要的插件:cytohubba
。之后点击右下角的install
,因为我已经下载好了所以这边是显示灰色。示例数据:Yeast Perturbation 如果页面没有,大家也可以通过安装Cytoscape的路径sampleData\sessions载入 下载成功会发现左边操作页面上出现了 cytoHubba
的选择
2.2 了解数据
此网络是由两种数据构成:galExpData.csv; importNetworkFromFile.csv
成功载入网络之后,可出现相关节点,边的数据在页面中
2.3 提取关键基因
1、首先选择左边的cytoHubba
进入工作页面
2、Target Network
选择待分析的网络
3、点击Calculate
4、点击Top 10
,可根据自身课题需要,调整提取关键基因的数量
5、下方MCC
可下拉选择计算方法
6、Particular nodes
:选择感兴趣的基因进行分析(一般是对整个网络分析的话,此项可以忽略)
5、点击左下方Display the shortest path
:显示最短的路径
(Check the first-stage nodes
:显示出hub gene连接到的第一个节点
Display the expanded subnetwork
:显示出最长的子网络)
6、右边的列表就显示关键基因的排名:颜色越深,证明分数越高,越显著
7、下方可选择Save Current Rank
2.4 输出结果
因为软件自动生成的图形edges有数字,并且都用虚线
现在就来示范一下如何根据自己的需求美化网络
1、左边列表点击style
2、下方针对调整对象进行选择,Node:节点;Edge:边
3、需要点击Edge color to arrows
才可以进行调整
4、如果是需要选择/删除/隐藏所有节点或者边时,可通过菜单栏的Select
进行选择
5、这里就可以通过点击Label
和Line Type
中的Remove Bypass
删除数字和虚线
6、输出图像
2.5 结果解读
这里的Score就利用MCC算法评估节点与边的关系得出来的,显然得分越高越关键 这里显示YMR043W基因最关键,分数最高 如果更谨慎的话,可利用多种方法求取关键基因,后提取共同的基因进行下游分析,例如: