想偷偷变生信高手?这六款数据库,让你零代码15分钟完整复现一篇4+免疫类生信SCI!

解螺旋公众号·陪伴你科研的第2514天

文章复现系列

从小白的角度,一刻钟复现生信套路。各位小伙伴大家好,今天给大家带来的是一篇2020年发表在Journal of Cellular and Molecular Medicine(影响因子:4.486)的无代码单基因生信文章套路。全文共有4个图和3个表,让我们一起来看一看这篇文章中每个图表都做了哪些内容吧。

文章题目:TGFβ2 is a prognostic-related biomarker and correlated with immune infiltrates in gastric cancer

复现内容
图1:TGFβ2在不同类型的肿瘤组织和正常组织中的表达水平
图2:TGFβ2表达与癌症患者预后的关系
图3:TGFβ2表达与胃腺癌(STAD)和间皮瘤(MESO)中的免疫浸润水平相关性分析
图4:胃腺癌(STAD)和间皮瘤(MESO)中TGFβ2表达与免疫标志物之间的相关性分析
表1:TGFβ2表达与患者临床病理结果之间的关系
表2 TIMER中TGFβ2与免疫细胞相关基因和标志物的相关性分析
表3:GEPIA中TGFβ2与单核细胞,TAM和巨噬细胞相关基因和标志物的相关性分析
复现工具
◆ 仙桃学术工具
(https://www.xiantao.love/products)
◆Oncomine数据库
(http://www.oncomine.org)
◆ TIMER数据库
(https://cistrome.shinyapps.io/timer/)
◆ PrognoScan数据库
(http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html)
◆ Kaplan-Meier Plotter数据库
(https://kmplot.com/analysis)
◆ GEPIA数据库
(http://gepia.cancer-pku.cn/)

现在一切准备就绪,没时间解释了,快上车!跟着我一起开始复现之旅吧!

Figure 1

TGFβ2在不同类型的肿瘤组织和正常组织中的表达水平

作者分别应用Oncomine和Timer数据库,分析了TGFβ2在泛癌的肿瘤组织与正常组织中的表达水平。

Oncomine数据库复现

登陆Oncomine数据库:http://www.oncomine.org

如果没有注册的话,需要先进行注册,需要注意一点,Oncomine数据库要求必须用教育邮箱才能注册成功。

在搜索框中输入“TGFB2”(在数据库中是不识别β这样的字符的,我们用B来代替),回车之后就会出现结果。

把这张结果图进行部分截取,就可以得到我们的图1A啦。

Timer数据库复现

登入timer数据库:https://cistrome.shinyapps.io/timer/

Timer数据库页面非常清晰明了,在登入的页面也显示了不同分析模块的功能。

点击“Diff Exp”,输入分子“TGFB2”,点击“Submit”,即可得到结果。

仙桃学术生信工具复现

想要做基因在泛癌中的表达差异,其实还有第三种方法,就是我们的仙桃学术生信工具!由于Oncomine数据库需要教育邮箱才能注册,而Timer数据库对网络要求又比较高,相比之下,我们仙桃学术的生信工具就愈发的友好啦。

进入仙桃生信工具(https://www.xiantao.love/products),选择高级版(由于高级版功能最为全面,这里统一使用高级版作为示范)

选择“表达差异(挑)”——“表达差异”——“非配对样本”,在疾病种类处选择“泛癌”,在分子处输入我们本篇文章的分子“TGFB2”,点击确认,就可以收获一张美图啦。

注:因为有些癌种中正常样本数比较少,我们选择用GTEx数据库的正常样本补足。因此我们在这里选择XENA-TCGA-GTEx泛癌数据进行分析。

点击“保存结果”,可将本张图片用于后续拼图;点击“查看大图”可看到完整图片。

这里的参数位置中,我们选择了和复现文章中一样的箱式图,配色我们展现的是仙桃工具默认的NPG配色,如果大家想要更换其它的展现形式,也可以在参数位置自行调整,得到属于自己心仪杂志的风格的配色的图片。

同时,仙桃工具还提供了对结果和方法学的详细描述。大家感兴趣的话也可自行查看~

Figure 2

TGFβ2表达与癌症患者预后的关系

作者为了进一步明确TGFβ2表达在泛癌中的作用,运用PrognoScan数据库及Kaplan-Meier Plotter数据库分析了TGFβ2表达与各癌症中患者预后的关系。

PrognoScan数据库复现

登入PrognoScan数据库:

http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html

当我第一次见到这个数据库时候,被这个朴实无华的界面震惊了,然而学习使用下来发现它的功能确实异常强大,可能在默默教导我们不能以貌取人的人生真谛吧。

使用起来也非常简单,在如图所示的空白框中输入分子,譬如我们本文中的“TGFB2”,然后点击“Submit”按钮,就跳转出到如下界面了:

下拉还可以看到更多数据库中的结果,由于图2A-H都是在这个数据库中得到不同癌种和数据集中的重复图片,我们就选择图2A——乳腺癌中GSE2034这张图片示范接下来的操作。

我们可以看到,数据库中,在corrected P-value和COX P-value两列,当数值小于0.05即我们通常认为的具有统计学意义时,被标红了,这样也能更方便我们找到想要探讨的肿瘤和数据集。找到乳腺癌的GSE2034数据集,点击“PROBE ID”这个位置,我们进入下一个界面。

下拉,就可以看到我们图2A这张图片了。右键即可下载~

Kaplan-Meier Plotter数据库复现

登入Kaplan-Meier Plotter数据库:https://kmplot.com/analysis/

以图2I中,分子TGFβ2在胃癌中与OS的关系为例,我们来看一下,在Kaplan-Meier Plotter数据库中,我们如何实现这张小图的复现。

在右上角肿瘤类型中选择“Gastric Cancer”,在左侧输入我们想分析的分子,选择生存类型,此处我们选择和图2I一致的OS,最后点击左下角的“Draw Kaplan-Meier Plot”按键就可以等待出图啦。

该数据库提供PDF版本的图片可供我们下载后进行后续的拼图。

仙桃学术生信工具复现

在我们的仙桃工具中,也提供了点点点即可一件绘制生存曲线的方法。

在“临床意义(靠)”模块选择“预后分析”——“KM曲线图”,即可进入该模块。

我们这里还是以复现图2I的TGFβ2与胃癌生存OS之间的关系为例:

选择疾病“胃癌”——格式“FPKM”——输入分子“TGFB2”——选择预后参数“OS”,点击“确认”。最后不要忘记保存结果呀~

在这里,为了给大家展示一下我们工具强大的拼图功能,我用同样的方法绘制了胃癌中TGFβ2与PFS的预后曲线,保存后,我们来看一下如何进行拼图:

点击上方“拼图工具”,就可以看到我们之前保存的两张图片啦。

将图片拖进来,然后调整到自己想要的位置及大小即可,工具目前还提供了自动吸附、辅助线等功能辅助我们进行拼图,可以说是手残党的福音啦。

点击“PDF下载”就可以看到拼完的图片了,工具甚至贴心的连“A”、“B”的标注都加上啦,再也不用哭唧唧的每个图片苦苦加字母加到眼花啦。

Table 1

TGFβ2表达与患者临床病理结果之间的关系

在Kaplan-Meier Plotter中,作者还对各个临床病理参数进行了逐个分析在不同亚组中,TGFβ2表达对OS及OFS的影响。我们以图中圈出来的一行作为范例,看一下作者如何得到这个结果的吧。

Kaplan-Meier Plotter数据库复现

登入Kaplan-Meier Plotter数据库后,选择“Gastric Cancer”,在左侧输入分子“TGFB2”,选择生存类型OS,在亚组分析中的StageN中选择“1+2+3”,这时我们可以看到筛选到样本是422例,最后点击左下角的“Draw Kaplan-Meier Plot”按键。

在结果中,我们可以看到该亚组对于生存的HR和p-value。

Figure 3

TGFβ2表达与胃腺癌(STAD)和间皮瘤(MESO)中的免疫浸润水平相关性分析

图A和B显示了在间皮瘤和胃癌中TGFβ2表达和肿瘤纯度和各免疫细胞之间的相关性,图C和图D则显示了个免疫细胞浸润和TGFβ2表达与胃癌及间皮瘤的预后相关性。我们以胃癌为例,在Timer数据库中进行图3B和图3C的复现。

Timer数据库复现

肿瘤纯度及免疫细胞相关性分析:

登入数据库后,选择“Gene”模块,在Gene Symbol处输入分子“TGFB2”,在Cancer Type处选择肿瘤类型“STAD”胃癌,点击提交后,即可得到图3B的结果。

下载PDF格式文件可用于后续拼图。

生存分析:

选择“Survival”模块——在Cancer Type处选择肿瘤类型“STAD”胃癌——在Gene Symbol处输入分子“TGFB2”,点击提交后,即可得到图3C的结果。

仙桃学术生信工具复现

我们仙桃学术的生信工具也提供了免疫浸润相关的分析,那么接下来让我们一起看一下吧。

进入生信工具,选择交互网络(联)——免疫浸润——棒棒糖图。在疾病处选择“胃癌”——选择数据格式FPKM——输入分子“TGFB2”——点击确认,等待出图。

该免疫浸润分析是基于我们工程师小哥哥们处理好后放在云端的TCGA数据,算法应用的是ssGSEA算法,计算了TGFβ2与22种免疫细胞的相关性,相关性越大,棒棒糖的球也越大。

对于相关性显著的免疫细胞,工具也提供了用散点图进一步展示的方式。

选择“散点图”——在疾病处选择“胃癌”——选择数据格式FPKM——输入分子“TGFB2”——在算法出选择我们想要展示的免疫细胞,此处以巨噬细胞为例——点击确认,等待出图。

就得到啦一张非常好看的散点图啦~

Table 2

TIMER中TGFβ2与免疫细胞相关基因和标志物的相关性分析

作者进一步对胃癌中TGFβ2与免疫细胞相关标志物进行相关分析,并以间皮瘤作为对照。将其中典型图片,包括与单核细胞、肿瘤相关巨噬细胞、M1及M2型巨噬细胞的相关性图片展示为图4。

Figure 4

胃腺癌(STAD)和间皮瘤(MESO)中TGFβ2表达与免疫标志物之间的相关性分析

我们以图4E左侧的图片为例进行示范,如何在Timer数据库中进行分析与免疫标志物的相关性分析。

登入Timer数据库,选择 “Correlation”模块,在Cancer Type处选择肿瘤类型“STAD”胃癌,在Gene Symbol处分别输入分子单核细胞标志物“CD86”和我们的“TGFB2”,,点击提交后,即可得到相关性分析的结果。

注:相关性可以根据肿瘤纯度校正,也可以选择不校正。

结果如图所示,和原文中的图形相似但是cor和p值都有一点不同,可能是因为数据库更新所致。

Table 3

GEPIA中TGFβ2与单核细胞,TAM和巨噬细胞相关基因和标志物的相关性分析

作者通过GEPIA在线分析进一步验证了TGFβ2与单核细胞、TAM和巨噬细胞相关标志物的相关性。

GEPIA数据库复现

登入GEPIA数据库:http://gepia.cancer-pku.cn/index.html

在多基因分析中,选择相关性分析。

分别将两个基因输入,选择“STAD Tumor”后,点击“Plot”按钮就可以得到两个基因间相关性分析的结果啦~

仙桃学术生信工具复现

在我们仙桃学术的生信工具,同样也可以对两个基因进行相关性分析。

进入生信工具,选择交互网络(联)——分析相关性分析——散点图。在疾病处选择“胃癌”——选择数据格式FPKM——输入分子A“CD86”及分子B“TGFB2”——点击确认。

从结果的图片中我们可以看出,在基因A处输入的分子是作为X轴的,大家记得不要输反了哟~

好啦,到此为止,这篇4+的文章我们就复现结束了,是不是感觉也挺简单的?快打开你的电脑实际操作一下吧~

—END—
撰文丨银杏
排版丨叶子

国人友好的5分SCI大扩刊,一个多月就接受,新毕业神刊?

国人友好的4分老牌SCI,一审才2周,今年或涨破6分!

肿瘤转移的百般花样儿,都逃不过这篇顶刊重磅综述的火眼金睛!

(0)

相关推荐