仙桃学术 | 2021年6 纯生信老套路,焕发新春!亮点在这些美图上,今天教你复现!

大家好,我是浮浮~
之前有小伙伴反馈说基因家族太难,还是单基因好做一些。
但是单基因的生信文章不太容易发了。
那么今天我们零代码复现一篇今年发表在Frontiers in Oncology杂志上的单基因泛癌生信文章,该杂志最新影响因子已经涨到了6.2分!话不多说,动手复现起来吧。

看图表,梳理思路

Figure1 
主要展示了主变量ATG5在多种正常组织、肿瘤细胞中的表达情况以及癌与癌旁、癌与正常组织中的表达差异情况。
Figure2 
分析了ATG5对33种肿瘤总体生存的影响
Figure3 
绘制了总体生存时间的KM曲线
Figure4 
展示了ATG5在多种肿瘤中的免疫浸润分析(现在免疫浸润是生信分析的热点,几乎所有生信分析都可以靠一下~)
Figure5 
展示了ATG5在多种肿瘤中与免疫检查点的相关性情况
Figure6 
肿瘤微环境(TME)和微卫星不稳定性(MSI)
Figure7 
ATG5与DNA修复相关基因和甲基化的相关情况
Figure8 
最后进行GSEA分析
两个表格展示了GSEA富集到KEGG/HALLMARK的top20条目
本文数据量并不是很大,思路也很简单,现在如果加一些简单的实验完全是可以发的。我们先来进行复现,复现过程中我们会额外补充一些零代码出图的分析,最后还会分享泛癌补实验的技巧。

复现步骤

我们还是以生信分析神器仙桃工具为主进行复现.
进入仙桃学术主页,点击“生信工具”
【高级版】 → 【立即使用】(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)。
首先我们来复现表达差异的结果。
在左侧菜单栏“表达差异(挑)”模块进入,选择“表达差异”菜单,下拉有“非配对样本”和“配对样本”两种选择
我们以非配对样本为例,点击进入页面后,选择“泛癌”疾病数据集,向右拖拽可以看到正常vs肿瘤,或者癌旁vs肿瘤。
右侧参数部分输入分子,这里输入“ATG5”,点击“确认”进行绘图。
结果还不错,虽然表达差异倍数不是很大,但是在多数肿瘤中升高还是具有统计学意义的。
结果这里提供多种格式进行下载,“保存结果”可以上传到历史记录中,可直接用于后续拼图。
好用的拼图功能已经多次详细展示了,这里就不再重复了,还不会的小伙伴可以查看之前的推文,有详细操作过程~
分析基因在正常组织/正常细胞中的表达情况
我们使用的是HPA数据库(https://www.proteinatlas.org/),我们还可以利用该数据库增加一些原文没有的分析结果,一起来看看吧。
进入首页后,在检索框中输入主变量分子,点击“Search”进行检索。
由于只是基本检索,结果会显示所有模糊检索到的内容,但一般第一条就是我们想要的基因。
点击“Tissue”,可以查看ATG5在正常组织中的表达情况:
点击“Cell Type”,可以查看ATG5在正常细胞中的表达情况:
将上述图片进行拼图即可完成第一张图片。
此外,我们还可以“顺手”增加一点分析。
还是HPA数据库刚才的页面,点击“Pathology”,进入后向下翻,找到“PROTEIN EXPRESSION部分”,这里显示了多种癌症组织的免疫组化结果。
关于HPA数据库就不过多介绍了,解螺旋官网单元课中有该数据库的详细免费教程,感兴趣的小伙伴可以去学习一下~
接下来是预后分析,回到仙桃工具,左侧目录中点击“临床意义(靠)”中的“预后分析”,展开后进入“KM曲线图”
由于仙桃工具有记忆功能,所以分子不需要重复输入。不过这里不能直接选择泛癌,我们需要多次更换疾病。
这样我们就可以获得HR和P值。
当然,我们可以将结果保存或者下载,拼图后就是原文的Figure3
当我们在所有癌种中分析完,可以得到ATG5在各个癌种中的HR和p值,进入“基础绘图”菜单,找到“森林图”点击进入。
这是需要上传数据的,一般我们会下载示例数据,然后按照示例数据格式,将我们的数据进行整理,如下
这样我们就得到了原文的Figure2,如果不喜欢默认风格可以在右侧参数部分进行更改。
接下来是免疫浸润分析,在“交互网络(联)”中有“免疫浸润”,下拉后选择“散点图”。
点进去还是一样的风格,分子是输入好的,然后不断变换疾病即可
如果想改变默认风格可以在右侧参数中修改,鼠标点一点就能实现,十分方便。此时我们可以保存结果,后面直接用仙桃工具拼图,也可以下载PDF或者TIFF格式文件进行保存。
这里默认展示T细胞的浸润情况,在参数中有一个“算法参数”栏,里面可以选择细胞,可以按照原文选择,也可以都进行分析,最后选出比较好的结果进行展示。
提到免疫浸润,我们就再多讲一点,这里还可以增加一些分析,丰富文章内容。刚才复现原文使用的是“散点图”模块,我们可以再看一下“棒棒糖图”
通过调整参数,我们可以得到横向的免疫细胞浸润棒棒糖图。
这么好看的图片放在文章中一定会为文章增色不少。
其实仙桃工具还有“分组比较图”模块,感兴趣的小伙伴可以试一下,也是一键出图,十分方便~
接下来我们继续复现Figure5,ATG5在泛癌中与免疫检查点基因的相关性热图。
如果要完全复现这张图,首先我们要获得相关系数。还是在“交互网络(联)”中,下拉“分子相关性分析”菜单,找到“单基因共表达热图”点击进入
在右侧参数的“分子列表”中输入免疫检查点基因,点击确认出图。
可以得到ATG5在单一肿瘤中的相关性热图。页面继续向下翻
在结果说明中,显示了分子-分子相关性情况,其中有ATG5与其它分子的Pearson系数和Spearman系数以及对应的p值,可以保存这些数值绘制相关性热图。
在“基础绘图”中找到“相关性热图-相关矩阵”,按照示例数据格式将刚才保存好的数据整理好
首先输入的是Pearson系数或者Spearman系数,也就是相关系数
在子数据表位置可以选择“p值”的子数据表,然后将对应的p值输入
上传数据验证成功后,点击“确认”进行出图。
在右侧可以调整参数,得到个性化的结果图片。
对了,基础绘图的大部分模块都有相应的训练营,可以联系仙桃班主任进行报名~
接下来是TME和MSI的雷达图,目前仙桃工具可以绘制雷达图,但是还没有上线TME和MSI泛癌的在线分析,如果大家有相关数据,可以进入“基础绘图”中,点击“雷达图”进入
我们先来上传示例数据出图,看一下可以得到什么样的图片。
这里可以得到三个基因在多个分组中的相关性情况,如果只输入一个基因,将分组换成泛癌即可得到原文中的图片,敬请关注仙桃工具后续更新
接下来是Figure7,ATG5与DNA修复相关基因在泛癌中的相关性,与刚才免疫检查点基因类似,只要将分子列表更换一下即可,这里就不再重复演示了。
这里第二张小图是ATG5在泛癌中甲基化的情况,这里我们没有完全复现,但是可以利用仙桃工具展示更多更美观的图片
在“交互网络(联)”中可以看到“DNA甲基化”,下拉菜单,点击“分子表达相关性”
选择疾病的位置没有变,不过输入分子的框在疾病的下方,输入分子名称和探针,这里可以逐个输入探针,选择结果比较好的进行展示
这样就可以得到ATG5在各个肿瘤中甲基化的相关性结果,最后筛选结果比较好的图片拼到一起展示即可
最后我们来看一下Figure8,GSEA富集分析。
原文是根据ATG5的表达高低分组,然后找出差异基因,接下来对这些差异基因进行GSEA富集。
这一点仙桃工具也可以零代码轻松实现,不过由于仙桃工具的这个模块目前还没有收录泛癌的数据,所以我们需要分别获取数据,最后整理到一起
选择“表达差异(挑)”,下拉“差异分析”菜单,点击“单基因差异分析”进入
分子仍然不需要输入,只需要选择疾病,我们这里随机以宫颈癌为例进行演示,点击“确认”提交分析
该分析结果需要一点时间,但一般3-5min就可以了
喝杯茶的功夫再点击上方的“历史记录”查看,分析已经完成了
也是有多种格式可供下载
下载后查看一下,可以看到差异基因表很全,gene symbol、ensembl ID、logFC、padj。
其实GSEA分析只需要输入gene symbol和logFC即可。
接下来我们可以用同样的方法分析多种癌症的ATG5分组的差异基因,汇总后可以直接去掉重复值,也可以将重复值的logFC取平均值
之后进行GSEA富集分析,仙桃工具可以一键分析 可视化出图。
进入“功能聚类(圈)”,下拉“GSEA富集”,首先点击“GSEA分析”
整理数据,id这列是gene symbol,value可以输入logFC值
将整理好的数据上传,右侧参数可以选择默认
点击确认提交后,这个分析也大概需要1min的时间即可完成
完成后在历史记录中可以下载完整的GSEA表格,即为原文中的table。
继续进行GSEA可视化可以直接点击左侧菜单栏的“GSEA可视化”
进入后直接即可看到刚才进行的GSEA富集分析,点击“确认”进行可视化出图
如果想要改变可视化的条目,可以在右侧参数部分进行设置
在参数的“基本参数”中可以填写“基因集ID”,可以在刚才保存的GSEA富集分析结果中选择想要展示的条目粘贴到这里
如果我们想要对比多个结果的话,可以进行山峦图可视化。
仍然是在GSEA富集模块,工具不久前更新的“GSEA山峦图”
点进去的界面与GSEA可视化相同,直接点击“确认”
就可以得到非常漂亮的山峦图了,可以与上一步得到的可视化图片联合展示
到此我们复现结束啦,本文工作量不是很大,在复现过程中又给大家推荐了几个可以增加的内容,使用仙桃工具都可以轻松出图。
最后和大家分享一下泛癌如何补实验~
其实泛癌的文章并不需要将所有癌种的实验都做到,只要做其中典型的几种就可以。
比如挑选表达差异结果比较高的癌症,最简单的就是在临床收一些癌vs癌旁的组织,可以提取RNA进行qPCR检测,或者做免疫组化;
还可以选一些细胞系,不需要任何操作,养起来就直接收细胞检测目的基因的表达,不过需要正常细胞系作为对照。
如果稍微复杂一点的,可以构建敲低/过表达质粒,转入细胞(转染、感染均可)后做些简单的功能实验,比如CCK8检测增殖、流式分析细胞周期等等。
我们也推出了许多仙桃工具相关的训练营,包括但不限于基础班训练营、高级版训练营、文章复现训练营、分模块教学的快闪营、写作工具训练营等等,还没有入手高级版的小伙伴们不要犹豫了,早买早发文,也祝大家早日发表属于自己的生信文章!

END

6 纯生信老套路复现流程太详细了吧~
自己也想成为套路的王者,如何能学到这套路呢?
扫下方二维码回复“复现”即可免费加入训练营
(0)

相关推荐