生信分析44.乳腺癌的免疫浸润,有点创新

生信论文的套路

  1. ONCOMINE从全景、亚型两个维度做表达差异分析;

  2. 临床标本从蛋白水平确认(或HPA数据库),很重要;

  3. Kaplan-Meier Plotter从临床意义的角度阐明其重要性;

  4. cBio-portal数据库做基因组学的分析(机制一);

  5. STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);

  6. TISIDB/TIMER分析肿瘤免疫特征(机制三)。

该论文所使用到的生信技能是oncomine,TIMER,Prognoscan,km plotter和GEPIA。创新点在于用HPA中的TCGA数据做病理分期和生存率的相关性分析,值得借鉴。

题目一如既往的包括预后价值和免疫浸润表型;肿瘤类型是乳腺癌,女性第一大癌。JAK1是干扰素信号通路上的关键蛋白,属于免疫相关蛋白,既不是膜蛋白,也不是转录因子,而是属于通路蛋白。

摘要写作中规中矩,从基因描述入手,然后转折引出其在肿瘤中价值的探索。从表达差异、到生存分析,再到相关性分析,最后是免疫浸润分析。思路和逻辑明确。

首先是用oncomine+TIMER双确认形式阐释表达差异。经常有果友问到oncomine条件的设置,一般在方法中都有介绍。本文的条件:

The threshold was a P-value of 0.01, a fold change of 1.5, a top 10% gene ranking, and the data had to be from mRNA.

生存分析也是双确认模式——km plotter+Prognoscan数据库。不过,Prognoscan数据是以三线表形式来呈现,而不是前面介绍的生存曲线图。如果非要有个选择的话,芒果倾向于生存曲线,当然更高明的办法是生存曲线(正文)和三线表(补充数据)结合。

km plotter分析基因表达和生存率之间的关系。这里,作者描述生存率的三个参数,全生存率,无进展生存率和无复发率等指标都有显著差异。在展示数据时,有差异的就重点展示(看这里,看这里),无差异的可以放在补充数据,这样重点和意义就凸显出来了。

同时,作者用HPA中的TCGA数据做病理分期和生存率的相关性分析,值得借鉴。芒果尝试了下,作者是直接截图进行PPT编辑,稍显粗糙。但是,这种展示数据的放大可以借鉴。

基因表达和乳腺癌患者临床特征的相关性分析,使用km plotter数据库就可以完成,而且信息更全面(相比GEPIA数据库而言,但GEPIA更方便)。该结果进一步阐释基因差异表达与病理分期的相关性。

GEPIA数据库分析显示,肿瘤组织中JAK1表达与淋巴细胞特异性免疫浸润招募(LYM,lymphocyte-specific immune recruitment )密切相关;而湿实验结果表明,肿瘤组织中JAK1表达显著上调(转录水平,芒果认为可以放在Fig1)。通篇未涉及蛋白表达,算是一点小缺憾吧。

最后,作者用TIMER数据库探索乳腺癌(包括亚型)中,JAK1表达与肿瘤中免疫细胞浸润情况的相关性。这是TIMER数据库免疫浸润分析的显著特征,前面已经多次分享,值得借鉴和学习。

总体而言,该论文从摘要到数据,再到论文思路,逐步递进,环环相扣,尤其是Prognoscan以三线表展示结果,用HPA中的TCGA数据做病理分期和生存率的相关性分析,这些都很值得借鉴。

论文题目

JAK1 as a prognostic marker and its correlation with immune infiltrates in breast cancer.

(0)

相关推荐