MATH值量化肿瘤异质性受软件干扰太大而且临床意义不明显

前面我们看的文章都是说肿瘤异质性显著影响病人生存,而且MATH值很可靠,今天分享的发表在 Sci Rep. 2018 Jul 的文章就是来啪啪啪打脸的。

值得提醒的是比这篇文章晚4个月处理的Oncotarget. 2018 https://doi.org/10.18632/oncotarget.26485 做的是类似的研究,但是结论大相径庭。

本研究作者同样是下载TCGA数据库的不同癌症病人的肿瘤外显子的somatic的maf格式文件,但是包括了3个软件:MuTect, SomaticSniper, and VarScan ,3个软件的MATH中位值分别是:

  • VarScan (35.4 ± 5.7)

  • SomaticSniper (24.4 ± 4.8)

  • MuTect (30.3 ± 5.9)

不同软件得到的maf数据算出来的maf值有偏差,不过不显著,但是受该样本的CNV影响很大,最后发现跟生存关系很微弱,不显著。

有趣的是作者在文章里面描述的是自己拿到了TCGA数据库的bam文件后,自己在亚马逊云服务器重新走了这3个软件的分析过程。

计算耗时惊人:The average time required to run a task was 2 hours and 25 minutes. We ran a total of 14865 jobs, with total wall time of 1496 days. (完全不理解作者自己重新计算一般的意义所在,明明TCGA数据库提供maf文件啊)

也给出了3个软件的运行参数:

包括的癌症是:

  • breast invasive carcinoma (BRCA),

  • colon adenocarcinoma (COAD),

  • glioblastoma multiforme (GBM),

  • head and neck squamous cell carcinoma (HNSC),

  • kidney renal clear cell carcinoma (KIRC),

  • lung adenocarcinoma (LUAD),

  • ovarian serous cystadenocarcinoma (OV),

  • prostate adenocarcinoma (PRAD),

  • skin cutaneous melanoma (SKCM),

  • stomach adenocarcinoma (STAD),

  • uterine corpus endometrial carcinoma (UCEC)

需要去除CNV对MATH值的影响

Copy number variations (CNV) can influence allele frequencies and may indirectly shape their distribution. To assess this effect, we repeated the analysis after removing somatic SNVs with copy number aberrations (|CNV| > 0.2).

MATH值并不能很好的区分生存

这个是作者的结论:heterogeneity as quantified by MATH is not a strong predictor of patient survival,是不是感觉不同团队的数据分析很有趣啊,但是你呢,你会任何一个吗?

(0)

相关推荐