100篇泛癌研究文献解读之根据点突变和拷贝数变异共同分组
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
本文发表于Nat Genet. 2013 Oct;题目是: Emerging landscape of oncogenic signatures across human cancers. 主要关心其定义的selected functional events (SFEs),系统性的研究TCGA数据库的12个癌症的3299个病人数据,并且把癌症病人分成 mutations (M class) or copy number changes (C class) 两个组。文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html
样本选择
研究者选取了12个癌症的3299个病人数据,主要是GISTIC和MUTSIG算法对CNV和SNV进行处理,样本量如下:
挑选selected functional events (SFEs)进行分组
对CNV事件的选择
对SNV事件的选择
对甲基化事件的选择
关于M和C组
这里指的是:
recurrent mutations (M class)
recurrent copy number alterations (C class).
可以看到不同癌症的病人分属于M组和C组的个数不一样:
要有临床意义
作者最后声称他们的数据分析是基于 in a way that reduces its complexity (noise) and increases its biological and clinical interpretability (signal). 实际上却并没有涉及到临床意义的探索,甚至连生存分析都没有。
后记
本研究有点简单了,但是发的杂志很不错,其实很容易复现出来,不过我无法理解它的引用为什么会有七百多次。
当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!
详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html
TCGA教程长期更新列表
TCGA的28篇教程-使用R语言的cgdsr包获取TCGA数据(cBioPortal)
TCGA的28篇教程-使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据 (FireBrowse portal)
TCGA的28篇教程-批量下载TCGA所有数据 ( UCSC的 XENA)