《自然》子刊:最常见的致癌突变,跟你想的真不一样!
最近,《自然·通讯》杂志发表了一项来自Salk研究所科研团队的研究成果,科学家们采用新的方法重新统计分析了泛癌种中致癌突变基因的频率,发现结果竟与我们的既往认知差之千里(至少也有五百里)。例如既往研究结果普遍显示,RAS致癌基因在所有人类癌症中出现的频率大约在30%-33%,但实际上这个数字只有15%,不足此前的一半。研究者认为,这是由于许多致癌突变与癌症类型有关,很多癌种发病率较低,那么在该癌种中致癌基因出现频率再高,放到泛癌种中也是相形见绌了。虽然这话好像是谁都懂的大道理,不过在目前越来越倾向于“不限癌种,只看突变”的科研思路下,这篇论文可谓提供了一个全新的视角。常见突变基因的鉴定对于药物开发非常重要,许多有价值的药物靶点实际上就是癌蛋白。近年来越来越多的临床试验设计采用了“篮子试验”的套路——把不同癌种同一靶基因的患者放到一个篮子里。“不限癌种”新药拉罗替尼(larotrectinib)、恩曲替尼(entrectinib)和帕博利珠单抗(pembrolizumab)就是成功的范例。那么问题就来了,人类癌症中最常见的突变基因是什么?令人惊讶的是,我们不知道!这事儿按理说不难,毕竟我们有那么多癌症基因组学数据库可用,cBioPortal、COSMIC、TCGA、AACR GENIE、MSKCC impact什么的,跟流行病学数据对一对算一算,不就有结果了嘛。然而真的算起来,就知道问题在哪了……美国国家癌症研究所(NCI)的SEER数据库从上个世纪70年代中期开始跟踪记录美国的癌症发病率,它采用的是国际肿瘤学疾病编码第三版(ICD-O-3),包括两个指标,一个是肿瘤起源的解剖学位置,一个是肿瘤的组织学分类。但是呢,很多癌症基因组学研究根本没整ICD-O-3啊,乳腺癌、胰腺癌这么大致一分就完了。数据对齐一下就好?真对不齐!为了解决这个问题,研究者们开发了一个新的分类系统ROSETTA(Reclassification Of Sequencing and Epidemiological Tumor Type Annotations),强行把两边拉到一个标准,由此得到了各个癌种在所有癌症中的占比。最常见的五种癌症是乳腺癌、前列腺癌、结直肠癌、肺腺癌和恶性黑色素瘤,加起来占50%以上;前十名合计占比达到68.7%。而值得注意的是,一些泛癌种研究,并没有全部包括这十种癌症。这下能和癌症测序数据拉齐了!这项研究里共纳入了19181名癌症患者的外显子数据,来自139项不同的研究。高亮:这次分析中仅包括了错义突变、无义突变和短插入缺失突变(indel),基因融合、内含子突变或拷贝数突变等情况就没有考虑了(等下回吧)。虽然数据已经足够多了,但是研究者们发现,现在还是只能代表大约93%的病例,所以剩下的7%是综合其他数据的比例加权计算的。对比2013年和2018年发表的两个TCGA泛癌分析(52%/85%),代表性还是很好的。比较之下,差异就出来了。在2013年的研究中,VHL和BRAF突变发生率分别为7%和2%,但在本次研究中位1%和8%;在2018年的研究中,KRAS、APC和IDH1突变频率分别为%、6%和6%,但在本次研究中为11%、10%和1%。研究者认为,这很可能是因为在TCGA中数据的比例和实际发病率并不成正比,很多癌症是被“过度代表”了。(还是加权好)当然了,现在也没有一个黄金标准,等未来的研究能够覆盖更多癌症类型,数据还会进一步精准。现在我们来看看,到底哪些致癌突变基因更常见吧。最常见的致癌突变基因是TP53,35%的新发癌症有它;而被认为最常突变的原癌基因KRAS,其实只有11%,还排在PIK3CA(13%)后面;排名靠前的还有BRAF,占8%。前十名里KMT2C、KMT2D、ARID1A是表观遗传修饰相关基因,可见癌症中表观遗传失调实在非常常见。研究者还分析了蛋白激酶基因的突变频率。最常见的突变激酶是TTN(30%)和OBSCN(9%),可能因为这俩蛋白特别大,可突变的地方比较多[7]。BRAF和ATM的频率分别为8%和5%,剩下的蛋白激酶都不到5%。当然了,这些蛋白激酶未必都适合作用药物靶点,所以突变频率高≠能搞药。与人类癌症关系匪浅的RAS通路也没有被放过。既往研究认为,所有癌症中存在KRAS、NRAS、HRAS中任意一个的概率大约在30%-33%[8-10],但是这项研究给出的数字是15%,不到先前的一半。一些数据:胰腺癌是RAS突变频率最高的常见癌症,所有测序样本中近90%存在KRAS突变,但胰腺癌的病例数还不到新发癌症的3%[11];最常见的两种癌症,乳腺癌和前列腺癌,占了29%的新发病例,基本不出现RAS突变。接下来研究者们分析的是不同组织学分类的癌症与突变频率。最常见的组织学分类是腺癌(AC)和鳞状细胞癌(SCC)。大部分突变基因在两者之间的差距不到5%。腺癌比鳞癌高的仅有KRAS和APC突变频率差距较大(14%vs1%,13%vs5%);鳞癌比腺癌高的主要有LRP1B(23%vs10%),KMT2D(16%vs7%),FAT1(15%vs5%),CDKN2A(12%vs2%),NOTCH1(10%vs3%)和NEF2L2(10%vs1%)。第三常见的组织学分类为黑色素瘤,其中突变频率最高的是BRAF——既不是TP53也不是PIK3CA,显得比较独树一帜。而第四名移行细胞癌的前十常见突变中有七个是与表观遗传和转录调控有关的。(生物谷Bioon.com)