之前我们推过免疫细胞signature,也推过免疫基因signature相关的文章,但是你见过整合分析的文章吗?今天就领着大家来看看是如何分析的,文章10月发表于OncoImmunology杂志(IF:5.869)。
生信人提供新颖、正规、可复现的
生信分析服务
扫码联系
结直肠癌患者中免疫浸润和免疫基因signature预测基于氟嘧啶的化疗反应
研究概述| 免疫反应与化疗诱导的细胞毒性有关。利用免疫风险模型(Imm-R),预测接受氟嘧啶化疗的患者的预后情况。数据概览|4个数据集的基因表达谱及相应临床信息,分为训练集和验证集。(GEO数据库)分析亮点|免疫反应对氟嘧啶化疗结果的影响提供了新的理解,构建了预测化疗预后的两个免疫相关模型:TIICs(免疫细胞)和Imm-R(TIICs+免疫基因)。首先还是要说肿瘤和免疫相关概念,肿瘤浸润性免疫细胞(TIICs)是由多种类型的免疫细胞组成的肿瘤免疫微环境,这包括T细胞、巨噬细胞、中性粒细胞等。不同的TIICs亚型,在不同的情况下表现出免疫促进或免疫增强的能力。TIICs的组成和丰度是患者生存的潜在预测因子,如渗透性CD8 + T细胞水平高,与较好的预后相关,而调节性T细胞(Treg)与结直肠癌(CRC)患者较差的临床结果相关。而复杂的免疫分子网络调控的免疫反应是级联反应,有趋化因子,细胞因子,主要组织相容性复合体(MHC)分子,以及共刺激,免疫调节,和细胞毒性介导分子参与,它们被称为免疫相关基因(IRGs)。IRGs的表达也与预后相关。知道这些后,看看文章是怎么将化疗效果和它们结合起来的,下面将以观点分析和数据结果阐述:我们要对数据有整体把握,首先从GEO数据库中获取公开的CRC基因表达数据集,GSE39582,65 GSE103479,66 GSE72968,67和GSE7296967。GSE39582包含II-IV期患者,GSE103479来自于II-III期CRC患者,而GSE72968和GSE72969包括转移性CRC患者。分为set1训练集-验证集(GSE39582-GSE103479)和set2训练集-验证集(GSE72968- GSE72969)。获得相应的CRC样本的临床特征。总生存期定义为从诊断日期到死亡的时间长度。另外对于耐药机制研究,还获取了一个来自野生型和5-FU诱导耐药的HCT-8人结直肠癌细胞的微阵列数据集(GSE81005)。如下图1所示,纳入研究的CRC患者概况与数据分配情况。为了评估CRC样本中TIICs的丰度,这里采用了 CIBERSORT算法,该算法可以敏感并特异性区分22种人免疫细胞表型(B细胞、T细胞、NK细胞、巨噬细胞、DCs和髓系亚群)。CIBERSORT是一种基于支持向量回归的反卷积算法,它使用一组对应于每个细胞类型最小的参考基因表达值,来推断混合细胞类型的大肿瘤样本数据中的细胞类型比例。CIBERSORT利用Monte Carlo sampling计算反卷积的经验p值来表示结果的准确性,p值<0.05表示推断出的细胞成分较高可靠的。因此,系统地评估了纳入训练集的患者中22个TIICs亚群的丰度。四个TIICs被确定与TNM分期相关(图2a)。CD8 + T细胞随着TNM分期的增加而下调(p = .036),而单核细胞(p = .045)、嗜酸性粒细胞(p = .0061)和活化的肥大细胞(p = .032)随着TNM分期的增加而上调(图2a)。相关分析也显示CD8 + T细胞比例与其他三种细胞呈负相关(图2b)。而CRC与TIIC临床特征关系,表现在KRAS突变的CRC中激活的记忆CD4 + T细胞和M0巨噬细胞的丰度低于野生型CRC临床特征(图2d、图2e)。肿瘤浸润免疫细胞特征的构建,首先应用单变量Cox比例风险回归模型来定义总体生存(OS)的预测价值。找到训练队列中不同TIICs比例的最优cutoff值。使用多变量Cox比例风险回归模型对训练集和验证集均具有显著预后价值的TIICs进行分析,选取p值< 0.05的用于构建TIICs特征。并建立预测患者生存率的TIICs评分公式:TIICs评分=(−0.990×Tfh丰度)+(−0.731倍巨噬细胞丰度M0) +(0.655倍嗜酸性粒细胞丰度),预后表现利用受试者工作特性(ROC)曲线和曲线下面积(AUC)评估TIICs特征。根据上述方法,首先在筛选训练集中进行Cox回归分析与总体生存(OS)相关的TIICs。22个TIICs中有13个与OS相关(图3a)。进行多变量Cox回归分析来确定独立预后,结果显示Tfh、浆细胞、活化肥大细胞、M0巨噬细胞、嗜酸性粒细胞、记忆B细胞是潜在的独立预后以上六种TIICs与OS之间的相关性已得到验证。Tfh和M0巨噬细胞与较好的OS相关,而嗜酸性粒细胞与较差的OS相关(图3b和c)。因此,Tfh、M0巨噬细胞和嗜酸性粒细胞的收集可作为TIICs特征来预测CRC患者对基于氟嘧啶的化疗反应。以TIICs评分的中位数作为截止值,TIICs评分成功地将CRC患者区分为高危组和低危组。在训练集(RFS, p=.013)中,高风险患者的无复发生存期和OS明显低于低风险患者(图3 g)。在训练集设置阈值时,验证集set1和验证集set2的TIICs得分结果相似(图3e-i)。训练集、验证集set1和验证集2预测OS的TIICs评分的ROC曲线下AUC分别为0.691、0.695和0.755(图3 j-l)。>整合TIICs和IRGs验证免疫风险模型(Imm-R)从ImmPort下载Gene Ontology,IRGs功能注释列表,并从TISIDB获得文献中报道的抗肿瘤免疫相关基因列表。合并去重后,首先对训练集中的生存相关IRGs进行了单变量Cox回归分析。根据p值< 0.05的显著性阈值,对单变量Cox回归分析确定的显著性IRGs和TIICs风险评分进行LASSO-penalized Cox回归分析。LASSO-penalized Cox regression选择的特征随后进入多变量Cox比例风险回归模型。最后,利用多变量Cox比例风险回归模型中p值< 0.05的特征构建Imm-R模型。建立Imm-R评分预测患者生存的公式:Imm-R score = (−0.939× PSMD3)+(−1.304× CCL22)+(0.319× FGF19)+(−0.228× LGR5)+(0.665× SKAP1)+(0.182× TACSTD2)+(0.329× S100A4)+(0.809× TIICs scores)结果如图4,在训练集中,CRC患者根据Imm-R评分的中值可分为高危组和低危组。生存分析显示Imm-R模型对CRC患者预后好坏有明显的鉴别作用(图4 (d, e))。高风险患者的RFS在验证set1中较短,p值为0.069(图4f)和更短的OS (p = .018,图4g)在验证集s2中,高危患者的PFS和OS明显缩短(PFS: p = .008,图4h;OS: p< .0001图4i)。时间依赖性ROC分析显示AUC为Imm-R对训练集中OS的预测得分为0.826,优于TNM期(0.643)(图4j)。在验证set1和验证2中,Imm-R评分的AUC用于预测OS分别为0.789和0.807,均显著大于TNM期(图4k和l). Imm-R评分(上表)与对应训练集中个体的OS(中间面板)(图4m)而验证set2(图4n)显示随着Imm-R评分的增加,OS大致呈下降趋势 (图4m和n)。使用nomogram对Imm-R模型进行可视化并预测3年和5年的生存率。ROC曲线和AUC用于评价鉴别,校准曲线用于评价Imm-R模型的拟合优度。为了提高Imm-R模型的可用性,构建列线图来描述Imm-R模型(图5a)。列线图包含了以上8个特征,并根据顶部的尺度为每个特征分配一个点。总分定义为八个变量得分之和。作一条从点轴到两结果轴的垂线,估计为三年和五年可以得到OS的概率(图5a)。评估的拟合优度计算图表,我们比较了预测3至5年生存概率的实际3至5年生存概率使用校准块(图5 b - d)。
图5,预测CRC患者接受基于氟嘧啶的化疗的OS概率的列线图在同一阶段接受相同治疗方案的患者中,临床结果发生变化的情况并不少见,这表明目前的预后模型存在局限性。模型能很好地分别区分5-FU,FUFOL和FOLFIRI治疗的CRC患者 (p<.01)。Imm-R模型也可以区分高危患者接受FOLFOX治疗 (p= .057,图5e)。基于训练集的微阵列数据集进行基因集富集分析(Gene Set Enrichment Analysis, GSEA),根据Imm-R评分的中位数将患者分为两组。结果发现高风险患者中几个与肿瘤生长和增殖相关的通路被显著激活,包括TGF-beta信号通路、PI3K-Akt信号通路、Ras信号通路和Wnt信号通路(图6a)。相反, 与DNA损伤和修复相关的几种通路,如错配修复、碱基切除修复和DNA复制通路在低风险患者中显著上调(图6 b)。为了进一步阐明Imm-R与5-FU耐药机制的联系,我们基于野生型和5-FU诱导的耐药HCT8人CRC细胞系GSE81005数据集进行差异表达分析。与野生型相比,5-FU耐药HCT8细胞(HCT8/5-FU)中共801个基因显著上调,399个基因显著下调HCT8细胞(HCT8 / WT)。通路富集分析显示,TGF-beta信号通路在HCT8/5-FU细胞中显著上调,而在HCT8/5-FU细胞中,TGF-beta信号通路的hub基因表达显著升高(图6d和e)。图6,基因集富集分析显示与免疫风险模型Imm-R相关的重要通路