单细胞转录组学生物标志物和靶点挖掘的新方法
单细胞转录组学(sc-RNAseq)研究,可以更加有效的解释组织的异质性,从单个细胞分辨率来解释更多bulk水平上难以解释的生物学问题。已经广泛用于肿瘤异质性、细胞发育、免疫微环境等课题研究。其产生的海量数据以及个性化分析越来越受到重视,并需要新的方法来挖掘背后的生物学意义。
生物标志物以及候选基因的挖掘在肿瘤免疫和细胞发育等研究中一直是研究的重点和热门。已有的生物标志物是基于差异分析或者无尺度网络中核心基因的方法来进行挖掘的;但是这些方法只能挖掘静态的生物标志物;而忽略了大多数疾病以及生物学过程,如肿瘤进展和免疫反应等都是一个动态变化的过程[1]。不同于静态的分析方法,动态生物标志物(DNB)方法是一种基于稳健的隐马尔可夫数学模型,对具有时序的组学数据进行网络水平的建模,主要用于生物学系统的临界时期或者临界状态进行鉴定,很适合生物学过程的研究(图1)。例如,2018年发表在《Nat Commun》的一项研究对肝癌原位移植小鼠的进行建模开展 DNB 的研究,基于转录组学基因表达图谱,检测肝癌肺转移的早期预警信号;进一步通过 DNB 评分获得了DNB核心基因钙离子传导蛋白基因(Calmodulin-like-protein 3,CALML3),通过实验验证表明与 CALML3 与肝癌增殖、侵袭、侵移呈正相关,而且证实了敲低 CALML3 能够作为转移的抑制剂[2]。
图1:DNB优势doi:10.1038/nrd.2016.233
同时DNB 是一种基于“数据驱动”的方法,没有先验假设,无需事先指定功能相关基因集,单细胞转录组测序产生的基于单个细胞水平的数据很适合用于DNB 分析;然而目前DNB主要用于具有时序性的转录组数据(TCGA)或者表达芯片数据(GEO)的研究[3](图2),将DNB方法用于单细胞转录组可以进一步揭示特定细胞的分化临界时期或者生物学变化临界点,具有重要的意义和价值。
图2 使用DNB对TCGA数据库中癌症临界点的预警(doi:10.3389/fbioe.2020.00809)
下面给大家介绍一篇将动态网络生物标志物用于单细胞转录组学的文献,该文献[4]于2021年6月发表在《Molecular Therapy – Oncolytics》(2020 IF = 7.2)上(图3)。
图3论文doi:10.1016/j.omto.2021.06.004
基于癌旁组织(adjacent tissue)作为一个过渡状态,癌旁组织作为癌组织的窗口前置阶段,有作为预测肿瘤早期进展的潜力。B细胞作为体液免疫的主要执行者。成熟B细胞可以分化为浆细胞,同时参与抗肿瘤免疫反应。文章主要思路是运用动态网络生物标志物(DNB),从系统生物学角度量化结直肠癌邻近组织中成熟B细胞在调控网络中的免疫功能,从而预测CRC转移前的关键时期,挖掘具有潜在早期干预的靶点,为进一步研究B细胞在CRC进展中的作用提供候选基因(图4)。
图4 DNB应用于B细胞免疫过程
图5 细胞重聚类
通过B细胞多区域的动态图景,研究注释了一类表达模式具有显著差异的成熟B细胞(图5);运用DNB量化了成熟B细胞在癌旁组织的免疫活性的变化,检测到了二期,作为结直肠癌淋巴结转移前的临界时期。通过对DNB调控网络的分析发现,DNB对邻居差异基因(DEG)具有“滞后”的调控作用,具体表现在CRC进展过程中,差异基因在二期表达处于过渡状态,在一期和三期之间发生了表达模式翻转变化;DNB基因在二期高表达(图6)。通过进一步研究DNB的调控关系,发现了影响B细胞发育的JAK-STAT和抗原呈递等免疫功能受到DNB基因STAT3、DHX9的调控(图7A);JAK-STAT通路参与成熟B细胞发育等过程STAT3(DNB)会使下游DEG表达发生翻转促进 B cell凋亡,进而促进CRC进展(图7B)。值得注意的是STAT3在临界点前后表达差异并不显著,其作为一个“暗箱”基因参与着重要的作用。对DNB基因进行了进一步筛选,DNB核心基因DHX9是结直肠癌癌旁组织特异性的预后标志物和潜在的免疫靶点(图7C和7D)。
图6 DNB-DEG滞后调控网络
图7 DNB核心基因的筛选
总之,该篇文章整合了系统生物学、单细胞转录组学、免疫学等多学科内容,表明CRC二期作为早期淋巴结转移前的关键时期;同时DHX9作为预后标志物和潜在的免疫靶点,为CRC的早期干预提供了重要的线索,为进一步研究B细胞在CRC进展中的作用提供了候选基因。
动态网络标志物的方法在具有时序性单细胞数据具有适用性和应用价值;很多生物学过程,例如T细胞耗竭、巨噬细胞M1-M2极化等过程都很适用于单细胞DNB分析;但是值得注意的具有时序的单细胞数据在实验周期和成本上获取具有难度,已有的单细胞拟时序分析或许可以定义出具有时间序列的数据,是一个很好的替代方案;最后动态网络生物标志物的方法有望整合空间转录组学的信息,为挖掘具有时空特异性的分子标志物提供了可行性。