朱瑞新:12分钟讲透如何迈向因果并精准干预菌群

各位肠道中人,大家好!我是来自同济大学的朱瑞新。非常感谢热心肠研究院提供的这次演讲机会。


本演讲的幻灯片 .pdf 版将在热心肠菌群微信群分享,感兴趣的读者请按以下方法申请入群:


今天我和大家分享的题目是《基于因果推理的基石菌种确定及其应用》。我将主要围绕“微生物互作与因果推理”和“精准干预与基石菌种”两点来展开。

首先来看第一点:微生物互作与因果推理。

差不多 10 年前,蛟龙探海,神九飞天,我国科技就已经实现了上天入海。但是大家有没有注意到,与我们息息相关的天气和气候却无法长期精准预测。为什么呢?仅仅是因为我们硬件不够吗?

不是。这个原因可以回溯到著名的“蝴蝶效应”:一只南美洲亚马逊河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,就可以在两周以后引起美国德克萨斯州的一场龙卷风。这是由美国气象学家爱德华·洛伦兹在 1963 年提出来的。

其实,这只是他对混沌学的一个比喻。所谓混沌,指的是一些系统对于初始位置和动量的测量即使只有极其微小的偏差,也会导致对其长期预测的巨大误差,也就是会导致长期的不可预测性。

长期天气预报极其复杂,微小的偏差是在所难免的。这就解释了长期天气预报的不准确性。实际上混沌现象的根本属性是随机性。

好在我们研究的肠道微生态不属于具有混沌现象的“随机系统”,而是属于所谓的“复杂系统”。

复杂系统的复杂度比随机系统还要高,基础物理学和还原论也都不适用。但是与随机系统的不可预测性不同,复杂系统却是有规律的、可预测的。为什么呢?这是因为复杂系统的个体通过相互作用,最终会呈现具有“高层次结构”的涌现现象。

“涌现”是个带有神秘感的术语。涌现并不破坏单个个体的规则,但是用个体的规则却无法加以解释。通俗来说,就是系统整体不等于个体之和。

首先举一个大家都知道但是却一直困惑的例子。生命的诞生就是涌现现象。我相信在座的很多人都和我一样,一直好奇而不能理解为什么大量的无生命物质相互作用就能形成最古老的原生生命?当然,今天我们就不对这个话题展开讨论了。

回到此次演讲的主题。我们研究的肠道微生态是复杂系统,那么它的涌现现象在哪呢?

其实,前期多位老师在演讲中,已经给大家展示过。比如前不久朱怀球老师提出的功能分类单元和两年前刘洋彧老师所用的生态学术语——功能冗余性,都强调了肠道菌群的功能组成与其物种组成有着很不一样的性质。

肠道菌群物种通过相互作用而形成的功能组成,就是肠道微生态的涌现现象。

这里我们将肠道微生态与复杂系统的术语做了一个类比。健康人、脂肪肝、炎性肠病和各种癌症等病人的肠道菌群,都有其特定的功能组成或表型,也就是其各自的涌现现象。

不知道大家有没有注意到,前面举例的时候,我都有提到,涌现现象是系统中的个体通过相互作用而形成的。涌现的所有的过程和奥秘,都只存在于系统的相互作用之中,表明物种的相互作用是肠道微生态研究的关键。

我想大家都不会反对,有向网络是直观描述物种相互作用的有效手段。由于各种限制,目前微生物互作研究中,仍以菌种的相关网络或叫共现网络为主。

然而,关联性并不等于因果性,这点已成为共识。这里的动画也更直观的表明,统计测量、概率分布中,即便具有相同统计性质,对象之间的关系仍可能是多种多样。由此可见,关联性隐藏了许多错误的、欺骗性的信息。

因此,我们需要将研究从关联性的分析推向因果性的探索。

计算机科学家、图灵奖得主朱迪亚·珀尔认为,当前的统计和模型主要关注的是对表征的拟合,寻找的是变量之间的相关性,而非潜在的因果性,因此我们需要一场“因果革命”。

为此,他提出著名的“因果之梯”,认为科学研究需要从关联(Association),到干预(Intervention),最终到反事实(Counterfactual)推理。

这里给出了当前微生物研究所用方法在因果之梯的对应位置。

自下而上,因果之梯第一阶段对应的关联分析是大家最为熟悉的方法。运用 Pearson、Spearman、SparCC 等相关方法的工作比比皆是。

近年来,随着以 LV 方程为代表的生态生理模型的引入,使得微生物互作研究更加准确。辅助以实验验证,能够较好地挖掘微生物群落中的因果关系。但本质上,这些方法自身仍是以数据拟合为主,并未真正从关联跳跃到干预或反事实推理。我们可以将这类方法称之为半因果推理方法。

而只有进入因果之梯第二阶段——干预,才算是显式的因果推理方法。通过人为的操控样本分组,控制其它干扰因素,从而证明其中的因果关系。除了实验中常用的随机试验外,孟德尔随机化和结构方程模型是此阶段的常用方法。

至于因果之梯第三阶段——反事实,由于要构造与事实相反的场景,当前在微生物相关研究领域中尚未见报道。

值得一提的是,最近有个工作报道在临床识别罕见病研究中首次使用了反事实分析。因果之父朱迪亚·珀尔为此还特意在 Twitter 上给予了肯定和转发。

在微生物互作之外的其它微生物研究中,如前所述,因果之梯第二阶段的孟德尔随机化和结构方程模型已得到广泛重视和运用。比如傅静远老师团队基于双向孟德尔随机化分析了肠道菌群、短链脂肪酸和代谢疾病的因果关系。再比如,多个期刊刊登了基于结构方程模型的菌群与环境因子因果关系的研究工作。

但是,对于微生物互作的研究,当前仍处于因果之梯第一阶段,仍是关联分析。其中刘洋彧老师团队的工作可以说是这个阶段最先进、最具代表性的工作。

刘老师团队提出了一种新的菌种互作推理方法,该方法不需要假设特定的种群动力学模型,比如 LV 方程,就实现了从稳态丰度数据中推断出微生物的相互作用。但是该方法得到的“因果”关系仍完全是基于拟合得到,并未显式地包含因果判断步骤。

为了显式包含因果判断步骤,我们团队从现有的先验知识出发,严格按照因果模型构建四部曲:建模、识别、估计和反驳,来推断微生物之间的真实互作关系。据我所知,这是第一个真正基于因果推理重构微生物互作的方法。

接下来,我们进入第二点:精准干预与基石菌种。前面我们讨论了物种互作是肠道微生态这个复杂系统的研究关键,而精准干预则是我们研究物种互作的目标。

那么,精准干预的靶点在哪里呢?这里我要引入“基石菌种”的概念。基石物种是指与其生物量不成比例,当它们移入或移出时,对生态系统造成影响最广的物种。这个概念最早是由罗伯特·潘恩在 1966 年提出。美国黄石公园狼的故事很好地说明了基石物种在生态群落里的独特地位。

目前,已有实验研究报道了基石菌种在疾病中的重要作用。比如在慢性牙周炎发病中,牙龈卟啉单胞菌被认为是基石菌种,该菌通过对一些中间群体和效应群体的调节,实现对群落结构和功能产生影响,并最终引发慢性牙周炎。

基石菌种就是基石物种,这里我们梳理了与其相关的几个概念。这些概念都可以从基础物种出发来理解。

“基础物种”是生态学上的重要术语,可以简单理解成是维持生态的骨架物种。赵立平老师这两年经常提及的“大树细菌”就是这个意思。

按理来说,基础物种就是一个不错的干预靶点。但是这个术语太抽象,在实际分析过程中并不好操作。为此,最早就有人直接将“优势物种”,也即丰度高的物种当作基础物种。后来,由于网络拓扑分析流行,网络上的各种 hub 节点对应的“关键物种”取代了优势物种。很显然,优势物种和关键物种,都没有很好地表征基础物种的内涵。

直到近期,刘洋彧老师利用动力学模拟找到“驱动物种”,实现了系统的不同状态转变。这个驱动物种可以看作是基础物种中具有可操控性的物种。而我们这里强调的基石物种又可以理解成驱动物种的导火线物种。当然,基石菌种的概念也相对抽象。

因此,当前基石菌种的计算方法和前面介绍的关键物种计算一样,仍是通过计算网络拓扑的 hub 节点获得,其内涵没有得到很好的体现。

为了真实反映出基石菌种的概念,我们在基于因果推理重构的菌群互作网络基础上,进一步开发了基于 LV 方程的动态干预模拟算法来实现基石菌种的鉴定。

我们团队将开发的基于因果推理的互作分析方法和基于动态干预模拟的基石菌种鉴定方法,应用于非酒精性脂肪肝病肠道菌群干预靶点的研究中。通过对发现队列和验证队列的联合分析,找到卟啉单胞菌属、另枝菌属和小类杆菌属等属下的 8 个基石物种。通过对这 8 个基石菌种的干预,可以实现从非酒精性脂肪肝病发病状态恢复到健康状态。

因果推理的引入,将给微生物领域带来巨大变革。但由于其理论和计算实施的复杂性,极大限制了因果推理的推广。

为了能让大家轻松使用因果推理方法,我们团队正在开发一款集微生物多类型物种注释和微生物互作重构的分析平台,该平台集成了相关分析至因果推理的多种微生物互作分析方法。目前该平台已在课题组进行内测,希望年内就能发布给大家使用。

最后做一总结。此次演讲我主要围绕“微生物互作与因果推理”和“精准干预与基石菌种”两点展开,而物种互作和精准干预正是肠道微生态研究的两个关键步骤。

(0)

相关推荐