传染病与网络爆红热点传播背后的数学 Part II

Atena

尼古拉斯·普桑(Nicolas Poussin),《阿什杜德的瘟疫》(1631), 现存卢浮宫
在本文的第一部分我们已经熟悉了研究传染病的 SIR 模型(» 点击这里查看)。
我们再来回顾一下,其基本思路很简单,人口被细分为三类:
  • S 类,易感者(Susceptible):可能会染病的目前尚且健康的人群;
  • I 类,染病者(Infectious):已感染患病且因此成为疾病传播媒介的人群;
  • R 类,痊愈者(Recovered):退出这个疫情场景的人群,或因被治愈或因死亡或因仍处于隔离;
两位数学家 AG McKendrick 和 WO Kermack 在 1927 年,1932 年和 1933 年的三篇文章中发表了他们的 Kermack–McKendrick 模型。该模型是一个 SIR模型,提出在某些简化假设下,用它能预测随着时间的推移通过人群传播的传染病病例的数量和分布。
在该模型下,如何理解这三类人群的转变过程是如何发生?也就是说,这三种传染病学类型的数量是如何随时间变化:怎样用数学语言去描述 , 和 这三个函数的变化趋势。为此,需要引入一些数学方法,但请注意这篇文章的目的只是展示在传染病领域是如何使用数学来构建一些相对简单模型。
首先,我们需要更好地分析前面提到的类型转变过程其背后的机制。比如,个体从 类变为 类这意味着什么?其实很简单:这个人被感染了,从而具有传染性。这个过程要感染者与易感者之间产生了接触,把病毒传给了后者。
在当今对 COVID-19 的关注中,困扰每个人的问题是:人们患病的几率是多大?用组合数学与概率知识就可以帮助我们对此进行估计。
容易证明,在有 的总人口里,两个对象可能接触的次数等于:
举个例子,有五个人,他们分别是 Alberto, Beatrice, Carlo, Daniele 和 Elena,两两可能接触的总次数则由上面公式算出:
准确列举 {{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E}}, 如下网络图所示:
但在这些接触中,有多少是存在风险的?这涉及到易感个体与感染个体之间的一次接触:在这种情况下,假设有可能易感者被感染了。此类接触的次数,是由易感人群数量 与感染人群数量 的乘积给出,即:
因此,任何一次接触可能存在感染风险的概率,就等于风险接触的次数与总接触次数之间的比值,即:
继续之前那个例子,如果在我们这五个人当中,有两个是感染了的个体(假设是 B 和 D),即 ,而另外三个人是易感者,则有风险的接触数量为 (这种风险接触分别是 {{A,B},{A,D},{B,C},{B,E},{C,D},{D,E}},则其中之一发生的概率等于:
如果发生一次有风险的接触,病毒并不一定会传染易感者,健康的人还很可能保持健康状态。很显然,这取决于该疾病的传染强度如何:那我们就用 来表示一次风险接触造成传染的概率。我们随机地任取一次两人之间的接触,则这次接触造成了新感染的几率等于:
为了简单起见,我们假设每个人平均每天都会与另一个人接触,则新感染的平均每日数量等于前面那个式子乘以总人数 ,即:
那如果现在我们定义 为:
我们发现每天会发生:
这么多起新的感染案例,当然这也是易感人群每天减少的数量。
因此,我们确定,如果 是某一天 的易感人群数量,那么,之后第二天该数量将变为:
另外,除了传染事件(即从健康变为感染的这个过程)之外,我们还得考虑第二种情况,也就是从感染变为被移出该场景,这个过程可能对应于一次治愈,也可能对应于一次病人的死亡,或者是一次个体的彻底隔离。
我们用 来表示每天从感染者 I 类型变为移出者 类型的百分率, 则是某一天 本身拥有的 类型的个体数量,那么,之后第二天该数量将按以下关系式而增长:
这时候再来思考此时的感染人群的数量。嗯,一方面因为传染,其数量有所增长;但另一方面又由于治愈、死亡以及隔离而产生移出者,故其数量又有所减少。那么,此时感染人群数量的总余额为:
这三个方程在一个离散的假设中构成了 SIR 模型。因为我们之前已经把所有描述设定在一个这样的场景里:它以离散的方式产生发展。
如果我们将上述这三个方程所构成的差分方程模型转换成连续的形式,我们很容易得到这样一个微分方程组:
这几个方程里需要注意的是 , , 关于时间 的导数,也就是说,这表示是随着时间的推移而产生变化的程度。很容易直观感受到,这完全取决于 与 这两个参数之间的辩证游戏:第一个参数(即 )为我们提供了病原体传染性的一个指标;第二个参数(即 )作为指标来表征患者因治愈、死亡或隔离而成为移出者(即退出这个疫情场景)的可能性。
SIR 模型里的三个类型以及转变过程中的调节参数
特别地,方程组里的第二个方程向我们展示了感染人群数量的变化
这个式子是由两项组成,一个按照比例常数 与 成比例的正项以及一个按照比例常数 与 成比例的负项。显而易见,这个式子会是正的,即感染人群数量会增加,如果:
也就是说,/ 的比值小于易感人群的数量即 .
由此可见,/ 这个比值在传染病疫情的一开始就具有一个阈值的含义:如果易感人群数量大于该阈值,则该传染病会爆发,并且在开头一个阶段会呈迅速扩张态势;反之,则该传染病甚至几乎不会爆发,因为感染人群的数量会很快减少至消失。
正如我们所看到的,好消息是,易感人群的数量总在减少:这向我们传递了一个信号——即便在最具破坏性的传染病中,它迟早会降至 / 的比值以下,这就预示着会进入到传染病趋势的下降阶段。但为之扼腕的是这期间已经牺牲了很多的人了。
现在,我们来集中讨论一个糟糕的情况,而那是真实的疫情场景: ,在这个不等式的两边同时乘以 /,我们得到一个完全等价的关系式:
因此,用语言描述即为:如果阈值关系(/)的倒数(/)乘以易感人群数量的值大于 1,该传染病会爆发,反之则不然。在感染的最一开始,易感人群数量等于 (即人口总数),因为此时尚未有人被感染。如果我们能够记录那个时候它当时的情况并量化数据
我们可以有意识地去了解情况将会如何演变:理论上,仅当基 大于 1 的时候,传染病才会爆发,否则该疾病的传播就停止在了萌芽状态。
部分被人广泛知悉的疾病的 R0 值(图自维基)
关于 基本传染数(Basic Reproduction Number)这个数,这些天在电视和社交媒体上的报道层出不穷:在传染病学家中,它被称为感染的“净繁殖率”,表征一个已被感染的个体在其自身感染期间可以传染的人的平均数量(假设整个人群仍然是易感的)。
看上面那张表,举例来说,麻疹的基本传染数非常高,一名患者最高能传染给 18 个人。表中所呈现的其他疾病的传染性相对较小,对于最近一段时间困扰我们的病毒,现目前估计其 值也相对不算高,不超过 3.8。
综上,可以更好地理解卫生当局与机构为控制疫情感染而采取的措施。在任何情况下,科学家的目标是试图减小 的值,或者从一个殊途同归的角度来说,试图把 的值降低到阈值 / 以下。如果我们实现了这一目标,传染病就会被击退。为此,我们可以从以下几个不同方面着手采取行动:
  1. 降低易感人群的数量以便缩小病毒的潜在传播群体,比如成功研发出疫苗并进行大规模的疫苗接种。
  2. 增加阈值比例 / 的值,这只能通过两种方式来实现:
    (a) 提高 :通过改善治疗方法从而增加治愈率
    (b) 降低 : 代表了感染的难易程度,因此通过更有效的卫生健康宣传教育,最主要是通过减少人与人之间的接触机会,而这些也正是这段时间所采取的的措施,譬如停课、远程办公,进制公共聚集,保持社交距离等等。
两种可能的感染趋势
还需要考虑一件事,最终该模型的目标是研究函数 的趋势,也就是感染人群数量的变化曲线。而上面那个图显示了 函数的两个可能趋势:它们各自代表两种不同感染情况下上面微分方程组的解。
很显然,出现峰值的那个趋势对应的是疾病的全面流行,这非常令人担忧也极具潜在的破坏性。相反,另一条曲线甚至没有随时间而上升,而是从一开始就显示出下降趋势,它表明这个感染病毒悄然而去,很快消失殆尽。SIR 模型使我们能够区分这些不同的动态。
但有一件事是 SIR 模型无法告诉我们的,那就是感染所能导致的罹患者人数。如果你早先有注意到,你会发现 Kermack 和 McKendrick 的 SIR 模型并不对治愈、死亡、隔离作区分。就 SIR 的方法本身而言,在所有这三种情况下均会发生移出,并且所涉及的上述个体不再具有传染性,而这足以确定函数 I(t) 的趋势。
如果我们要预测死亡人数,则必须分割参数 (即对应于每天转变为 R 移出类型的感染人群的百分比)。实际上,参数 是移出事件下的三个细分:治愈、死亡、隔离,所分别对应参数的总和。
期待未来专业研究人员会进一步揭示细节,但我们现在就能够从 SIR 模型里学到令人些许安慰的信息是任何传染病必定会平息,简而言之,感染曲线迟早也必然会向下降低直至完全平息。
最后, 向国内和全球所有医卫工作者,特别是奋战在抗疫一线的医护人员致敬,祈祷新冠疫情危机早一刻彻底消失。
(0)

相关推荐