117疫情观察:详解病毒基因序列追踪流调大法 | 史隽·Ⅶ

目前来看,病毒本身并没有很大的变异可以解释症状严重程度的不同。这对疫苗研发来说是一个好消息。

撰文 史隽
4月20日
周一
MA累计确诊 39643例

上一篇日记讲到科学家们对新冠病毒进行全基因组测序,找到了西雅图和北加州新冠病毒传播的源头。

最近由纽约西奈山伊坎医学院 (Icahn School of Medicine at Mount Sinai) 和纽约大学医学院 (N.Y.U. Grossman School of Medicine) 的两个团队,分别通过测序分析3月中旬以来纽约的COVID-19患者身上的新冠病毒基因序列 (两个团队的样本不同),得出了基本相似的结论:新冠病毒在2月中旬就开始在纽约传播,病毒主要是从欧洲输入的,而不是亚洲。

然而,纽约州宣布的第一位确诊患者是一位从伊朗旅行回来的30多岁女性(3月1日确诊)。这意味着在第一例确诊患者被发现之前,新冠病毒已经默默地在纽约社区里传播开了。

图1:预印本文章https://www.medrxiv.org/content/10.1101/2020.04.08.20056929v2

病毒侵入细胞后,会劫持细胞的分子机制来复制病毒。这个过程很快,但也很马虎。因此,病毒儿子可能会获得其祖先不存在的新突变。病毒儿子被释放感染别人以后,复制产生的病毒孙子也会继承这个突变,并且可能在此基础上增加新的突变。通过对病毒家族的全基因组进行测序,就能追踪病毒的突变过程。

等拿到很多的病毒家族成员的全基因组序列后,科学家们就可以用复杂的计算机程序分析比较突变,去观察随着子子孙孙从共同的祖先那里衍生出来,突变是如何一步一步地产生的。因为突变产生的速度大致是一定的,如果数据足够多,还能粗略的估计祖宗有多大年纪。

现在,世界各国的科学家们都在测序新收集到的病毒样本。因为疫情紧急,很多科学家会把尚未发表的病毒基因序列上传到名为GISAID的在线数据库,和全世界共享。

西雅图弗雷德·哈钦森癌症研究中心的Trevor Bedford(上期讲了他是怎么辟谣的:参见《117疫情观察:群体免疫还远着呢 | 史隽·Ⅵ》)等病毒进化专家团队则组织了一个名为Nextstrain的项目。当这些共享的数据出现在GSAID以后,科学家们就尽快去把这些序列下载到Nextstrain的后台,将这些序列纳入全球传播地图,并在nextstrain.org/ncov上公布新冠病毒的基因组流行病学的最新信息,更新病毒家族树谱。

Nextstrain软件平台在过去几年逐步开发完善,曾应用于埃博拉、Zika和季节性流感等疫情,旨在让基因组流行病学在疫情期间尽快地发挥作用。

科学家们是怎么用病毒的序列来了解病毒传播方式的呢?

先介绍几个基本的概念。

有研究表明,新冠病毒的潜伏期短至2天,长至20多天。感染病毒5.1天以后,50%的人会出现症状;感染11.5天以后,97.5%的人会出现症状。

图2:来源https://annals.org/aim/fullarticle/2762808/incubation-period-coronavirus-disease-2019-covid-19-from-publicly-reported

也有大型的研究证实,新冠病毒在潜伏期内就可以传染人,出现症状前1-3天有传染性。

因此,一个人感染后,在出现症状以前,就可能把病毒传染给另一个人。这个被传染的人也要过一定潜伏期,才会出现症状。这两个人出现症状之间的时间间隔被称为病毒的“世代间隔 (serial interval) ”。有研究估算新冠病毒的世代间隔期大约为7天。

图3:病毒的世代间隔 (作者作图)

新冠病毒平均每月突变两次,也就是大约14天,2个世代间隔有一个突变。

简化的病毒传播链为如下所示:

图4:病毒的传播链 (作者作图)

这些突变通常是很简单的一个碱基 “T”更改为“A”,或者可能是“G”更改为“C”。这些突变改变了病毒的遗传密码,不过这些小的变化一般不会令病毒产生关键变化,从而改变行为(如传染力和致病性)。

但是,科学家们可以结合取样时间和基因组的序列推断出感染的顺序。相比于传统的流调追踪接触者和病例分析,这种方法是一种更新的、了解病毒传播方式的办法。

举一个经典的例子,在《117疫情观察:新冠无症状感染的威胁 | 史隽·Ⅲ》里曾经提到过,Trevor Bedford通过病毒基因测序而发现无症状/轻症状感染导致西雅图地区社区传播。

图5:来源于Trevor Bedford的博客 (https://bedford.io/blog/ncov-cryptic-transmission/ )。

上图中的 “ USA / WA1 / 2020”就是美国第一例被确诊的COVID-19患者—— 1月15日从武汉返回西雅图Snohomish County (斯诺霍米什县) 的Amazon公司员工。他在1月19日被收集了鼻咽拭子样本,随后样本里的病毒被美国CDC快速测序了。

该病毒的基因组与1月21日在福建采样的“Fujian/ 8/2020“ 的基因组完全相同,福建的这个病毒也被标记是从武汉输入的,说明这两者很有可能是很接近的时间在武汉感染的。

“ USA / WA2 / 2020”就是上一篇日记(见《117疫情观察:群体免疫还远着呢 | 史隽·Ⅵ》)提到的西雅图流感计划 (Seattle Flu Study)  找到的西雅图地区最早的新冠病毒阳性样本。它是通过回顾测序西雅图地区从2020年1月1日至3月10日收集的有急性呼吸道感染的人的鼻拭子样本,而找到的2月21日采样的最早的新冠病毒阳性的样本。这个病例被认为是美国第二个社区传播感染的病例,取样于一名有轻微流感症状的少年。他在距离WA1病人的居住地约15英里处的一所高中上学。这位少年只有很轻微的症状,没有旅行史,并没有和WA1病人有任何接触。因此,他并不符合当时美国CDC测试新冠病毒的条件:“有发烧和呼吸系统症状,并且有中国武汉的旅行史”。患者因为有类似流感的症状就医,因为症状很轻,回家恢复了。

WA2病毒的基因序列和WA1的序列相比,几乎完全一样,只多了三个基因突变。

这个样本采集时间是2月21日,与第一个样本采集的1月19日间隔了差不多5周。根据上面图4的病毒传播链计算,5周的间隔时间也差不多可以累积2-3个突变。

WA1和WA2的病毒基因序列还包含一个关键的遗传变异 (在基因序列18060位置上),在数据库中59个来自武汉的样本里面,有2个含有这一突变。假设WA2不是WA1的后代,18060位置上的突变是随机产生的几率大约是2/59=3%。

换句话说,有97%的几率WA2病毒是WA1病毒的直接后代。考虑这两个病人活动的地区只间隔了24公里,这个可能性更大了。

这意味着,那位1月15日从武汉返回西雅图的男性在进医院就诊之前,已经把病毒传染给了别人,而那个人是无症状或者轻症状,没有引起警觉。从而导致新冠病毒在西雅图社区里面默默地传播了大约5周,感染了数百人。

后来的情况证实Trevor Bedford的结论是正确的:华盛顿州从后来的病人身上分离的病毒的基因组支持了第一二个病例(WA1和WA2)之间的关联。

再看另一个例子。

截至4月19日,Nextstrain里面有来自美国的新冠病毒的基因序列1149条,其中马萨诸塞州有19条,大部分都是美国CDC测序的。第一条“USA/MA1/2020”采样于1月29日,是那位从武汉回来的麻州大学的留学生,他的基因序列和来自武汉的病毒基因序列很相近。剩下的都是在3月4日至7日间采样,从时间上看很大可能是MA最早暴发的Biogen公司的员工样本 (参见《波士顿新冠暴发危机:Biogen年会病毒大传播始末》)。其中有一条孤零零的“USA/MA_1355/2020”样本采集于3月5日,和来自英国的病毒基因序列最接近。其他的17条形成一个大簇,和来自法国的病毒基因序列接近。这英法的区别不得不让我猜测:是因为两国社交礼仪的不同?

看起来,马萨诸塞州的早期病例大多是欧洲输入的。相比于马萨诸塞州超过36000的病例总量,这19个序列只是很少的一部分,相信以后还会有更多的序列被共享。

图6:Nextstarin截至4月19日全球新冠病毒树谱。图中标注的红点是马萨诸塞州的样本。来源:nextstrain.org。

新冠病毒的变异速度比流感慢得多(后者大约是前者的2~4倍)。目前来看,病毒本身并没有很大的变异可以解释症状严重程度的不同。这对疫苗研发来说是一个好消息:“好不容易疫苗做出来,已经对付不了当前流行的病毒”,这种可能性降低了。但是,只要新冠病毒继续感染人,它就会继续突变。这就是为什么科学家需要时刻追踪病毒突变的原因——做好提前应对。

《返朴》新冠病毒专题

上下滑动可见全部报道
经 验 与 反 思
硬 核 科 普
科 学 防 护

特 别 提 示

(0)

相关推荐

  • 金唯智廖国娟:创业廿余载,初心不改

    2020年的诺贝尔奖,再一次把生命科学研究对人类疾病诊疗的贡献展示给了公众.此次基因编辑技术摘下诺贝尔化学奖,无疑对于蓬勃发展的基因疗法具有很大的激励作用.这些重大研究进展的背后,离不开一代代科研人员 ...

  • 缅甸新冠肺炎病毒发生突变,传染力暴增10倍,更狡猾更难被发现

    缅甸新冠肺炎病毒发生基因突变,传染力暴增10倍 病毒更狡猾,被传染后更难被发现 缅甸卫生与体育部发布消息:缅甸卫生部门对若开邦内确诊感染新冠病毒患者中,9人的化验样本进行检测研究后发现,病毒基因序列有 ...

  • 佳作推荐|迄今最全面的人类肠道噬菌体数据库发布

    本期带来一篇近日发表在Cell上的佳作,该研究整合了迄今为止最全面最完整的人类肠道噬菌体基因组数据库高质量.大规模的噬菌体基因组对后续病毒组学的研究方向产生了重要影响. 精彩的数据分析.流畅的研究思路 ...

  • 宏病毒组分析常见的分析软件

    病毒是地球上数量最多的生物实体,其中细菌病毒(即噬菌体)约有1031个类群,从海洋到陆地再到人体几乎都是它们的栖息地.研究者将病毒视为调节人类生态系统的重要成员,人体内主要包括真核病毒和噬菌体,包括双 ...

  • 天津、河北与北京新冠病例均为同一病毒序列,同属欧洲家系!

    (健康时报记者 鲁洋)11月8日,天津市疾控中心对本市第138例本土确诊病例,进行了新冠病毒全基因组高通量测序和序列分析.测序分析结果显示:与北美3至6月份流行毒株高度近似,属于L基因型欧洲家系分支I ...

  • The Scientist杂志评选出2020年十大创新科技产品

    这是<肠道产业>第 558 篇文章 编者按 往年,The Scientist 杂志评选的十大创新科技产品主要来自于实验室,这些技术往往是探索基础生物学的最新工具.但是 2020 年 COV ...

  • 你来自哪个城市?看看微生物指纹就知道了

    一个国际联盟报告了迄今为止规模最大的全球城市微生物宏基因组学研究结果.该项目从全球60个城市的公共交通系统和医院收集了样本,进行了测序和分析,并对所有已确定的微生物物种进行了全面注释,包括参考数据库中 ...

  • 宏基因组分析自然生境下细菌-噬菌体长期共存动力学

    作者:侯如娇,南京农业大学硕士在读,主要研究利用噬菌体防治土传病害. 周刊主要展示LorMe团队成员优秀周报,每周定期为您奉上学术盛宴!本期周刊为您介绍细菌和噬菌体长期共存动力学,原文于2020年发表 ...

  • 新冠肺炎疫情下,详解十大违约责任场景|民商事裁判规则

    疫情之下的合同责任, 生活中遇到这些合同违约如何应对? 来源:山东高法公众号 新冠肺炎疫情对社会生活的各个方面都产生了重大影响,其中,对合同履行的影响十分突出.交通中断.公共场所封禁.企业被政府要求延 ...

  • ​北京使用核酸混检,结果靠谱吗?| 117疫情观察

    中小学.大学和大型公司可以定期使用混合核酸检测来确保学校和公司的安全开放. 任何检测手段都要和有效的隔离手段结合才能控制疾病的传播. 往期疫情观察: 新冠抗体检测准确率可能仅有50%!为什么?怎么破? ...

  • 开棺验尸:各国到底何时起出现新冠病毒感染 | 117疫情观察

    回顾性研究一样需要严谨的调研才能得出可靠的结论."假阴性""假阳性"和似是而非的猜测只会把水越搅越浑. 往期疫情观察: 儿童复学,家长不安全?看各国数据怎么说 ...

  • 儿童复学,家长不安全?看各国数据怎么说 | 117疫情观察

    五一过后,全国多地的小学和幼儿园逐步复学,家长们不免要担心孩子的健康安全问题.不过,万一孩子真的感染了新冠病毒,最值得担心的可能不是孩子本人,而是密切接触孩子的家人. 往期疫情观察: 驱之不散的复阳阴 ...

  • 驱之不散的复阳阴影:究竟是终身带毒,还是二次感染?| 117疫情观察

    新冠病毒感染者康复后的"复阳"问题可以说是人们最担心的威胁之一.关于复阳的原因,大致有三类假说:患者终身带毒:愈后二次感染:核酸检测到的是不具活性的"死病毒". ...

  • 117疫情观察 | 颜宁·普林篇·V

    "复工"成为主旋律. 撰文 | 颜宁 4月9日 周四 刚才看<返朴>排好版的我的第二篇"117疫情观察",对照史老师日记行文里大量的科普内容,很有点 ...

  • 117疫情观察 | 史隽·Ⅵ

    只有大规模排查,才能告诉我们全民感染的真实数据,并估算无症状感染率. 撰文 | 史隽 4月17日 周五 MA累计确诊 34402例 自1月底国内疫情暴发以来,就看着微信群里各种谣言漫天飞.有一段时间和 ...

  • 117疫情观察:波士顿146位新冠感染流浪汉竟全无症状 | 史隽·V

    同样是感染了新冠病毒,为什么有人无症状,而有些本来健康的年轻人会猝死? 撰文 | 史隽 4月16日 周四 MA累计确诊 32181例 大家想必听说了很多NBA球星被确诊感染新冠病毒.截至4月1日,有8 ...

  • 117疫情观察 | 颜宁·普林篇·Ⅳ

    新冠这场危机有太多值得我们反思和学习的内容. 撰文 | 颜宁 3月30日 周一 眼瞅着美国确诊人数破14万,纽约州近6万,小小的新泽西破万,我屯所在的Mercer County破200,紧邻的Midd ...