意料之中,23andMe放弃NGS是为了获取更全面的个人消费级基因数据
23andMe放弃下一代测序技术(NGS)研发,事情多少有点意料之外,俨然给大热的基因检测技术泼了一盆冷水。可是仔细想一想,却又在情理之中,不是太成熟的技术、高昂的测序价格以及消费者低测序意愿和需求,让人们已经对NGS未来产生过怀疑。这也可从国外媒体对此事的反应可见一斑,并没有像2013年FDA要求23andMe暂停为新用户提供健康方面的基因检测服务那样,引起轩然大波!
据Techcrunch等国外媒体核实,23andMe已经停止了NGS项目的实验室,至少5名实验员被解雇,包括负责该项目两年的首席医疗官Jill Hagenkord博士。创始人Anne Wojcicki公开表示,这与测序需求放缓,资金和监管问题都没有关系。“我们的资金很充裕,只是现在问题有些复杂。”那么,为什么23andMe现在会放弃NGS,基因检测市场到底发生了什么?动脉网(微信:vcbeat)为你做一番分析,和你一起探讨其未来。
在基因检测领域,23andMe 久负盛名,从创始人Anne Wojcicki到投资人谷歌、强生以及NIH等,都自带明星光环,在 2008 年就曾被《时代》杂志评获年度最佳发明奖,一时风光无限。从2007年10月获得谷歌等公司的895万美金A轮融资,到今年10月份NIH的170万美金融资,截至目前,7轮融资后,23andMe 总融资金额超过2亿4000万美金。
如此受到资本市场青睐,那么23andMe 一直以来的核心业务是什么呢?即基于SNP(基因组水平上由单个核苷酸的变异所引起的DNA序列多态性)技术的,对人体基因组的65万个位点进行检测,形成大规模的、自愿的群体遗传学采样及基因组分型工作。在基因检测领域,这属于较为基础的服务。
23andMe采用的并不是全基因组测序技术,而是采用了Illumina基础版本 HumanOmniExpress-24 基因芯片筛查技术。这样不仅可以有效降低设备和研发的成本,也降低了医疗风险。准确度上,该项基因检测高达99.7%,成本上却比二代测序低。SNP分型检测技术具有准确率高、灵活性强、通量大、检测周期短、成本低;数据分析优势快捷、准确、标准化的优势。
测序的价格是多少?在2003年,第一个人类基因组检测的费用可是高达27亿美元,而23andMe的初始定价是999美元且一路下降,在拿到总计超过6000万美金的B轮和C轮融资之后,检测价格降低到299美元,在2013年,FDA由于尚未制定相关标准,叫停了23andMe根据基因信息向用户提供健康指导的服务,23andMe的检测费用更是降低到了冰点,只要99美元。现在,通常情况下只需要149或者199美元,相对于NGS三年来一直居高不下的1000美金成本,优势是明显的。
截至目前,23andMe可能已经累计拥有超过150万的用户量,可以说它已经建立起了全世界最大的基因和表型关联数据库。这时候,摆在23andMe面前有两条路:一是在基因测序新技术上不断精进,另创盛世;另外一条就是持续面向个人消费者销售其基础基因测序服务。很显然,23andMe选择了后者。
如此庞大的基因数据库,背后是巨大的“钱”景。目前来看,23andMe提出的新愿景是改变传统药物研发模式,即“让患者参与药物研发”,利用基因大数据,大药厂为患者开发治疗方案,患者为药厂提供研究需要的数据。
去年3月,23andMe成立了由基因泰克(Genentech)前执行长理查德·施勒(Richard Scheller)为首的医疗团队。施勒担任23andMe医疗团队的首席科学家,并负责利用目前已经收集到的85万名客户的基因信息来推进一些罕见疾病的新疗法的研发。这意味着23andMe正式进军制药领域。基因泰克公司总共花了6000万美金购买23andMe公司3000名帕金森患者数据,平均每个客户为23andMe贡献了20000美元。
在与辉瑞的合作中,23andme允许辉瑞访问其研究平台,包括23andMe的服务和80多万人口的基因数据分析。在这庞大的数据库中,80%多的测试者(约65万人)同意参与研究。在合作初期,辉瑞将研究来自23andMe的5000名狼疮患者的数据,以进一步了解狼疮基因。
Genentech公司支付了1000万美元用于购买帕金森病患者的DNA序列,双方将联合对3000名帕金森病患者的基因组测序数据进行分析,旨在找出治疗这种神经退行性疾病的新方案。在此次合作中,23andMe将负责收集帕金森病患者的数据,以及基因组测序工作,而Genentech将基于这些信息来制定潜在的治疗方案和药物。
此外,FDA还批准了23andMe另外一款单一健康产品,用来预测布卢姆综合症(Bloom syndrome),截至目前,据网上公开数据显示,23andMe已经与13家药企达成规模不一的合作。23andMe CEO Anne Wojcicki称,她希望将来所有人都可以通过访问23andMe的海量基因数据,通过基因测序从一群具有相同疾病人群中寻找出共同的因子,以确定治疗的靶目标,甚至来预测某一群体患病的可能性。
休斯敦大学的法学专家Barbara Evans评论此事时说道,用DNA数据来赚钱,这是绝佳的生财之道。不过药物开发毕竟是一个风险极高、流程极长的领域。平均而言,开发一种新药大约耗资20亿美元,耗时10年以上才能把它推向市场,而且,23andMe的服务目前只限于提供十几个有关罕见病的信息。23andMe介入制药领域,虽然解决了盈利难题,至于前途几何,也只能拭目以待。
除了高昂的成本之外,NGS(Next Generation Sequencing,高通量测序,又叫“下一代测序”)本身也面临技术成熟度的问题,这应该也是23andMe放弃它的原因之一。Wojcicki说,她不是很确定下一代测序,这个目前更复杂和更昂贵的测试,能否带来很多客户,让消费者接受。“大多数人甚至不知道这些类型的测试存在。”她说。“我认为市场刚刚处于起步阶段。”那么,目前NGS的发展到了什么程度呢?
从2005年,开发出全球第一台商业化的第二代DNA测序仪GS 20开始,就拉开了基因产业发展的序幕,目前市面上,Illumina和赛默飞的平台使用率占据了全球约90%的市场份额。单从技术上来说,NGS可以被应用于多组学研究的各个领域。比如在基因组学方面,有用来检测体细胞突变的全基因组测序技术和全外显子测序技术(Whole-genome &Whole-exome sequencing);在表观遗传学方面, 有用来检测碱基甲基化位点的重亚硫酸盐测序(Bisulfite sequencing),有用来分析组蛋白修饰的染色质免疫沉淀-测序(ChIP-Seq),分析染色质构造的DNase-Seq, FAIRE-Seq以及由特定转录因子调控的染色质相互作用的ChIA-PET等。
不过,NGS临床上比较主流的应用集中在生育健康和肿瘤诊断治疗。根据生育健康的不同需求,基因测序可进一步细分为胚胎植入检查、产前检查(比如无创产前诊断,NIPT)和新生儿疾病筛查。2016年澳大利亚东安大略儿童医院的研究人员,通过实验对测序诊断技术在临床新生儿遗传病诊断中的应用可行性进行了测试,这项研究向人们证明了NGS技术在高效快速分子诊断中的无限潜能,NGS确实有能力精确检测常规核型分析及染色体微阵列分析所不能发现的多种染色体变异。而癌症的前期诊断与治疗十分有必要,NGS基因测序就是解决此问题的有效手段,只是目前还需要规范测序公司的标准和操作方法,只有规范的技术才能保证后续的精准诊断和精准治疗。
不用怀疑的是,NGS高通量测序技术促进了癌症和免疫学的研究,以及个体化免疫治疗的发展,促进了我们对癌症基因组,肿瘤发生过程中细胞内机制的了解。但是,与NGS技术一起出现的是它带来的一系列问题。NGS可以提供海量的数据量,但是其质量却有待提高(据称,NGS在序列拼接过程中,错误率在0.1-15%范围内),并且NGS的序列读长普遍较低,这意味着需要更严格复杂的序列拼接。
基因测序产品应用的成熟度取决于对基因组数据解读的精准性,目前在NGS测序读长较短的限制下,解读能力主要受限于基于精确疾病分类的基因组数据匮乏。据Ebiotrade调查,69%的被调查人员认为数据的分析解读是影响测序产业链发展最大的瓶颈。数据有效分析的三要素包括高性能计算平台、专业的分析软件和高质量的大样本数据库。由测序服务公司提供的原始序列文件在经过系统地分析处理前,无法提供任何有效的信息。计算平台用于对测序仪器得出的原始序列文件进行质量剔除、序列匹配等一系列基础分析工作,分析软件和大样本数据库用于遗传解读和咨询。
所以,由于NGS旨在广泛地应用于临床,时间就成为一个NGS首先需要面对的挑战。对于那些严重的神经性疾病或者极为危险的癌症患者而言,数周的WGS分析等待时间足以使患者错过最佳的治疗时间。而且,面临动则高达pb级别的海量数据,对其下游提出了严峻的挑战,这都需要革命性的存储与生物信息解决解决方案。
可以发现,SNP更多的是面向消费级别的产品,而NGS解决的是临床级的应用,是两个不同的市场。在使用23andMe时,用户只需要在23andMe官网上注册账号并订购了基因检测服务后,就可以收到来自23andMe寄出的唾液样本搜集装置,用户将自己的唾液邮寄给23andMe并支付费用之后,等待一段时间就可以获得一份在线DNA报告,从而得知自己的祖先起源、特征天赋、心血管遗传病、食物耐受、以及药物反应等信息。
这份报告将向用户展示自己的血统混合情况,包括来自欧洲、非洲以及亚洲的比例,进而将用户的祖先划定在某个大陆的特定区域。用户也可以选择提交自己的DNA数据,用于遗传学研究。一般来说,同意提交DNA的人可以参加230多项研究,主要集中于寻找疾病治疗和治愈方式。
原本23andMe也向用户提供疾病和健康风险等数据,但由于此举涉及医疗行为且并未获得美国FDA的审批,2013年11月22日,23andMe收到FDA的警告,禁止其对用户的健康数据做任何分析,用户不再通过报告了解到自己获得某些疾病的概率,在相关的管理办法没有完善之前,FDA只能禁止23andMe的这类健康报告。
23andMe一直在数据解读的准确性上与FDA持续沟通,不断通过科学和公认的实验设计方案,赢得FDA的许可。2015年10月22日之后,FDA给23andMe发放通行证,一次性批准了23andMe可以开展36项遗传病的基因检测,包括囊性纤维化、镰状细胞性贫血等,另外还有祖源分析、非医学性状等。虽然FDA放开23andMe可以直接面向消费者开展遗传检测服务,但目前限定的内容是相对来说,因果关系比较明确的遗传病相关基因位点,而对于有争议的疾病风险分析则不包括在内。
Anne Wojcicki希望能继续提供疾病风险分析,但严谨的FDA应该会要求23andMe提供更多的证明材料,这些证明材料则需要真正的基因、健康方面的大数据分析后才能提供,现在看来,这背后的大数据正是23andMe一直以来看重的核心。在爆出放弃NGS业务,Anne Wojcicki接受BuzzFeed采访时也表示:“一直以来,我们花了很多时间在测序上,但是我认为我们应该多多了解基因的复杂性。很多人还不了解遗传信息的基础知识,未来几年的巨大优先任务是让人们了解自己的基因基础,所以我们决定专注于核心业务上。”
在核业务上,对于23andMe来说,获取一个消费者的丰富数据比获得一百个随机基因更有价值。而且,为了扩大基因的多样性,公司将目光放在了非洲,今年10月份,开启了African Genetics Project计划,开发新的工具,帮助研究人员探索不同人口群体的深度遗传变异数据。23andMe宣布它正在建立一个参考数据库,其中包含公司的非洲裔美国客户的全部基因组序列,他们同意参与研究。 23andMe高级科学家和统计遗传学家亚当·奥顿(Adam Auton)说,该公司的目标是将超过900人的序列包括在数据库中,最终将与NIH分享并可供研究人员使用。
这几天有关“基因”,主要是癌症基因的探讨非常火热。一边是23andMe放弃NGS,另一边精准医疗“泡沫说”又甚嚣尘上,著名科学博客《科学网》博主,美国阿拉巴马州汉斯维尔市Hudsonalpha生物科技研究所的研究员韩健,发表了「两篇捅破“精准医疗”泡沫的重要文章」一文。其中第一篇就是Prasad博士的文章「The precision-oncology illusion」;第二篇是Ian F. Tannock等发表在《新英格兰医学》(2)上的「Limits to Personalized Cancer Medicine」。
尤其是Prasad博士在文章中引用了这样两组数据,首先MD安德森癌症中心的一个2600名患者的测序研究中发现,仅有6.4%的患者能找到合适的靶向药物;同样在美国国家癌症研究所的一个临床研究中,截止目前为止,只有2%的患者携带靶向药物的治疗靶点。由于并非所有携带靶点的患者都对靶向药物有反应,因此,Prasad博士认为仅有1.5%左右的患者能够从靶向治疗中获益。
其实,这里有一个很重要的认知问题,癌症的精准治疗难道就是靶向治疗吗?显然不是,当然更不是简单等同于基因检测。其实,应该将诊断放在第一位,没有精确的病理诊断和临床分析,就不存在什么“精准治疗”。总之,癌症的精准治疗已经从靶向用药,延伸到诊断、预测疗效、监测转移复发等领域。
目前,国内的治疗与国际有不小差距,最主要的原因就是病理诊断,“诊断”着实应该放在第一位。不过,尴尬的现状是合格的病理医师极度缺乏,同时肿瘤诊断报告规范并不准确。在美国、日本、欧洲等国家,比较普及的也仅仅是明确诊断和使用价值的基因测序应用,离“精准治疗”还相距甚远。实际上目前最需要的是增加基层各级医院的病理医生,以及提高其诊断基本素质和技能、增加病理技术员,让病理医生从切标本的繁重琐碎低级别事务解脱出来,把精力放在提高基本的常规病理诊断报告规范化,病理住院医师培养上。
文中部分数据来自网上公开资料,包括Techcrunch/UNZ/Crunchbase/GENE/marketsandmarkets/测序中国/生物探索/奇点网等。
文|高道龙
微信|lylonexiaohuhu
添加时请注明:姓名-公司-职位。
「推荐阅读」
想要更多?
后台发送关键词即可获得相关好文!
网站、公众号等转载请联系授权
zeng.xs@vcbeat.net
动脉网所刊载内容之知识产权为动脉网及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。