测序成本降低百万倍?数据猿带中科院专家为你大揭秘
如果说过去十年互联网的发展是“科技发展的车轮”,那么这十年间基因技术的发展就完全称得上是“科技发展的曲速引擎”。
来源:数据猿 记者:大文
本文长度为3000字,建议阅读6分钟
在过去的十年里,互联网飞速发展,给我们的生活带来了翻天覆地的变化,曾经在科幻片中才会出现的场景已经变成了最普通不过的日常——从随身互联网硬件,到网上购物、订餐、叫车,再到更高端的AI、VR,周围的世界正在以前所未有的速度向前狂奔,无数十年前的旧习惯都在科技发展的车轮下被碾成了碎片。
如果说过去十年互联网的发展是“科技发展的车轮”,那么这十年间基因技术的发展就完全称得上是“科技发展的曲速引擎”。
基因技术的“地理大发现”
人类对于自己本身的探索从进化成人的那一天起就没有停止过。在这个过程中,从扁鹊见蔡桓公到华佗的麻沸散,从希波克拉底的体液说到流行了2500年的放血疗法,从哲学三问到转基因安全的讨论,人类走了不少弯路,也逐渐摸索到了生命的本质。
1869年科学家发现了核酸,1944年才知道核酸是遗传物质,又过了近十年,人们才知道核酸的双螺旋结构。1985年美国科学家率先提出的人类基因组计划聚集了全世界最顶尖的科学家,耗资30亿美元进行了一次完整的基因测序,直到2003年才完成,耗时13年。2003年,双螺旋结构的发现者詹姆斯·沃森进行的基因测序花费了2400万美元。
那么,仅仅13年后的2016年,基因测序的成本又是多少呢?答案是1000美元,折合人民币约6000元。如果不考虑通货膨胀,现在的测序成本是25年前的300万分之一,是13年前的两万四千分之一。华大基因董事长汪建甚至在今年3月还表示,基因测序成本将在“十三五”结束时会降至1000元人民币。
中国科学院北京基因组研究所博士生导师方向东认为,从技术层面来说,基因测序的成本目前已经接近极限了,未来基因测序的发展方向是“精准”。他告诉数据猿,人类全基因组共有约30亿个碱基对,其中98%都是被称为“基因荒漠”的非编码区,剩下的2%才是对临床应用“有意义”的编码区,所以,未来基因检测研究会致力于如何更快更准确的对这2%的基因进行检测。
测序成本的降低带来的是基因技术的飞速发展, 2003年也被称为基因技术“地理大发现”时期的开端。与此同时,基因技术也逐渐走出实验室,在健康、医疗、司法等领域大放光彩。基因检测应用案例中最著名的莫过于好莱坞著名影星安吉丽娜朱莉了。她根据遗传咨询师的建议切除了卵巢与乳腺以预防癌症,引起了外界一片哗然,同时也让基因检测被更多人所熟知。苹果前掌门人乔布斯也在罹患癌症后进行过基因测序,试图找到治愈的方法,但最终失败。
目前,国内领先的基因技术企业华大基因电商平台提供产前检测、耳聋检测、糖尿病检测等几十个民用基因检测项目。但相比百万倍降低的测序成本来说,基因检测的应用简直可以说是少的可怜。
缺乏数据积累
钱的问题解决了,为什么基因检测还是不能帮着治病呢?在搞明白这个问题之前,我们先来回顾一下今年闹得沸沸扬扬的“魏则西事件”。
魏则西,21岁,滑膜肉瘤患者。去年通过百度搜索在武警北京市总队第二医院外包给“莆田系”医院的相关科室尝试“肿瘤生物免疫疗法”而错过了治疗机会。方向东认为,魏则西就是一个很典型的精准治疗不当受治的案例。
在魏则西生前发布的文章中提到,他在“肿瘤生物免疫疗法”失败后依靠一种靶向药物缓解了病情。这种靶向药物的原理就是使人体免疫组织能够识别出癌细胞,从而实现治疗癌症的目的。魏则西使用的“靶向药”是被美国FDA批准的首个PD-1抗体药物,但这种药物最终还是没能成功挽回他的生命。
方向东认为,魏则西在接受细胞治疗之前没有进行基因检测分析,没能使用成本更低廉的靶向治疗方法或者用更传统的放疗、化疗与其他治疗的综合治疗手段,接受了他本不应该接受的治疗方法,最终错过了最佳的治疗时机。
然而,这种成本相对低廉、效果良好的靶向药物却种类稀少,而且绝大多数都是进口的,国产或者仿制的药物寥寥无几。
方向东表示,这是药物的原理决定的。使用靶向药物的前提是准确的知道“癌症基因”的位置。科学家想要确定“癌症基因”的位置,就需要依靠大量的基因数据进行研究。科学家们需要若干癌症患者的基因数据,再与健康人的基因数据进行比对,找到一些“有嫌疑”的基因,对这些“嫌疑基因”进行基因组学、转入组学、表观组学等不同层级的分析,找到能够对癌症的防诊治的靶点,最后通过体外生物学实验、动物学实验和临床药理实验来验证研发一种新药。
很显然,在这个过程中,进行对比的基因库越大,找到“癌症基因”的效率就越高,这就常常需要对数万人的基因进行比对。我国在大队列、大样本的大数据研究方面远远落后于欧美国家。欧美国家早在基因组计划完成之后,就启动了百万人级别的全基因组测序的工作。这直接导致我国在基因技术的临床应用方面远远落后于欧美国家。
虽然目前我国基因检测的技术能力称得上是世界第一,而且成本已经非常低廉,但我国的基因数据积累和有效解读仍然需要时间才能拉近与发达国家的差距。
人才奇缺
另外,基因的临床应用也面临着整个数据行业都面临的问题:人才匮乏。人力资源专业机构数联寻英今年7月发布的《大数据人才报告》显示,目前全国的大数据人才仅46万,未来3-5年内大数据人才的缺口将高达150万。
复旦大学教授朱扬勇认为,大数据时代,最热门的职业是同时拥有数据科学基础理论、数据技术和领域业务知识的数据科学家(Data Scientist),而不是传统的信息科学家,也不是大数据工程师。方向东所带领的研究团队在2014年曾公开招聘一名生物学博士,同时要求其“精通两门编程语言”、“熟悉网络开发技术”、“具有大规模测序数据分析经历”。
方向东估计,目前我国仅遗传咨询师的缺口就将近二十万。高水平、高质量的技术人才的匮乏已经是基因技术发展最主要的障碍。
国务院早在2010年印发的《国家中长期人才发展规划纲要(2010-2020年)》就已将人才培养提升到国家战略的高度。数据人才作为近年来经济社会发展重点领域急需紧缺的专门人才,也成为了《纲要》的首要发展对象。2010年起,各国大学都开始了数据科学人才培养工作,但时至今日,对基因数据人才的培养依然没有非常成熟的体系。
一方面,生物信息虽然是一个古老的学科,但在基因组学领域的应用也是最近十年的事情,所以人才培养方面、学科设置都相对落后。
另一方面,专业人才培养周期漫长,而且师资力量紧缺。2015年1月开始,复旦大学、中国遗传学会遗传咨询分会、卫计委能力建设和继续教育中心开始主办遗传咨询师培训,但每年依然仅能培养不到一千名咨询师,对于高达二十万的遗传咨询师人才缺口来说仅仅是杯水车薪。方向东说:“大家可以想象我们的任务有多么艰巨。专业人才的培养,历来是我们非常迫切需要而且要努力呼吁的很重要的事情。”
除了缺少数据积累和人才匮乏之外,我国基因技术的发展还面临着政策、社会支持、行业壁垒、社会资本的保障体系等大大小小的问题。但方向东表示,随着国家经济实力的不断增强,全社会对大健康产业关注的程度也空前高涨,特别是党中央提出“健康中国2030”的国家战略之后,这些问题都得到了不断的改善。他认为,在未来的五年甚至十五年内,我国基因行业的发展情况会比较乐观。
上个十年,基因技术在“地理大发现”中获得了惊人的发展,下个十年呢?可以预见的是,在克服了种种困难之后,基因技术有一天会像互联网一样“惠民”普及,成为人类战胜病魔的“神兵利器”。
为了加速大数据背景下,创新技术对基因领域的推动作用,促进产业整体发展、促进基因产业链上下游、生物医疗领域与大数据创新技术领域跨界交流、行业领军企业与创新创业企业间的交流互动,数据猿联合上海大数据联盟、中国科学院北京基因组研究所、中国信息通信研究院共同举办的“2016基因大数据创业创新POG大赛”将在上海拉开序幕!
作者:大文 微信:discoverir