阿里云天池医疗AI大赛第一季迎来最后决赛,医疗AI面临哪些机遇与阻碍
用大数据和人工智能向癌症发起挑战
癌症是全人类共同的敌人,严重威胁人们的生命健康,在所有恶性肿瘤发病及死亡率的指标中肺癌均占首位,肺癌生存率与首次确诊时的疾病阶段高度相关。
发现肺部结节是肺癌诊断的基本步骤,结节是影像学上的一个描述性名词,在CT影像上显示为圆形或类圆形的病灶,有着多年临床经验的医生,诊断一个病例平均需要查看200张以上的CT影像,对医生来说,这是一项“枯燥”的重复性动作。
近些年,随着AI、大数据技术的发展,图像识别技术已经达到了商业化的高度,据统计有超过80%的医疗数据来自医学影像资料,智能影像诊断有了很大的想象空间。
天池医疗AI大赛第一季顺利落幕
尽管很多初创企业都扎堆在这个赛道,但依然没有看到优秀的企业脱颖而出,真正普惠整个行业。正是在这个背景之下,今年年初,阿里云天池联合英特尔、零氪科技、16家全国知名三甲医院与3千多名参赛选手,开展大数据与人工智能技术在肺癌早期影像诊断上的应用探索,天池医疗AI大赛第一季——肺部结节智能诊断,向早期肺癌诊断发起挑战。
过去十个月,共有来自20个国家2887队伍,3953名选手同台竞技,吸引的团队除了北京大学、浙江大学、上海交通大学、早稻田大学等国内外知名高校,还不乏国内专业医疗团队参赛,如点内科技、宜远智能、联氪云影、掌中全景、百纳(武汉)信息等。经过激烈的角逐,只剩五支精英中的精英队伍挺进最后的决赛阶段。
为了这场规模浩大的比赛顺利进行,有多方企业提供强大的动力保驾护航。数据方面,零氪联合16家全国知名医院为大赛提供了目前全球最大规模的2000份 “科研级胸部CT数据集”,这个数量是几个月前国际权威肺结节检测大赛LUNA16数据量的2倍多。
此外,零氪还与合作医院组建了以素有“东方神眼”之称的复旦大学附属华东医院张国桢教授和北京大学肿瘤医院影像科唐磊教授等为代表的数十人的中国顶尖影像专家指导团,为大赛提供学术支持,不仅确保参赛选手拿到的数据是最顶尖、最精确的数据,也保障了大赛的学术权威性。
硬件方面,英特尔提供了第二代强融核处理器打造的高性能计算集群,保障了高强度的算力供应。
而阿里云则提供了机器学习训练平台,单点支持数百GB内存,每次迭代可以高速处理32张以上128x128x128甚至更大规模的3D图片。并且阿里云天池的实时评测工具,让选手马上就可以知道自己的训练结果。
医疗行业的数据敏感性是一大难题,安全性永远是医院关心的首要问题。本次天池大赛,阿里云团队专门开发了一个数据安全的“笼子”,经过“笼子”的清洗与禁锢,可以把影像数据中的敏感数据过滤掉,并保证它们不会被泄露。
在多方技术团队的护航下,这场“战线”拉得如此之长的大赛,终于在10月11日2017的杭州·云栖大会上迎来了最后的颁奖典礼来自北京大学LAB2112、上海交通大学交大点内、上海交通大学LAB518-CreedAI三组团队位列三甲,加州大学欧文分校Omni、西安交通大学DrCubic团队获得极客奖。
医疗AI大赛尘埃落地,比赛过程中涌现很多技术亮点,比如选手们对3D神经网络架构的大规模使用,首次尝试云计算训练方式,零氪科技对敏感数据的安全性处理等等。
零氪科技首席架构师王晓哲认为:“各团队选手基于两种渠道各自发展出不同的基础模型,如果大家能从模型之外研究原始医疗本质的核心规律,并把握这些核心规律的话,就能把规律转化成建模的方法论,会产出对临床医学更有价值的东西,真正利用人工智能技术为中国的医疗事业做出贡献。”
本次比赛的顺利结束也是阿里云天池在医疗AI向下一阶段迈进的基石,阿里云大数据事业部总经理闵万里表示:“人们都说医疗水很深,互联网公司不该碰这块,不然最后会撞得头破血流。但是这次比赛的召开坚定了我们的信念,阿里云会持续投入医疗AI,这次是第一季,未来还有第二季、第三季,我们会坚持下去是因为这不是一个商业行为,其价值和意义是难以计算的。”
本次大赛是阿里云一次“吃螃蟹”的行为,尽管阿里云方面表示会坚定不移地走下去,但有关医疗AI的争论从来都没有停止过,事实上本次大赛进行的过程中遇到过的困难和挑战,都是行业内正在经历的集体痛点与挣扎。
机器到底能不能取代人类医生?
本次天池医疗AI大赛汇集了技术工作者和医疗工作者两个“方面军”的群体,有很强的“隐喻”作用,AI和医疗到底是一种什么关系呢?
北京大学肿瘤医院影像科副主任唐磊教授反映,他的一个硕士生曾无比忧虑地问他:“将来我会不会被机器取代而失业?”
这位学生并不是杞人忧天,随着AI技术的快速发展,这种观点在近些年甚嚣尘上,很有市场。
先来看技术工作者这边,来自上海交通大学的LAB518-CreedAI团队在此次大赛中获得季军,成员杨健程在接受数据猿的采访中说道:“机器和人类医生在诊断肺部结节的工作属性虽然很接近,但是工作思路却完全不同。当医生去判断肺部是否出现问题时,他是知道正常组织应该长什么样子的,当有异于常态的组织出现,他就可以认定肺部出现了问题。
而机器工作的逻辑是,它事先并不清楚哪些是正常组织,哪些是结节,它所做的工作需要将两者分别区分开来。机器区别两者的依据, 都是基于人类过去积累的大量经验数据,也就是说机器能做的事人类都能做。”
来自加州大学的汤豪也认为:“机器的上限就是人,不可能会超过人,它的使命就是成为一名人类合格的助手。”
技术工作者的态度倒是很谦虚,没有了过去两年动不动就喊出革命、颠覆、取代等口号的“热血”了,接下来我们再来听听医生的态度。
唐磊教授也认为,机器目前还有很大的局限性,在技术层面还不够成熟,他看了一个获奖团队的报告,总共发现了65例漏诊,接近总数的三分之一,表现要远逊于一名成熟的医生。
而且机器永远没有办法绕开一个终极问题——缺乏人类之间基本的人文关怀。AI看的是病,医生看的是病人。医学界流传这样的一句名言,对于绝大多数病症,医生有时去治愈,常常去帮助,总是去安慰。
病人是需要安慰和鼓励的,但机器做不到这一点。而且人工智能其实只是人类心智的延伸,无法真正取代大脑,人工智能只能是线性思考,而没有交叉思维的能力。唐磊教授用了一个形象的比喻说:“马奔跑的速度比人快,在奔跑速度这个维度上人不如马,但是马跑再快也不能去送外卖,因为换了一个维度,它就无能为力了,马的处境就是当下AI发展的真实写照。”
技术工作者和医生在这个问题上达成了共识,机器不可能超越人,机器只能用来为医生服务。
唐磊教授说:“纵观影像科技的发展历程,从2000年前望闻问切,到之后的听诊器,1895年的X线,1971年的CT,再到1980年磁共振问世,影像技术一直在变,但看图像的主体却没有发生变化,一直都是人看,然后做出主观判断。
现在是否可以有个观念转变,让机器来帮人看图像呢?”
AI技术的发展能够帮助医生很快找到病灶区域,把医生从重复和单调的劳动中解放出来,而医生就可以去做更有价值的事情。
是“谁”在阻碍医疗AI的发展
尽管从业人员和大众对医疗AI的发展前景均保持乐观态度,但目前行业的发展也正面临着诸多的阻碍和考验。
首先,现阶段无法保证高质量数据的大量供给。我国的医疗影像仍处于从传统胶片向电子数据过渡的阶段,大量影像资料尚未完成数字化,而且医疗数据属于极度敏感的数据,医院之间的数据共享和互通程度较低,获取大规模高质量的数据对企业来说是一个很大的考验。
其次,现存医疗体系运行多年,已经建立了一套稳定的运作流程,也相应产生了很多利益团体,AI对医院来说就是一只闯入房子的大象,原来的规则会被撞散,况且医疗AI在技术上至少在目前还没有真正取信与医院和大众。
从这次的竞赛其实就可以窥见到,选手们对结节也仅仅是概念上的理解,没有触及更深层次的程度,而一个对医疗完全陌生的技术工作者很难说服医生使用自己的产品。
当然,以上诸多问题很多都是行业的集体痛点,需要更多时间和智慧才能改善。阿里云天池举办的大赛,为医疗AI的发展探索迈出了重要一步,大赛以解决具体需求为切入点,利用技术能力实现产品落地,距离商业模式落地也仅仅是一步之遥,眼下医疗AI的商业化进程一直难以打开局面,阿里云天池在技术上的探索已经颇有心得,如何助力医疗AI企业寻找高效的商业化模式,也许会是未来的研究方向。