AI时代“操作系统”的山之巅,百度飞桨的梦想城
百度飞桨的市场份额又双叒涨了。
近日,权威数据调研机构IDC公布了2020年下半年深度学习框架平台市场份额报告。
数据显示,在中国深度学习平台市场综合份额中,Google、百度、Facebook稳居前三,占据70%以上市场份额。其中,百度占比提升3.38%增速第一,综合市场份额位列第二。
相比IDC去年同期的报告,百度的排名又上升了一位,与位列第一的Google几乎持平,报告中所反映的动态与趋势,特别是百度市场份额的快速增长,也符合过去一年来外界对中国人工智能产业以及深度学习技术发展的认知。
一年的时间很长,飞桨完成了多次重大升级与更新,深度融入到当前如火如荼的产业智能化的变革之中,同时也带来了深度学习平台国产化的浪潮。
一年的时间很短,飞桨的市场份额在2020年又向前跨越了一步,坐稳了深度学习平台第一阵营的位置。
回顾即将逝去的2020,让我们一起来看看百度飞桨究竟是怎样在产业智能化的浪潮中翻江倒海的。
1
一年一个台阶,飞桨引领下的深度学习平台国产化浪潮
从无到有,百度在深度学习平台上的起步并不算晚,2008年就开始建设大规模机器学习基础设施、模型、工具及实验平台了。
2012年百度成功将深度学习DNN模型应用到语音识别、OCR任务中,并在2013年打造出深度学习框架飞桨(PaddlePaddle)的原型Paddle。
2016年,百度正式宣布飞桨对外开源开放。
至此,中国首个,也是国内唯一开源开放、功能完备的深度学习框架成型。
我们清楚,在AI时代,深度学习平台处于承上启下的核心位置,相当于“智能时代的操作系统”,开源框架的繁荣极大地驱动了深度学习的落地。
百度CTO王海峰也认为,开源开放是驱动技术创新和加速产业发展的核心动能,在以深度学习为代表的人工智能发展浪潮中,产业界已经成为驱动开源开放的重要力量,而成熟的开源开放技术生态与开放平台,也正在推动社会各界加快融合发展。
中国产业智能化升级在2019年进入大规模落地实践阶段,整个AI行业因此突飞猛进,飞桨经过长时间的蛰伏与积累,也在当年取得大踏步的跨越发展。
根据IDC 2019年下半年《深度学习框架和平台市场份额》报告显示,飞桨的市场份额在2019年升至第三,今年飞桨在中国的市场份额又压过了Facebook,来到第二的位置。
今年11月进行的IDC中国智能开发者调研中,有超7成受访者使用开源的深度学习框架,自己训练算法模型;在用户认知度方面,TensorFlow、Caffe2/Pytorch、飞桨(PaddlePadlle)稳居前三,飞桨在去年的基础上,继续延续着明显的增长趋势。
在机器学习平台方面,百度EasyDL占比强劲增长,再度登上市场份额首位。数据显示,EasyDL的用户认知度最高,也是受访者使用频率最高的平台。IDC认为,国产化浪潮带动了以百度为首的国产框架,也强化了开发者对国产框架的信念。
目前,飞桨平台上已凝聚265万开发者,开源贡献者超过5000万,有97位优秀的开发者成为飞桨开发者技术专家(PPDE);在产业应用上,飞桨服务了10万+企业,覆盖金融、交通、物流等数十个行业,基于飞桨平台创造了超过34万个模型。
2
成为深度学习框架的“国货之光”,飞桨是如何做到的?
从无到有,再到跻身深度学习框架头部阵营,坐稳国产深度学习框架的第一的位置,百度飞桨到底是如何做到的,飞桨又是怎样推动社会各界融合发展的?
1、紧随产业升级,适应中国国情,奔跑一步也不停歇
飞桨之所以受到中国开发者的欢迎,关键在于其牢牢抓住开发者和产业智能化升级的需求,扎根于产业智能化升级的事业之中,与开发者和产业都产生了深度关联:开发者需要什么,飞桨就去做什么;产业智能化遇到了哪些问题,飞桨就去解决它。
比如,宁德时代为解决产品品控和生产效率的问题,需要计算机视觉的大量应用,百度飞桨提供了视觉检测方面的能力,将宁德时代的产品瑕疵目标从百万分之一提高到十亿分之一。
每次都能踏中步点,新的需求提出之后,马上就能满足,飞桨靠的是通过高密度的升级来实现的。
5月的“WAVE SUMMIT 2020”深度学习开发者峰会上,飞桨进行了35项全新发布和升级,首发了量子机器学习开发工具“量桨”。
12月份的“WAVE SUMMIT+ 2020”深度学习开发者峰会上,飞桨又进行了八大全新发布和升级。
其中包括,支持前沿技术探索和应用的生物计算平台PaddleHelix螺旋桨,开发更加便捷的飞桨开源框架2.0 RC版,端云协同的AI集成开发环境BML CodeLab,支持更强大分布式训练的业界首个通用异构参数服务器架构,开源算法库增至200+,飞桨企业版EasyDL智能数据服务升级,飞桨硬件生态路线图以及携手全球开发者开启“大航海”计划。
事实上,除了每年两次的WAVE SUMMIT深度学习开发者峰会,飞桨会进行大规模的更新与升级之外,每年的百度世界大会上,飞桨也会有新的发布。
可以说,产业智能化的浪潮汹涌向前的速度有多快,飞桨奔跑的速度就有多快。
2、提高技术深度,降低易用门槛,探索从来没有间断
飞桨深知,技术的精进与落地必须同步展开,为了让技术产生最大价值,产业落地的速度快些,再快些,技术精进与易用门槛这两个方面不应成为矛盾的两面,因而飞桨在技术深度与易用门槛上做了很好的平衡。
在技术深度上,飞桨不但提供了使开发更为便捷的深度学习框架,也开放了大规模深度学习模型训练技术,支持万亿级规模参数的模型高效训练,支持多端多平台的部署,还针对产业应用开源开放面向多领域的工业级模型库,更好地支撑产业落地。
在易用性上,飞桨通过不断升级,在深度学习的环境设置、代码开发、模型训练以及模型部署上都实施了提升易用性的关键举措。像零门槛AI开发平台EasyDL,能够做到让非人工智能领域的专业人才通过页面拖拽操作和少量数据上传,就能轻松创造出定制化的人工智能模型。
如此一来,由易用性带来更多场景应用的可能,例如汽车油嘴检测、显微镜下寄生虫卵检测、珍稀鸟类识别、油井安全检查以及气象云量监控等。
必须认识到,越是简单的,对背后支持技术的要求也就越高。
以“WAVE SUMMIT+ 2020”深度学习开发者峰会上发布的飞桨开源框架V2.0 RC版本为例,新版本为开发者提供“编程一致、动静统一”的全新开发体验,在新框架下,飞桨动态功能走向成熟、API进行了全面升级,同时动静统一的编程体验还可为深度概率编程、量子机器学习等前沿学术研究提供更好的支持。
每次易用性上的一次小小跃迁,都是无数飞桨工程师在背后巨量的工作付出。在技术深度与易用门槛协同互促之下,推动着产业智能化大步向前,展现的是一幅可以产生奇迹的产业蓝图。
3、技术的浸润与产业落地的灌漫,开源生态繁荣厚实
飞桨通过不断的升级,将技术能力扎得更深,浸润能想到的所有细枝末节;产业落地渗透的范围更广,如同农作物的耕作,每颗庄稼都被安排的明明白白。
然而,产业智能化是一项浩大的工程,单凭飞桨一己之力是难以完成的,因而在它的背后还站着千千万万的开发者,飞桨作为连接产业和开发者的平台枢纽,所要做的事情是将开发者和产业各自的动力激活,在产业应用、人才培养和开源社区这三个方面构建一个繁荣厚实的开源生态。
飞桨也确实这么做了。
基于飞桨产品、技术、生态的全面积累,百度在“WAVE SUMMIT+ 2020”深度学习开发者峰会上发布了面向核心开发者的“领航”、面向人才培养的“启航”和面向产业智能化升级的“护航”三个部分的“大航海”计划。
围绕高校人才培养的启航计划中,未来三年,飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI教师,联合培养50万AI未来人才。
飞桨生态内,2020年AI Studio学习资源数增长180%,课程学习次数增长3.5倍,百度同时还组织了包括百度之星开发者大赛、中国高校计算机大赛人工智能创意赛等在内的超过50场AI竞赛。
开源社区建设,则从社区开发者的共建、共享,通过开源开放来驱动技术的创新,像珠算深度概率编程,就是飞桨团队与清华朱军教师团队共同合作,依托飞桨框架和动静统一的开发体验而完成的。
也正是因为开源生态的繁荣,为技术创新和产业落地提供了源源不断的动力,推动AI与产业融合发展,产业智能化的进程也被大大提速。
3
成为AI时代的“操作系统”,飞桨坚守初心下的宏伟目标
临近岁末时,很多人都说2020年是魔幻的一年。
这一年,新冠疫情的阴云下,让我们对产业智能化转型的重要性有了更深的认识。
这一年,美国技术封锁加剧,让我们对核心技术自主可控的重要性有了更深的认识。
也正是如此,科技强国被写进了“十四五”规划,成为国家战略。
也正是如此,作为AI时代的“操作系统”,深度学习框架的自主自立在科技强国中战略中的特殊意义被提炼出来。
如果说过去没有掌握操作系统的话语权还尚能接受,只是在被扼住咽喉时难受一下,而AI时代的“操作系统”一旦丧失主动权,其影响将是广泛的,毕竟,有“得框架者得AI”一说。
谁占领了深度学习框架,谁就拥有了AI时代应用“生产”的“话语权”,谁就能构建一个因为约定的深度学习规则而排他的开发者生态,这个生态一旦到了一定规模,就会形成与Windows、Andriod类似的群聚效应,其他深度学习框架将很难有市场突破的机会。
这也在一定程度上说,深度学习平台的竞争,不只在技术优劣更在生态构建,尽快扩大生态、提升行业影响力是与技术同等重要的事。
好在,飞桨在2020年的各种动作与努力在客观上正在构建一种属于飞桨的,属于中国的影响力。
我们知道,深度学习平台在AI时代处于承上启下的核心位置,而飞桨作为国产深度学习框架的代表,一举承担起成为中国产业智能化升级AI底座的责任:既要满足产业智能化升级的各种需求,这是飞桨的初心;又要不断向AI“操作系统”的目标迈进,这是飞桨的目标。
站在全球视野下,自主可控的深度学习平台作为大国战略一个更为底层的构成要素,虽然不直接表现出竞争优势,却在背后影响着国家的整体竞争力,既有直接的产业推动,也有国际AI话语权的掌控,最终展现的是中国人工智能的研发创新能力和底气。