工业革命的秋之涟漪(一):百度飞桨&AI引擎

18世纪中后期,人类推开了工业革命的大门。

在此后的近250年里,世界经济迎来了从未有过的发展曲线,漫长的中古时期轰然倒塌,现代化的晨曦点燃了文明之光。

此后的岁月里,每当经济发展遇到瓶颈,社会问题凸显,新的工业革命总会适时出现。从蒸汽革命、电气革命,到信息革命,人类已经完成了三轮奇迹般的生产力增长。

那么,第四次呢?它将出现在何时,以何种技术作为主轴,又如何一步步改变我们的社会经济?毫无疑问,回答这些问题在这个时代无比重要。

幸运的是,互联网、云计算、大数据,再到AI的一系列发展,基本已经让第四次工业革命的首要问题产生了共识:这次全球行动注定由智能化来指挥,以深度学习为代表的第三次AI崛起,将为各行业生产力再次飞跃提供原动力。

而与前三次工业革命不同,即将迎来的智能革命中,中国首次与世界站上了同一起点。

那么接下来的问题,是产业智能革命从理论可行到实际发展,如何一步步填补AI与现实生产力间的缝隙。这个10月,作为中国唯一功能完备的深度学习开源平台,百度飞桨将迎来一系列走入工业化生产与现实世界的大事件。我们发现,沿着飞桨落地的脚步,恰好可以完整描述出从AI技术,到可用平台,再到产业实践与经济矩阵,深度学习一步步扩散到现实世界中的行为逻辑。

如果说,得出AI与产业结合的可能性,是智能革命的春芽;那么收获AI渗透现实的真实路径,就是这场智能革命的秋实。恰好时至华夏大地满眼秋色,我们希望用一个系列,来追寻从飞桨蜕变,到第四次工业革命的先声。从深度学习的一粒石子,到产业与国民经济的层层波澜,改变正在这个秋天层层震荡开去——也许可以称之为,工业革命的秋之涟漪。

第一层的故事,关于飞桨产业级深度学习开源开放平台。10月16日,首届世界科技与发展论坛在北京举办,面对着现场来自全球20多个国家和地区的200多名院士、诺贝尔奖获得者、世界重要科技组织会员、大学校长和企业家,百度CTO王海峰发布“飞桨产业级深度学习开源开放平台”,智能时代的操作系统,再次得以升级。

这件事改变了什么?让我们先从一切故事的背景说起:产业智能化的沃土,我们的中国。

一片土地的期望

工业革命是需要温床的,18世纪完成土地和宗教改革的英伦半岛,19世纪急需全球化经济的欧洲大陆,20世纪在硅晶片上孕育新时代的美利坚。必须有技术底座和强烈需求,才能孕育工业革命的动力和舞台。

而今天的中国,广泛的产业升级需求和供给侧改革,构筑了充分的工业革命需求;而互联网的长足发展,数据与计算底层设施的建造,则为智能技术提供了生长温床。二者相加,最适合AI技术投入产业应用,同时也是最需要AI技术完成生产力迭代的地方,都变成了中国。

智能革命发生于中国,是三种情况的交汇。首先互联网的长足发展,酝酿了人才与技术的底座,这股力量需要被引导向产业智能的新蓝海;其次,中国的产业结构完整而广泛,各行业或多或少都蕴藏了可以被AI技术完成“提质增效”的空间。在中美科技齐头发展的国际新局势下,国家经济整体对AI技术应用具有深层渴望。一系列需求构成了产业智能化命题最大的市场空间;同时需要看到的是,中国数字化渗透度不如发达国家,各产业的经济发展周期、人才储备情况、数字化水平参差不齐,这让AI深入产业充满了具体性与不确定性。AI基础平台与行业智慧的交融有待进一步探索。

全球前列的技术水准、广泛庞大的市场需求、复杂具体的行业挑战,这三者共同构成了这片土地与AI技术相遇时惊喜与困难并存的现状。虽然广义的前景无限光明,但当智能革命深入某个具体行业时,问题往往层出不穷。以深度学习为代表的第三代AI技术,与以往软件应用不同的地方在于,它以机器学习和神经网络为基础特征,需要经历开发、训练、推理部署,最终走向产业应用。但这整套流程对于垂直行业来说,每个步骤都充斥着挑战:

1、AI模型的开发效率低、开发成本大,人才难以寻找。

2、能够支撑产业级别的AI训练,需要庞大算力和巨大的数据量,以及精度保障能力。这个环节往往是企业的最大负担。

3、模型在推理端的高时延、高能耗、低速度,容易造成AI应用不达标,形成临门一脚的失误。

4、千差万别的行业需求和应用特征,对AI技术的标准化、模块化、行业智慧结合提出了广泛挑战。

综合起来看,中国引领第四次工业革命,在今天希望巨大同时挑战巨大。解决这些问题,有很多种思路。但有一个逻辑是无可否认的:今天开发深度学习模型,需要开发框架的支持;未来的产业智能应用,需要高度可用的操作系统作为底层算力、算法与行业应用的中间件——无论是今天还是未来,飞桨的战略价值都与中国的期待紧密相连。

一座车站

在讨论飞桨的价值生长时,我们必须要注意产业节奏的变化。

深度学习模型的开发,需要以开发框架作为基础工具,这在今天已经成为了常识。支持高并发训练部署的完整框架,是飞桨诞生时的价值指向,这时它是AI开发者的一种选择;随着产业智能化不断加深,国民经济应用AI的需求加强,自主可控变成了安全前提,这就让飞桨这个中国唯一功能完备开源平台的战略价值顺势凸显;接下来,占据了关键位置的飞桨,可用向上向下生长出更多算法、工具与解决方案优势,成为尽可能容纳开发、训练、部署周期,一站式解决AI应用困境的操作系统。

这个逻辑就像车站。当铁路贯通时,车站是必需品。而当中国AI的铁轨上,只有飞桨一座车站时,这座车站可以进一步扩容功能,为旅客提供尽可能多的服务。我们知道很多车站成长为了商业综合体,就是这个逻辑。

在王海峰发布的飞桨全景图中,我们可以看到飞桨的目标,是打造一个向下抵达芯片层、向下输出到应用层,容纳其中所有的开发支持与产业应用需求,从而打造标准化、模块化、自动化的AI入口。这就像智能手机时代,开发者只需要学习安卓/IOS,再懂基础的标准语言就可以进行开发。AI时代想要真正到来,同样需要一套类似逻辑的操作系统——这就是飞桨的发展轨迹。

目前,飞桨已经形成了体系完善、工具丰富的开发平台生态。在核心框架层面,提供开发、训练和预测一整套的技术能力;在此之上,官方支持包括自然语言处理、视觉、推荐和语音等在内的丰富的工业级模型库,以及支持语义理解、目标监测、图像分割等任务的端到端开发套件。工具和服务平台层面,提供自动化深度学习、迁移学习、强化学习、多任务学习等工具组件和EasyDL、AI Studio等降低技术门槛的服务平台。最终形成了集深度学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体,功能完备、全面开源开放的产业级深度学习平台。

当深度学习的水滴投入现实世界,飞桨是它激起的第一层波澜。我们可能需要追寻的,就是这层涟漪如何向更远处蔓延。其实答案已经显露,王海峰对飞桨的最新定义,是产业级级深度学习开源开放平台——显然,这里的关键点是“产业级”三个字。

这三个字代表了飞桨接下来的发展方向。一座车站,可能生长出一个商业综合体。接下来,更可能诞生一座城市,美国的奥尔良、芝加哥;中国的郑州、石家庄莫不如此。飞桨之城,就建立在第四次工业革命的中国底座中。

一条线

或许很多朋友,觉得“产业级”无非就是一个修饰。但是百度技术体系向来是不会随便添加修饰词的。相反,他们更喜欢把重要的技术更新,轻描淡写地说出来。

想要理解飞桨的“产业级”蜕变,需要知道机械学中有个概念叫做“工业红线”。我们自己在家也可以DIY一个发电机或者蒸汽机,实验室里可以制造机器复杂的机械设备,但是这些设备都无法投入工业应用,就是因为他们无法越过“工业红线”。

一种技术和设备,想要达到工业标准,需要满足一系列条件:成本控制、使用难度控制、生产效率达标、模块化组件、大规模生产支撑等等。所以产业工业化必须是一套完整的体系相互支撑,任何一个创新点如何达不到标准,都可能摧毁整个产业链的效率。

在今天,企业知道AI好用却无法用,所有困难本质上都因为AI相关工具和平台,无法达到切合产业生产需求的工业级标准。够快、够大、够简单,这些听起来简单的话题,其实是极其困难的部分。

而飞桨加上“产业级”,就是百度决定闯过这条工业红线的标志。具体来说,飞桨踏过产业级红线,来自于四个方面国际领先技术的突破:

1、人才线

想要挺进工业生产,我们就不能假定每个行业的AI开发者和技术人员都是天才大神。然而工业级的深度学习模型却在持续复杂化,代码结构的理解难度不断提升。这给开发人员带来的巨大挑战。

想要AI走进产业,就必须让开发简单易懂,与如今同行的编程教育和行业并轨。为此,飞桨完成了基于编程逻辑的深度学习框架技术,同时支持声明式和命令式编程,兼具开发灵活性和稳定性。也就是说,如今的编程从业者可以不经历漫长学习就能使用飞桨,企业的AI人才门槛也将极大降低。

2、训练线

工业级AI的基础特征,就是训练所用的数据和算力异常巨大,尤其是大规模个性化推进场景,需要超大规模的稀疏性特征训练,堪称AI中的重工业。再精巧的算法和工具,如果不适配大规模训练都没有意义。踏过训练线,是AI操作系统驶向未来的核心。

为此,飞桨平台率先突破了超大规模深度学习模型训练技术,实现了世界首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模深度学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。这就像工业领域的超大熔炉和巨型锻造机,为未来更复杂的产业需求打造平台底座。

3、硬件线

AI驶向工业革命,一个基本逻辑就是需要把深度学习技术与现实中的无数设备相结合,并且兼容复杂的异构算力、差异化平台,组成能够适应行业需求的解决方案。引申到操作系统中,这就需要技术中间层提供端到端部署的部署能力,实现软硬件一体优化。

这个领域,飞桨为产业世界提供多端多平台部署的高性能推理引擎。在推理方面,飞桨平台不仅可以和其他开源框架训练的模型无缝衔接,还可以轻松的部署到X86 CPU、ARM CPU、Nividia GPU、Mali GPU等不同架构的平台设备上。同时提供领先的推理速度。经过跟华为麒麟NPU的软硬一体优化,使得在NPU上的推理速度进一步突破。

4、算法线

最后到应用层,工业领域所需要的深度学习算法,往往以超高效率、多模态为主要特征。这类算法的开发训练难度不低,企业往往无法自行研发。为了让工业级的AI算法普惠行业,飞桨提供面向产业应用的跨模态通用语义表示技术,开源开放覆盖多领域的工业级模型库。

截至目前,飞桨平台支持80多个产业实践中长期总结和打磨的主流模型,同时开源开放100多个预训练模型,搭配大量工具和服务层的能力,构成适合产业应用的算法+工具+服务综合工具箱。

每一条必须要跑过的路,飞桨都愿意和有能力比国际竞品多跑一段距离。累计起来,构成了世界AI框架领域,唯一的“工业过线者”。

产业级,三个笔画简单的字里,孕育了多个领域对已极限的突破,对未知世界的憧憬和洞察。

一圈涟漪

目前,飞桨深度学习平台的开源开放,已累计服务了150多万开发者,拥有超过6.5万企业用户、在定制化训练平台上发布了16.9万个模型,真实推动了中国AI技术的标准化、自动化和模块化,加快产业应用步伐。

在从深度学习到产业级开发平台的第一层涟漪之后,飞桨的能量震荡到广袤的产业世界与开发者群落,形成了第二层坚强有力的涟漪。

在接下来的第二篇里,我们将追溯工业革命的涟漪——飞桨向产业实践和开发者群落中的投射与尝试。

各行业的案例、大量真实场景的凝结、实践中的问题与解答,都在飞桨与这个秋天的相遇和成长。

作为产业AI引擎的飞桨,要在飒飒风声中,让世界听到它的轰鸣声。

(0)

相关推荐