回望2020:在大时代中奔腾的百度飞桨

在人工智能的赛道上,中国不再是那个处处挨打的落后者,百度飞桨等中坚力量正在时代的大潮中奔腾。

撰文 /   Alter

编辑 /    胖爷


IDC新近发布了《深度学习框架和平台市场份额报告》。

根据报告中的数据显示,在中国深度学习平台市场综合份额中,Google、百度、Facebook稳居前三,占据70%以上市场份额。其中百度占比提升3.38%增速第一,综合市场份额位列第二,与位列第一的Google几乎持平。

或许在不少人的认知中,深度学习框架还是个相对生僻的词汇,但飞桨离我们并不遥远:无论是抗疫期间的AI测温、智能外呼、基因测序,还是人工智能在田间地头和生产车间的应用,都能找到飞桨的影子。

可以说,飞桨在2020年留下了浓墨重彩的一笔。

01

搭上新基建快车

对于AI领域的开发者来说,飞桨注定不会陌生。

作为国内首个开源开放、功能完备的产业级深度学习平台,飞桨自2016年正式开源以来已经多次迭代升级,在开发便捷性、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、产业级开源模型库等方面奠定了绝对优势。

特别是在“新基建”话题迅速升温的背景下, “飞桨”一跃从技术领域的宠儿转身成为产业关注的焦点,深度学习框架也开始成为外界关注的焦点。

个中原因似乎并不难理解。

人工智能被视为新基建的核心组成,如果要拆解人工智能的基础设施,大抵可以分成两个部分:一是芯片,即AI的硬件计算平台;二是深度学习框架,担纲了AI生产力平台。毕竟人工智能的落地应用是一个协同优化数据、算法、算力的系统性工程,深度学习框架的价值不言而喻。

百度CTO王海峰对深度学习框架所扮演的角色有过一个恰当的比喻:“深度学习框架起到承上启下的作用,下接芯片和大型计算机系统,上承各种业务模型与行业应用,是智能时代的操作系统”。

不同于兜售算法、项目制的合作模式,开源深度学习框架的魅力在于“授人以渔”,为深度学习框架构建了开放共进的生态环境,在解决行业实际问题时能够持续更新迭代,源源不断地为行业落地输送技术养料和创造力。

何况在“新基建”这一大的时代背景下,科技自主自强逐渐成为重中之重。

当人工智能浩浩荡荡地走进产业深处,产业的智能化升级已经是不可逆的趋势,人工智能在经济增长中扮演的角色也越来越重要。倘若无法将核心的底层技术掌握在自己手中,无疑面临着在沙滩上起高楼的风险。

深度学习框架和芯片作为人工智能基础设施的一体两面,有了芯片产业被国外“卡脖子”的教训,深度学习框架的国产化自然成了焦点议题:倘若中国的人工智能产业过度依赖国外的开源框架,不排除将重蹈芯片的覆辙。

所幸以飞桨为主的国产力量及时弥补了国内深度学习框架的空白,并为中国人工智能产业的自主自强注入了一针强心剂。

不只是IDC报告的背书,按照衡量深度学习框架活跃趋势的权威性指标pull request的数据,2019年和2020年的全球开源深度学习框架活跃度排名榜单中,百度飞桨均力压谷歌TensorFlow,紧随Facebook PyTorch之后,已经成为了国内第一、世界第二的深度学习开源框架。

02

做产业的AI底座

人工智能领域流行着这样一种说法:如果说AI是一场饕餮盛宴,那数据就是原材料,算力是天然气,算法是菜谱。

开源的深度学习框架就如同无数厨师用经验与智慧合著而成的烹饪百科全书,其他厨师可以从书中学习经验制作菜肴,也可以指出书中存在的问题,并源源不断地为百科全书贡献新的菜谱。

当整个商业的重心彻底从To C转向To B,新基建、智能经济、十四五规划一次次为这种趋势摁下了“快进键”, 飞桨代表的深度学习框架也开始肩负起新的使命,即全面推进产业智能化。

截止到2020年末,百度飞桨已经凝聚了265万开发者,累计提交代码超过16万次,以PR或ISSUE提交形式的开源贡献者超过了5000位;同时在产业应用层面,飞桨已经服务了超过10万家企业,平台上拥有超过34万个模型。

如此沉甸甸的一份成绩单,离不开百度飞桨的两个核心优势:

一是技术上的硬实力。

日前举行的Wave Summit+ 2020深度学习开发者峰会上,飞桨一口气发布了八项新技术和新升级,包括生物计算平台PaddleHelix螺旋桨、飞桨开源框架2.0 RC版、AI集成开发环境BML CodeLab、业界首个通用异构参数服务器架构等等,几乎每一项升级都是“核弹级”的技术。

比如让开发更加便捷的飞桨开源框架2.0 RC版,提供了“编程一致、动静统一”的全新开发体验,尤其是动静统一的编程体验将为深度概率编程、量子机器学习等前沿学术研究提供更好的支持。

二是应用上的软实力。

目前飞桨已经开源了200+经过真实业务场景验证的官方算法模型,包括计算机视觉、NLP、智能语音等核心技术领域。开发者只需要稍微了解下源码原理,即可导入数据进行模型的训练,从开发到训练再到部署的全链条帮助开发者降低门槛,继而让越来越多行业无缝进入AI时代。

可以找到的例子有很多。有高校基于飞桨的林业虫情监测系统,将原本需要两周的检查任务压缩至一个小时;OPPO将飞桨的大规模分布式训练应用于应用商店、内容推荐、负一屏等等,推荐场景效果提升了4%-5%......

作为中国深度学习框架的领军者,技术领先、功能完备、便捷易用的飞桨,不仅是中国破局深度学习框架自主可控的一柄利器,还应该抓住产业智能化的窗口期,成为产业赛道中的AI底座,向外界释放出技术创新的生态红利,并与产学研各界合作伙伴共建共享繁荣生态圈,让AI流进社会生活的每一个角落 。

03

向“星辰大海”出发

经济学家通常将10年作为一个经济周期,上一个十年是互联网代表的数字经济的黄金时代,下一个十年终将是属于人工智能的大时代,等待百度飞桨等开源深度学习框架的将是浩瀚的星辰大海。

之所以给出这样的论断,还要从当前人工智能的落地现状开始说起。

最让人印象深刻的就是AI人才荒,甚至有机构预测存在500万的庞大缺口。但人才极度短缺的内因其实在于AI的落地门槛:如果一家企业只是用图像识别算法检查产品的瑕疵,都需要写代码、建模型、跑数据,本质上都是在重复造轮子,哪怕是未来十年内培养1000万AI人才,恐怕也无法满足行业的需求。

想要破解这样的难题,开源深度学习框架可能是为数不多的“钥匙”。

百度集团副总裁吴甜曾在演讲中向外界透露了这样一组数据:越来越多的传统产业正加入到产业智能化升级的浪潮中,两年间的占比从53.4%增长到了67.9%;高校AI培训覆盖学科明显增加,非计算机专业高校教师占比从2019年的35%增长到2020年的45%;许多城市的AI开发者活跃度持续增高,特别是在过去一年中,互联网氛围没那么浓郁的佛山、东莞、重庆偏偏是增速最快的城市。

可以给出的解释是,开源深度学习框架早已是企业连接开发者的利器,同时“授人以渔”的连锁效应正在发生,一大批熟谙产业的非互联网从业者,在百度飞桨的帮助下点燃了产业智能化的星星之火,并将在下一个十年中星火燎原。

所以在底层技术不断迭代的基础上,百度在不久前发布了飞桨“大航海”计划,针对面向核心开发者的“领航”、面向人才培养的“启航”和面向产业智能化升级的“护航”三个部分,在未来三年内投入总价值5亿元的资金与资源,帮助国内500多高校培养5000位AI教师,继而培养越来越多的AI应用人才。

当然,站在企业的视角上,百度、谷歌等深耕开源深度学习框架的原因,还有另一维度的答案:在“得开发者得天下”的定理下,开源深度学习框架将是企业跻身“平台型AI”的关键,也是打造AI创新生态不可或缺的一环。

如果说中国企业在互联网时代的成绩,某种程度上可以归结为人口红利和商业模式创新的胜利,百度等巨头正在用AI核心技术向世界证明中国的研发创新能力和底气,在徐徐拉开序幕的人工智能时代讲述科技自立自强的新故事。

也就预示着,当商业的主旋律从互联网切换到人工智能,唯有顺应智能经济时代的需求,才有机会成为下一个时代的巨头。

04

结束语

21世纪即将迈入第三个十年,我们正站在新周期的起点。

可能新的周期中还存在诸多的不确定性,但历史规律告诉我们:科技是第一生产力,也是大国竞争的制高点。

由此再来思考深度学习框架在2020年的历程,或许可以看做是新制高点争夺的伏笔。有别于操作系统、芯片等领域的苦苦追赶,在人工智能的赛道上,中国不再是那个处处挨打的落后者,百度飞桨等中坚力量正在时代的大潮中奔腾。

END

主理人 | Alter
前媒体人、公关,现专职科技自媒体
钛媒体2018年度十大作者
品途商业评论2017、2018年度作者
人人都是产品经理2018年度作者
领英2019年优秀内容贡献者
虎嗅、钛媒体、36kr、创业邦、福布斯中国等专栏作者
转载、商务、开白以及读者交流,请联系个人微信「imhefei」
(0)

相关推荐