一文速览百度飞桨八大全新发布与升级 | WAVE SUMMIT 2020

12月20日,由深度学习技术及应用国家工程实验室与百度联合主办WAVE SUMMIT+ 2020在北京盛大举行。

峰会上,百度首席技术官王海峰及研究团队向开发者们展示了飞桨八大全新发布与升级,包括:

有支持前沿技术探索和应用的生物计算平台 PaddleHelix 螺旋桨,开发更加便捷的飞桨开源框架 2.0 RC 版,端云协同的 AI 集成开发环境 BML CodeLab,支持更强大分布式训练的业界首个通用异构参数服务器架构,开源算法库增至 200+,飞桨企业版 EasyDL 智能数据服务升级,飞桨硬件生态路线图以及携手全球开发者开启「大航海」计划。

飞桨(PaddlePaddle)是百度深度学习开发平台,也是国内最早开源的深度学习框架。

2020年,在新基建浪潮下,AI市场加速下沉,各行各业都拉开了智能化升级的大幕。在以深度学习为代表的人工智能发展浪潮之下,深度学习技术在赋能行业智能化转型中发挥了重要作用。

在本次峰会上,作为人工智能技术创新和产业发展的基础设施,百度飞桨再次交出一份亮眼的成绩单。

百度副总裁吴甜在会上表示,截止目前,百度飞桨凝聚开发者265万, 创造模型超过34万;携手20家硬件厂商,适配芯片与IP型号29种;服务企业超10万家,覆盖金融、交通、物流等数十个行业。

据此前报道,在今年5月的WAVE SUMMIT+峰会上,百度飞桨发布35项全面升级以及飞桨全景图,当时平台开发者数量、模型数量、服务企业数量分别为190万、23万和8.4万,对比目前来看,飞桨的技术与生态发展显然正在提速。

接下来,我们来逐一揭秘飞桨的最新升级成果。

生物计算平台螺旋桨(PaddleHelix)

百度飞桨首次将行业触角伸向了全新的生物计算领域。峰会上,百度集团副总裁吴甜重磅发布了基于飞桨的生物计算平台——螺旋桨(PaddleHelix)。

螺旋桨是一款生物计算开源工具集,提供包括RNA二级结构预测、大规模的分子预训练、DTI药物靶点亲和力预测以及ADMET成药性预测等在内的新药研发和疫苗设计环节的核心能力,为生物信息学、计算机交叉学科背景的学习者、研究者和合作伙伴,更便利地构建AI算法模型。

此前,百度研究院面向全球疫苗研发机构及研究中心等公益开放了LinearDesign算法,并开源了RNA二级结构预测的Linear系列算法。最近,国际顶尖人工智能峰会The AI Summit举办,百度凭借LinearFold和Linear算法在新冠抗疫中的表现,荣获AIconics首届“AI For Good”人工智能向善奖。

吴甜表示,螺旋桨生物计算平台将秉承一贯以来的开源开放原则,与合作伙伴共建共享,未来形成一套完整的面向行业的生物计算生态和服务。目前百度推出的《基于机器学习的生物计算平台技术要求》,已成为行业内首个生物计算平台的标准立项。

从今年5月飞桨发布全新全景图,再到螺旋桨这一重磅工具组件的“加盟”,可见,飞桨平台在不断迭代拓新,持续提升核心能力同时,进一步夯实了人工智能开源开放与创新发展的底座。

开源框架V2.0RC版

峰会上,更让开发者们惊艳的是飞桨开源框架V2.0RC版的重磅发布。

百度深度学习技术平台部高级总监马艳军表示,在新框架下,飞桨动态功能更加成熟、API功能更加强大,“编程一致”、“动静统一”的特性将为开发者们带来全新的体验,同时也将为深度概率编程、量子机器学习等前沿学术研究提供更好的支持。

动态图模式,便于开发者调试

飞桨 2.0RC 版已将默认的开发模式正式升级为动态图模式。

静态图和动态图是深度学习框架的两种主要编程范式。静态图模式能够对整体性做编译优化,有利于性能的提升,而动态图的优势在于便于用户调试。

马艳军介绍称,全新升级版飞桨融合了两种变成范式的优势,在保证性能的同时,可方便开发者随时查看变量的输入、输出,或者使用 Python 原生的控制流灵活组网。

此外,为了克服动态图在C++语言部署上的挑战,飞桨 2.0RC还提供了完备的动转静支持。在动态图编程调试的过程中,开发者仅需添加一个小小的装饰器,就可以无缝平滑地自动转静态图训练部署。同时,2.0RC 版本的飞桨还做到了模型存储和加载的接口统一,保证动转静之后保存的模型文件能够被纯动态图加载和使用。

发布全新高层API,实现一体化设计

飞桨V2.0RC版本中还有一项重大的变化:API体系的全面升级。会上,马艳军主要介绍升级版API的三大特性:

一是体系化:新增了200多个API,并对所有API进行了全量功能增强以及体系化分类;

二是简洁性:实现了高层API与基础API一体化设计,有助于开发者的交叉使用;高层API的发布可减少大量模型的训练代码,实现简易开发。

三是兼容性:V2.0RC版完全向前兼容,它还提供了迁移工具,基于其他底层框架的开发,同样可迁移至飞桨V2.0实现预测和部署。

业内首个通用异构参数服务器架构

随后,马艳军还正式推出了大规模分布式训练的升级——业内首个通用异构参数服务器架构,它可以大幅提升训练效率,节约成本,真正实现训练效率最优化;

在搜索推荐领域,通用模型常常有大规模稀疏特征的特点,在训练IO密集型任务时,通常需要CPU来搭建参数服务器架构。但为了更好的性训练效果,开发者常常会在推荐模型中增加越来越复杂的网络结构,这使训练算力成为一个很大的问题。

传统架构要求硬件类型必须一致,无法加入算力比较强的硬件,但如果完全替换成GPU硬件,它有不擅长处理IO密集型任务。

马艳军称,在这种背景下,我们提出了异构参数服务器训练架构,通过性能测试,在相同硬件条件下,异构参数服务器比单纯的非异构的硬件能够提升65%以上,同时它还可以保持非常高的性价比,比如2个CPU加上2个GPU就可以达到4个GPU相应的速度。

除了大规模分布式训练外,开源算法库也进行了同步升级。目前,开源官方算法数量已从140+扩展到了200+,其中包括各个领域的多种算法,并且大多数算法已升级到了动态图实现。

最后,马艳军正式对外发布了飞桨硬件生态路线图。从今年5月份发布了硬件生态圈共建的计划以来,百度已经与20家芯片硬件企业达成了合作,目前正在适配和已经完成适配的芯片和IP型号已达29种,这在国产芯片支持上面占据了绝对的领先优势。

飞桨企业版,让开发更便捷

飞桨企业版也带来了最新升级。峰会上,百度AI平台研发部总监忻舟介绍了飞桨企业版发布和升级的两大亮点功能:全新AI集成开发环境和智能数据服务平台。

飞桨企业版包括零门槛AI开发平台EasyDL和全新功能AI开发平台BML,分别针对AI应用开发者和AI算法开发者提供开发体验。

忻舟首先介绍了BML的最新成果,即端云协同的AI集成开发环境BML CodeLab。考虑到开发者在使用BML时更关注算法的开发效率,比如它的应用性、参数调优、实验管理等。忻舟表示,BML CodeLab为开发者提供了三大特性:开发体验增强、开箱即用的便捷性以及端云协同能力。

  • 优化体验,BML CodeLab优化了50多个项目体验,包括GPU环境简化,任务管理,专有库分发等,其中最具特色的是LSP((Language Server Protocol)的集成。

  • 开箱即用:其客户端内置飞桨文心(ERNIE)NLP套件及单机高性能技术引擎。

  • 端云协同:支持将本地任务无缝扩展到包括百度智能云在内的多个云端算力平台,加强客户端的可扩展性和灵活性;

EasyDL是专门为零开发基础的用户设计的AI应用平台,内置了视频、图像、文本、语音等6个技术方向高精度预训练模型,用户只需将业务数据置于其中,并进行标注,平台可自动根据任务需求进行模型训练。为了应对复杂的数据处理过程,EasyDL为开发者提供了智能数据服务服务平台Easy Data,它可提供从数据清洗、数据扩充、数据标注,到管理分析,再到模型上线后的数据回流的一站式便捷服务。

关于本次的技术升级,忻舟也主要讲了三个方面:

  • 核心算法和硬件升级:使智能标注时长平均减少74%,物体检测和图像分割上准确性分别提升了6.4和3.2个百分点。

  • 多人标注能力升级:深度学习任务需要大量数据标注,担任标准难以满足数据量需求;满足多人标注能力,同时解决了传统数据分发、审核的难题;提供了标签管理特色功能,让数据处理更加灵活、高效。

  • 数据清洗升级:基于飞浆的人脸识别和人体识别模型,过滤大量无效样本,显著提高了数据处理效率。

投资5亿元,加大AI人才培养

吴甜表示,百度飞桨正在各行业、多地域、众领域发挥作用并产生更大的影响,峰会上,她从产业应用、人才培养以及开源生态建设分享了飞浆生态的最新成果与未来计划。

在产业应用方面,飞桨平台拥有超过34万个模型,服务了超过10万家企业。吴甜表示,从平台数据统计来看,飞桨的行业应用品类的分散程度明显在增加,越来越多的行业及企业开始借助飞桨实现产业智能化升级。

峰会上,来自新能源领域的宁德时代科技公司、中国石油领域的昆仑数智科技公司现场分享了使用百度飞桨的项目经验与成果。同时,百度飞桨与深度学习技术及应用国家工程实验室联合为12家企业颁发了“产业应用创新奖” 。

在人才建设方面,百度飞桨凝聚了265万开发者,累计提交超过16万次,开源贡献者超过了5000位,其中97位优秀的开发者通过层层筛选成为了百度飞桨开发者技术专家(PPDE)。在高校人才方面,飞桨也在持续投入,截止目前,飞桨的全国师资培训计划已经覆盖500多所高校,支持200余所高校开设学分课程;AI大赛覆盖全球五大洲22个国家580所高校;累计举办线上直播可176次,在AI Studio上累计学习的人次超过了290万。

未来针对AI人才培养,尤其是高校人才培养,飞浆还将持续加大力度。峰会上,百度AI技术生态部总经理刘倩重磅发布了飞桨“大航海”计划。

该计划包含:面向核心开发者的“领航”、面向人才培养的“启航”和面向产业智能化升级的“护航”三个部分。

刘倩表示,围绕高校人才培养的启航计划,未来三年,百度飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI教师,联合培养50万AI未来人才。

除了产业共进、人才共育之外,百度飞桨也在携手合作伙伴共建开源项目,驱动技术创新。此次大会上,清华大学计算机系教授、深度学习技术及应用国家工程实验室副主任朱军介绍了珠算深度概率编程与百度飞桨的合作,依托飞桨框架成熟的底层功能和动静统一的开发体验,更好地支持深度概率编程工具开发和前沿技术探索。

小结

可以看出,百度飞桨的产业生态正在加速渗透到社会各界。

265万开发者、十多种行业超10万家企业,作为国产最大的深度学习平台,百度飞桨历经四年,凭借不断的技术升级、迭代逐渐获得了业界的认可和青睐,同时也逐渐在以Tensflow、PyTorch为首的垄断市场占据了一席之地。

与此同时,透过飞桨的技术创新与产业发展路径,我们也可以看到,开源开放作为其核心驱动力的巨大潜力。

如王海峰所说,开源开放让我们可以更快追踪到最新的技术进展,并将改进意见以及创新思想迅速进行反馈,形成一个正循环,进一步推动科技的创新迭代。

雷锋网雷锋网雷锋网

(0)

相关推荐

  • 五载开源求索,百度飞桨造智能时代基石

    "人工智能"作为第四次工业革命的代表性科技,在生活.生产及社会经济方面所取得的成绩已经相当显著,并且普遍认为人工智能带来的生产力提高将远高于前三次工业革命. 今年两会期间,推动人工 ...

  • AI的星辰与大海,百度的理性和感性

    每到岁末年初,大家需要的绝不仅仅是对假期和节日的期许,更渴望在这难得的内敛时节收拾情绪.整理思路.筹谋未来. 而2020与往年最大的不同,或许就在于全球刚刚经历了一场波澜起伏的疫情,可能会在未来数年内 ...

  • AI防疫进阶路线图:从百度站驶向下一场繁荣

    史学家李约瑟很喜欢用自己的老本行--生物化学,来解读宏大叙事的社会学问题,还为此引入了一个有趣的名词--"滴定"(titration). 所谓"滴定",就是将试 ...

  • 新基建开航之际,百度“黄埔学院”发力培养“AI船长”

    茫茫无边,怒海狂澜,1 艘潜艇,135 名水手,180 天航程,如何将每一位水手都打造成优秀绝伦的领导者? 这听起来有点不太可能,"圣塔菲"号潜艇的指挥官L.大卫·马凯特却做到了. ...

  • 免费 | 百度出品零基础速成Python营,带你学透Python!

    如何能系统速成python,甚至能够跑通实例,并且上手深度学习项目? 百度飞桨领航团开设零基础Python速成营,全程采用直播+答疑+实践作业的学习模式,6天时间里每日直播打卡学习.完全覆盖Pytho ...

  • 回望2020:在大时代中奔腾的百度飞桨

    在人工智能的赛道上,中国不再是那个处处挨打的落后者,百度飞桨等中坚力量正在时代的大潮中奔腾. 撰文 /   Alter 编辑 /    胖爷 IDC新近发布了<深度学习框架和平台市场份额报告&g ...

  • 调参到头秃?你需要这份自动超参搜索技术攻略

    阅读大概需要13分钟 Follow小博主,每天更新前沿干货 来源:PaperWeekly 本文约4845字,建议阅读9分钟 本文介绍了自动超参搜索的系统架构及技术攻略. 在人工智能领域,算法工程师在训 ...

  • 百度智能云【云智一体】白皮书,构建起怎样的全栈AI开发图景

    数字经济时代,AI.云计算技术的应用成为各行各业发展的共识,随着人工智能与产业结合的进一步深入,AI开发一时成了时代显学. 近日,百度智能云发布"云智一体"技术与应用解析系列白皮书 ...

  • 不信不可能:飞桨,划一个时代的初心

    AI在哪里? 大部分人可能会想到科幻电影,或者异常先进的实验室.但是河北工业大学教授刘晶却认为AI就在一间间工厂车间里.学习了六年深度学习,花两个月时间跑了一百多家钢铁厂,最终,她把在钢铁熔炼复杂的配 ...

  • 企业应用AI之路怎么走?飞桨实践有真知

    AI大势之下,越来越多的企业积极拥抱AI.然而,现实与憧憬还有很大的距离.众多传统行业要实现AI应用还远没有想象中的那么简单. 从企业中有人开始思考"我们面对的问题能不能用AI来解决&quo ...

  • 不变的初心,百度飞桨开源生态的坚持与坚守

    三年前,李彦宏撰写<智能革命>一书时,人工智能还是"将来时". 2020年的岁末,当我们回头审视即将过去的一年时,猛然发现人工智能已经在交通.金融.能源.制造等行业应用 ...

  • 云智一体,企业全栈AI开发平台已就绪

    数字化的趋势已经成为这个时代企业必须面对的问题,而走向智能化则是通向数字化企业的必由之路.所以,AI技术在企业数字化转型的过程中会扮演重要的角色.   那么AI对企业来说到底意味着什么?我认为应该是一 ...

  • 用AI牵引新基建,百度悄悄升级了四大杀手锏

    其中,AI作为新基建的关键技术,无论是支撑传统基础设施转型,还是科学研究.各行业转型升级,也成为智能经济背景下,流着"奶与蜜"的技术应许之地. 换句话说,人们对于新基建的美好想象, ...

  • 「一体双翼」百度飞桨的“新基建”姿态

    不同于以往,新基建正在成为各大科技企业大展身手的舞台. 这是一个明显的趋势,虽然"新基建"的概念是由上而下推行的,但落实到市场层面.应用领域,科技企业的探索路径逐步成为了主流认可的 ...

  • 工业革命的秋之涟漪(三):飞桨,划行在智能经济之海

    当一滴水穿透喜马拉雅雪山时,没有人能够想象到它融汇到太平洋时的场景.然而确实就是这些水滴的涓涓汇流,让人类认识了海洋的模样. 在这个系列的前两篇里,我们审视了飞桨本身走向产业级的关键特性和领先技术:接 ...

  • 从AI开放平台,到工业大生产基座:重新认识百度大脑5.0

    根据麦卡锡早些时候的报告,未来AI技术90%的价值将发生在与各行业的结合,并且到2030年将创造超过中国与印度GDP总和的产业价值.毫无疑问,今天每一双眼睛都在紧盯着AI,好奇地审视着这一切到底会不会 ...

  • 快到飞起!这个调参神器我爱了!

    吃一个苹果要几步?这对普通人来说,是一件很简单的事. 那么 AI 模型调参需要几步呢?调参是机器学习中至关重要的一环,因其复杂性而被称之为一门 "玄学".这对开发小白和 AI 专业 ...

  • 文心ERNIE,百度AI产业化落地的一个样本

    从百度发力AI算起,AI在中国商业化进程已超过10年,AI算法.算力.数据等基础设施均已完善.2020年的疫情,直接加速世界数字化与智能化进程,全社会对智能化达成高度共识.今年两会上,百度李彦宏.联想 ...

  • AI的下一个五年计划

    30秒快读 1 类脑智能在AI脑内开了个"意识小剧场",深度学习"不是炼金术"  AI还能学什么?AI开源框架国产化,百度.旷视相对抗谷歌.脸书. 2 < ...