智能化转型浪潮下,百度EasyDL的“AI普惠”之路
人人都想搭上人工智能这辆快车。
然而不会编程,心有余而力不足,无法跟上技术推动下产业发展的节奏应该怎么破?
百度EasyDL正是这样一款能够让没有技术基础的中小企业在智能化转型方面实现“弯道超车”的工具。
最近EasyDL推出的“万有引力”计划,进一步将AI落地的门槛与成本打了下来,让人工智能从概念到实验室,再到落地现实走入企业业务和大众生活,这一整套闭环流程不再像想象中的那么遥不可及。
1
EasyDL让AI落地so easy
1956年的夏天,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出了“人工智能(Artificial Intelligence,简称AI)”这一概念。
经过60多年的发展,人工智能进入到大规模落地阶段,越来越多的企业也开始进行智能化升级,这也让AI应用场景趋于多样化和复杂化,企业对高效定制AI的需求也越来越大。
在这样的背景之下,新的问题也产生了。
根据百度和波士顿咨询公司的联合调研中,发现约86%的市场需求需要定制开发业务场景下的AI模型,在定制模型的过程中,企业用户和开发者往往会面临缺少模型训练经验、数据采集和标注成本高、模型适配与部署流程繁琐、模型优化迭代周期长等难点,从而造成整个项目成本高、周期长,且在前期对项目效果无法准确预期。
就像一座大山横亘在企业与技术之间,企业想进行智能化转型,一方面自身不具备如此专业的能力,另一方面又因转型过程的不确定性而心生犹豫。
企业需要一种“傻瓜式”的AI落地或者应用的工具,基于百度飞桨深度学习平台的EasyDL就这样出现了。
作为一个高效易用的零门槛、一站式AI开发平台,EasyDL支持智能数据、模型开发、服务部署等全流程功能。目前已经支持图像分类、物体检测、图像分割、音视频分类、语音识别自训练、表格数据预测、文本分类、情感倾向分析等任务类型,可以帮助中小企业结合业务需求,解决效率和成本的问题。
EasyDL让AI落地到底有多容易,我们来看看两个例子。
青岛爱包花饰是一家专业的箱包检品公司,每天需要检查货品十多万件。
爱包花饰之前采用传统的X光检针机通过X射线返回箱包内部信息,其中需要人工肉眼判断箱包中是否有金属异物、金属配件数量是否符合生产要求,不光效率低而且人力成本大,长时间的重复工作还容易让检验员产生疲劳和松懈,以致品控始终难以提高。
爱包花饰使用EasyDL训练箱包质检模型,只是提供了含有针、剪刀等异物和金属部件商品的X光图像,在完全无需了解AI算法细节的前提下,也训练出了准确率90%的模型,箱包生产过程中的残留异物(如针、金属零部件等)的检出率和箱包的质检效率大大提高。
瀚才猎头之前也有着类似的烦恼,200万条人才数据,利用率不到10%。
作为“高级管理人员代理招募机构”,如何高效地为客户推荐合适的人才是瀚才猎头的核心业务,也是其在行业发展中的核心竞争力。
但瀚才猎头10余年发展过程积累的体量庞大的人才“数据库”却因为其难以整理和分类,导致大量的数据资源处于“闲置”状态,瀚才猎头的优势也没有得到体现和发挥。
这个局面在使用EasyDL后发生了改变,通过EasyDL平台的数据清洗和训练分类能力,瀚才猎头在1个月时间内将200万条经营数据划分成12个大行业、147个小行业和10个通用职级信息,使被“遗弃”的数据开始有了匹配的“用武之地”。
以前按照关键词搜索的方法,每天只能找到60-70份合适的候选者简历,现在经过数据结构化处理后,20分钟就可能达到600-1000份,而且精准度达到了95%以上,整个效率提升了200倍。
2
使用简单的背后是复杂技术的高度集成
以上两个案例都有一个共同点,即模型的训练过程不需要任何代码基础,只需按业务需求,完成数据处理和提交,然后选择部署方式就可以了。
看似简单的背后,实际上是百度EasyDL对复杂AI技术的深度掌控。
首先,在基础层,百度的超大数据库保证了模型效果。
EasyDL好用的第一关键在于效果,EasyDL保证效果的基础就是预置了百度大规模数据训练的预训练模型,让模型精度大大提升。
比如,在视觉任务中,图像分类训练任务内置了百度基于海量互联网数据,包括10万+分类、6500万图片训练的超大规模预训练模型,平均精度可提升3.24%-7.73%;物体检测训练任务内置百度基于800+标签、170万图片,1000万+检测框训练的超大规模物体检测预训练模型,平均精度可提升1.78%-4.53%。
再比如,在自然语言处理方向,EasyDL预置了由百度自研的预训练模型文心(ERNIE)2.0,将大数据预训练与多源丰富知识相结合,持续学习海量数据中的知识,将机器语义理解水平提升到一个新的高度。目前文心(ERNIE)在中英文的16个任务上已经超越了业界最好模型,全面适用于各类NLP应用场景。
其次,在应用层,通过智能数据服务来提升企业效率。
所谓的智能数据服务,就是从数据采集到数据标注,再到数据清洗,EasyDL都能提供一站式的全方位服务。
以中科立业为例,这家做智能结算果蔬秤的公司希望将AI服务集成在智能果蔬结算秤上进行果蔬识别,但他们在超市试运营时,经常会出现因物体遮挡(塑料袋遮挡)、光线多变(亮光、暗光)、果蔬形状角度多变等情况,导致数据采集质量不高,如果要解决这一痛点,提高识别率,需要更加丰富的训练数据。
EasyDL通过软硬一体、端云协同的自动数据采集方案,提前对端设备进行测评和适配,将数据采集效率从周提升到小时。
在数据标注方面,EasyDL提供图片、文本、音频、视频四种数据格式的11种数据标注模板,在物体检测、图像分割、文本分类三类任务场景中,通过百度自研的Hard Sample主动学习挖掘算法,进行针对性适配,在同样的模型效果指标下,可减少70%的数据标注量。
上文提到瀚才猎头简历库的文本分类中,员工手动标记了1万条,其余的199万条全部是自动完成的。
中科立业使用EasyDL后,通过对图像数据进行相似度的去重去模糊,剪裁,旋转,镜像以及数据增强等数据清洗处理,在50种水果的测试中,准确率达到了95%以上,整体效率提升了60%。
最后,在部署环节,多种方案让AI落地“零门槛”。
目前EasyDL提供了公有云 API、本地服务器部署、设备端 SDK、软硬一体部署四种方案。
其中,设备端 SDK,适配了NV Jetson 系列、Intel 神经加速棒、华为 NPU、华为 Atlas、高通 DSP、RK 等十几种业界主流的端设备。
在软硬一体方案部署上,EasyDL提供了6款软硬一体方案,支持专项适配与加速,覆盖高中低全矩阵,模型识别速度可提升10倍。
对于用户而言,无需关注任何模型转化、适配的细节,甚至不用写一行代码,只需经过简单的设置,就可以将训练好的模型转换为满足业务场景需求的服务,其中的效果和性能还能达到非常高的水准。
像偲睿科技基于EasyDL开发办公场景下的自动场景识别模型,如在办公室场景下监控人数多少、窗帘状态等,考虑识别的实时性,选择将训练好的模型在EasyDL部署为EasyEdge设备端SDK,综合识别率达到91%。同时由于EasyDL设备端SDK易于部署的便捷性,设备端模型集成周期从之前的1个半月缩减到只需2天,足足缩短了20倍。
3
“万有引力”计划,助力 EasyDL实现AI普惠的推手
山就在那里,静默无语。你眼中是奇峰罗列,还是临渊而立?那不取决于山,只取决于所站的高度和角度,以及内心的深远。
这是作家辉姑娘在《智者见山,愚者见渊》一文中,对“不同人对同一事物不同认知”的描述,将这段话放置于企业智能化转型的时代背景之中,也是企业家们不同创新思维的真实写照。
如上文举的那些案例一样,面对智能化转型的潮流趋势,有些企业会勇敢的拥抱变化,在自身能力范围之内,尽可能创造条件,制造机会,主动融入其中;有的企业不愿跳出自己的舒适区,视转型为洪水猛兽,前怕狼后怕虎,始终没有迈出关键的第一步。
事实上,当企业采用EasyDL进行智能化转型的尝试之后会发现,这件事并没有想象中的那么难。
瀚才猎头一位创始人就表示,他们曾对很多AI开发平台进行过对比,最后选用EasyDL,不仅是因为数据结构化的效果好,更重要的是其零开发门槛、一站式服务的特性,节省了自己配置技术团队,做数据处理、算法研发和算力支持的成本。
这或许能给那些想动而未动的企业们很好的经验启示,换个角度来看待企业智能化转型这个事情,改革的关键力量往往不是创新,而是如何“除旧”,如何跳出传统的产业思维,走向人人向往的智能时代。
EasyDL正是这样一个致力实现“AI普惠”的AI开发平台,对于很多企业来说,无论智能化转型的探索有多艰难,风雨都会过去,EasyDL就是他们见到的那道彩虹。
现在有个好消息,为了进一步全面降低企业应用AI的门槛与成本,EasyDL于近期面向所有中小企业推出了“万有引力”计划,为有 AI 应用需求的企业提供专项基金,助力万家企业,创享 AI 能力。
参与本次活动的企业及个人开发者,只需通过 EasyDL 经典版免费完成业务模型的定制训练、部署与应用,即可领取万元专项代金券。针对落地效果突出的项目,还有机会获得最高十万元的特殊补贴。