众包竞赛:让人工智能更加普惠

当我们遇到一个科技研发难题,譬如人工智能在某个场景的应用与落地,应该怎么做?

如果按照传统的做法,那么首先应该找来一些精英的专家组成研发团队,将他们聚在一起群策群力,然后历经反复的研发与测试,耗费大约一两年甚至更长的时间,最后开发出一套解决方案。

在很长一段时间里,在绝大部分场景下,几乎所有的公司都采用的是这种开发模式。

然而亚马逊云科技及其合作伙伴Biendata却告诉我们,其实还有一种创新的开发模式,可以让人工智能应用创新的速度更快、门槛更低、更加普惠。

众包竞赛:一种创新的开发模式

Biendata由清华大学计算机系孵化,旗下产品与服务包含人工智能竞赛、数据科学社区、前沿人工智能报道、专注于AI行业的品牌传播服务等。

以竞赛与社区为入口,Biendata致力于打造国内一流数据科学综合服务平台。在竞赛方面,Biendata打造的人工智能竞赛平台已经累计举办了100多场专业算法赛事,累计参赛选手超过10万人,累计总奖金超过700万元,累计运营比赛社群总人数超过2万人;在社区方面。Biendata运营的人工智能学者社区用户已经超过10万人,主要分布于大型互联网企业、研究机构、学校,其中学生用户占比超过70%。

“在过去的几年里,如何降低人工智能技术应用的门槛,实现人工智能的普惠,一直都是大家关注的热点。而在业务的发展和创新过程中,我们发现有一种众包竞赛的方式,有可能是传统开发方式之外一种有益的补充,其开发效率甚至有可能会超过招募全职的专家团队。”作为Biendata平台的创建者,北京数竞科技有限公司创始人兼CEO管心宇向趣味科技介绍道,“于是我们就做了一些关于人工智能、开发者社区的一种新的组织模式,也就是Biendata众包竞赛平台。其中Bien是法语,也就是'好’的意思。我们希望能够在这个平台上汇聚很多很好的数据集和很好的开发者,这其实是我们对当时各种科技类创新模式的一种观察和探索。”

管心宇指出,所谓众包竞赛,就是由需求方(或者主办方、甲方)提出一种奖励的机制,这种奖励可以是现金,也可以是资源等其他形式。相比传统开发模式,众包竞赛参与的门槛很低,不论国籍、性别、年龄、职业、全职还是兼职,都可以参赛。在每个人都可以参加比赛的原则之上,还有一个统一的评测方法,能够对所有参赛者的作品进行排序,再把比赛奖励颁发给获奖的第一名或是前几名。

“在探索与实践的过程中,我们发现众包竞赛里面其实有很多案例或者理论研究、行为经济学或者管理学研究,而且这种方式是非常有效果的,于是我们就想探索看它是不是能被应用在人工智能领域的创新里。”管心宇透露,“结果我们发现,这种方式其实特别适合人工智能,因为前面介绍过,竞赛中有一个评测环节,而评测有时候是比较主观的,很容易成为这种众包竞赛的问题所在。但是人工智能不一样,它往往都有一个Benchmark的标准数据集。大家在这个数据集上去运行模型,就能得到一个非常客观的评测结果。譬如预测明天的天气怎样、温度多少,到了明天我们就能知道评测结果与事实的差异。这也充分保证了众包竞赛结果的公平性。”

选择亚马逊云科技的原因

像Biendata这样的平台,自然也离不开强大稳定的云服务支撑。早在还处于原型阶段的时候,Biendata就针对多家云服务商进行了调研和对比,最终选择了采用亚马逊云科技的云服务。

谈到Biendata为什么在强手如林的云服务商中选择了亚马逊云科技时,管心宇表示主要有以下四个方面的原因:

一、数据安全保障性高。亚马逊云科技看重数据保护,合规性和数据隐私;并且从底层数据中心搭建、网络访问以及操作权限设置,都提供了多方面的安全保障。

二、可伸缩的强大计算能力。丰富的实例类型配合易用的工具,加速在云中不同规模的深度学习的速度,Biendata可以更关注上层应用设计与算法整合,而不用再担心资源瓶颈。

三、稳定可靠的技术。系统的整体稳定性显著提高,广泛支持开源软件与商用软件的对接,应用程序的可用性达到99.9%,也无需为基础架构服务的稳定性而担忧。

四、具有成本效益的服务。节省了资源成本和人力成本。其中在资源分配方面,结合Amazon EC2 Auto Scaling和Amazon EC2 Spot实例的应用,使得资源占用成本大幅降低;而在人工成本方面,亚马逊云科技的自动管理功能降低了对系统运维的需求,节省了雇用专职运维人员的成本。

“在过去几年的合作过程中,我们发现几乎每一个产品都可以在亚马逊云科技的产品线里找到一个比较对应的功能,可以很好地支持我们去做快速的研发、上线、迭代,这极大地提升了我们的开发效率。”管心宇表示,“除此以外,在安全性和合规性方面,亚马逊云科技也拥有非常显著的优势,能够满足全球几乎所有监管机构的合规性要求。举例来说,我们在新加坡国立大学项目竞标的时候,客户就非常重视安全与合规的能力,因为当地法律特别严,对各项数据都要求有相应的安全标准和极强的保护措施。原本要满足这些标准是非常麻烦的,光是申请的时候就需要提交大量材料,但因为我们的服务本身是在亚马逊云科技新加坡区域的云上,所以它自动的、默认的就已经符合里面绝大部分的标准和要求,很多材料也都是现成的。原本这个申请过程至少要准备三到五个月,后续可能还需要做一些测试,甚至还要找第三方机构来进行认证。但是因为亚马逊云科技已经满足了这些严格的隐私和数据保护要求,所以以上这些过程全部都省略了,帮助我们节省了大量的时间和成本。”

将普惠人工智能推向全球

作为一个技术项目,Biendata于2015年启动,2017年开始独立运营,并选择了亚马逊云科技开展合作。2019年,Biendata加入亚马逊云科技全球合作伙伴网络(APN)。从此Biendata不只是亚马逊云科技的客户,同时也成为了其坚实的合作伙伴,为更多用户提供云上的人工智能方案。

2020年肆虐全球的新冠疫情,让许多创业公司都遭遇了极大的业务挑战。然而Biendata却借助云上开展在线业务的优势,通过更多云原生的服务降低了运维成本,并将更多关注放在业务本身,实现了业务的迅猛发展。譬如新冠刚开始流行的时候,Biendata就联合北京智源人工智能研究院、晶泰科技组织了“药物研发小分子性质预测赛”,加速药物研发的速度和药物筛选的过程;针对新冠流行趋势,Biendata联手智谱和清华大学组织了“新冠流行预测”,根据患病和疑似病例的人数预测未来七天新增人数趋势,帮助政府部门和政策制定者更好地预测新冠流行趋势,提前做好预警和备案;Biendata还联合清华大学、Aminer等机构联合组织了“COVID-19知识图谱构建”竞赛,从大量的科学文献中自动提取关键知识,帮助科研人员更加高效地针对病毒开展科研工作。

除此以外,Biendata还在2015-2020年承办过四次全球最具影响力、素有“数据世界杯”称号的KDD CUP比赛。特别是2018年的比赛,当时Biendata做了一个空气污染预测的比赛,要求选手去预测北京和伦敦这两个城市未来PM2.5的浓度的变化趋势,这个其实跟新冠预测也是一样的,如果有很好的预测模型,就可以帮助社会和政策制定者提前做好准备。

2021年,Biendata的业务发展也上升到了一个新的阶段。借助亚马逊云科技安全合规的能力,Biendata赢得了更多的海外项目,并且与亚马逊云科技的其他客户合作开展了人工智能普惠的竞赛,通过比赛为K12及高校领域培养更多的人工智能人才。以备受关注的Amazon DeepRacer无人驾驶训练系统为例,就是Biendata与几所高校合作,将DeepRacer的无人驾驶训练系统和真车打包变成一个实训产品,让学生可以在线上的训练系统中训练自己的强化学习模型,然后将模型加载到小车中,在线下的赛道上实现自动无人驾驶。

“未来我们希望和亚马逊云科技携手合作,通过这种人工智能众包竞赛的方法,连接人工智能的开发者、数据集、应用场景、模型,然后将这些结合产生的优秀成果普及到各行各业,让大企业、小公司甚至个人,都可以享受到人工智能技术带来的成果。我们希望将普惠人工智能作为企业使命推向全球,促进海内外人工智能领域人才的交流合作,构建国际化的数据科学协同创新平台,让先进的人工智能科研成果和竞赛经验能够跨越国界,进行无缝链接与融合。”管心宇说道。

(0)

相关推荐