提到人工智能(下文简称为AI),如今大家显然都不会感到陌生。小到智能手机里的拍照算法,大到医疗诊断的工具软件、工业生产线上的机器人、城市中的交通调度和安防监控系统,AI正在以前所未有的速度和效率改变着我们的日常生活,更在不断促进着诸多行业的改变与进步。但你知道AI是如何诞生的吗,该怎样“造”出一个AI吗,如果你是一名并未接触过AI的程序员,接到上级想要在业务中部署AI的指令,又该如何是好呢?别担心,这些答案在2020年12月9日都迎来了解答。因为就在这一天,全球云计算行业领导者AWS召开了他们以机器学习(Machine learning, 下文简称为ML)为主题的活动。而机器学习,正是如今最主流的AI实现方式之一。
机器学习是什么?简单来说,它是一种通过使用大量的特定数据,经过相应算法进行训练,最终诞生出一个可以实际使用(AI)模型的机制。打个比方,就好像让一个人在一段时间里阅读大量同一类型的书籍,并最终形成某一个固定的思维模式一样。正因如此,对于传统的机器学习过程来说,开发者需要经历收集和准备训练用数据、选择和优化学习算法、配置和管理机器学习过程、对训练出的模型进行微调和查错、在生产环境中部署AI模型,以及扩大和管理生产环境等多个繁琐且相当“烧钱”的过程,才能将一项项数据最终转换为生产线或最终产品里起作用的“AI算法(模型)”。很显然,对于任何一个常规企业或个人开发者来说,想要靠自己去完成整个过程实际上都是极不划算的。而这也正是为什么自从AWS推出云端机器学习Amazon SageMaker以来,它就一路成长为AWS旗下增长速度最快的业务,并得到全球成千上万家客户信赖的原因。那么,Amazon SageMaker到底有哪些特色呢?首先,它提供了能大幅简化数据准备过程的Amazon Sagemaker Data Wrangler服务,它允许开发者从多个数据源导入数据,并通过内置的300余个免费的预置数据转换选项,让开发者甚至连一行代码也不用写,就能在直观的图形界面下就能直接搞定数据的预处理和一键导出。其次在通常的机器学习过程中,为了优化模型训练的效果,我们通常必须把原始的、关联性小的数据提炼为一些明显的、具有代表性的特征(Feature)。对于AWS来说,Amazon Sagemaker Data Wrangler可以轻松做到近乎自动化的特征提取,而在这之后,就可以使用Amazon SageMaker Feature Store对特征数据进行简便易得的图形化管理和存储。与常规的机器学习工具相比,Amazon SageMaker Feature Store不仅具备高度可视化的图形界面,它还可以做到安全地存储、发现,以及共享特性数据,并在执行新的机器学习任务时,轻松地对此前已经提炼出的特性进行再度使用,而无需重新配置数据。当然,有的时候我们会发现,辛辛苦苦收集了数据、训练出了模型,最后模型的预测值却与真实情况相差甚大。这种时候,模型本身的偏差显然就使得它无法用在产品上了。为了避免这种情况,AWS在今天也正式发布了全新的机器学习工具,旨在实现全流程端对端偏差监测的Amazon SageMaker Clarify。Amazon SageMaker Clarify能做些什么?在数据分析阶段,它能够分析数据本身的偏差值,发现那些可能出错的数据,避免将其引入训练。而在模型训练阶段,它能够在训练后对模型进行偏差和可解释性分析,并及时发现模型中的问题。在部署生产阶段,它能够持续验证模型偏差和数据特征的相关性,从而帮助企业在进一步的模型训练中提高精确度。不仅如此,考虑到如今机器学习早已成为一种极为消耗资源的计算项目,为了帮助开发者更好地识别计算瓶颈,最大化性能利用,AWS今天还为SageMaker Debugger调试器新增了Deep Profiling深入分析功能。它能够以直观的图形界面显示当前各种计算资源的占用情况,并给出如何进行优化的建议。这样一来,开发者就能及时调整算力分布或训练计划,从而缩短训练时间,并进一步提升整体效益。事实上说到机器学习的效益,可以说正是AWS这些年一直在努力,且始终引领行业标准的骄傲所在。一方面,AWS目前已经拥有了包括Intel、AMD、ARM三种不同计算架构的云计算能力,并提供包括CPU与GPU在内的多种机器学习加速方案;另一方面,得益于刚刚发布的,由AWS自主设计的AWS Trainium机器学习处理器,云端机器学习的处理效能得以进一步提高。事实上在几乎所有主流的机器学习模型里,如今AWS都已经可以带来比过去快得多的训练速度,从而有效提高开发者的效益。
有意思的是,在AWS看来,如果一个企业内部仅有少数几名员工掌握了运用机器学习技术的能力,那么其实并不是一种好的现象。一方面这是因为机器学习本身就需要大量的数据、反复的训练和迭代才能更加准确、更为好用;另一方面来说,缺乏交流的业务进行方式,也很容易让相关员工陷入消极和被动之中,从而影响到最终的产品品质。那么,解决问题的办法是让大家都去学习AI和机器学习相关的编程知识吗?这不失为一种解决办法,但现在AWS有了更好的主意。因为他们开发出了面向数据库管理员、数据分析师的全新“黑科技”,让这些人无需相关知识背景也能用好机器学习。这就是Amazon SageMaker Autopilot,正如它的名称(Autopilot直译就是自动导航)所示的那样,这是一种让ML开发者可以完全抛弃相关编程知识,只需输入原始数据就能在几分钟内得到可用机器学习模型的自动生成技术。在这个过程中,AWS会自动完成数据分析、特征提取、模型训练,以及模型分析,并最终按照性能高低给出数个现成可用的机器学习模型,且立刻就能投入实际生产。不仅如此,AWS现在还拥有了包括Amazon Aurora ML、Amazon Athena ML、Amzon Redshift ML等一系列深植于数据库产品中的机器学习服务。通过这些服务,数据库操作员仅需要使用他们熟悉的SQL工具,就能完成对数据库内数据的自动筛选、训练、构建起可供预测、查询和自动生成数据报告的机器学习模型。
可能有的朋友会说,我们公司实在太缺机器学习的开发人员,也不知道机器学习到底对于传统制造业到底能起到怎样的帮助。就算这样,AWS也能帮到我吗?答案是肯定的,因为就在前几天,AWS刚刚发布了针对工业生产线的多项机器学习服务。它们包括自动检测异常设备状况的Amazon Monitron、能配合设备传感器进行自动预测性设备维护的Amazon Lookout for Equipment、能通过工业摄像头改善质量控制或者保护员工安全的AWS Panorama Appliance、能为摄像设备添加计算视觉处理能力的AWS Panorama软件开发套件(SDK),以及可以通过分析生产线监控视频、自动发现产品制造缺陷或者生产流程异常状况的Amazon Lookout for Vision。举例而言,铅笔制造业无疑是一个历史悠久、自动化程度也非常高的产业。在传统的铅笔制造生产线上,为了监控生产设备的工作是否正常,一台机器可能要被安装几十个传感器,它们有的测量转速、有的测量压力、有的测量温度、有的测量颜料的余量……然而这样一来,设备管理员需要一次同时监控许许多多的传感器数据,工作量极大。并且另一方面,当设备出现一些故障(比如说可能被意外卡住)的时候,这些数量众多的传感器其实未必能够直接指出问题所在,实际上还会给检修增添麻烦。相比之下,AWS的解决之道就智能多了。首先他们发布了应用机器学习技术的Monitron传感器和网关产品,这些传感器只需要监测设备的温度和振动两项指标,就能够在它们出现细微故障征兆的时候自动发出警报,大幅降低了设备管理员的工作量。其次通过只有一个鞋盒大小的AWS Panorama Appliance设备,传统的工业摄像机就能摇身一变成为机器学习质量检测摄像头,它可以精确地“看出”生产线上的铅笔是否削切正确,上色是否均匀,从而在设备出现故障、产品出现瑕疵时迅速提醒相关人员,避免造成更大的损失。除了工业生产外,AWS如今的机器学习技术也已经被全球大量头部健康关怀和生命科学企业所采用。在积累了足够的技术经验后,AWS也于今天正式发布了全新的Amazon HealthLake服务。它能够提供PB级别健康数据和生命科学研究结果的云端存储、分析、机器学习推测服务,从而帮助医疗机构更好地追踪病例、更好地判断病灶、帮助药品研发机构准确预测疾病趋势,或是通过机器学习模型加速新药研发。相比过去所采用的企业自有计算资源,不断升级的AWS通过强大的算力、先进的算法,以及低成本的存储空间,有效降低了健康产业的运营成本,加速了新服务及新药品的落地,更使得“终身健康关怀”成为了唾手可得的事实。
为什么我们需要机器学习?在AWS看来,能够“温故以知新”,从过去的数据中找出未来趋势的机器学习技术,是当今所有的企业适应剧变中的世界,提高自身运行效率和竞争力的最有力方法之一。迄今为止,全球已经有超过十万家客户选择了AWS开展他们的机器学习项目,截至目前为止,在全球已经“上云”的TensorFlow和PyTorch算法机器学习项目中,AWS作为运行平台的比例已经分别达到了92%和91%。而在我们所熟知的企业当中,包括达美乐披萨、罗氏制药、拜耳制药、宝马、耐克,以及F1的诸多巨头也早已投入到AWS云端机器学习的怀抱中。不过在AWS看来,仅仅只有大企业、仅仅只有少数技术精英享受AWS机器学习的好处,还是远远不够的。因为只有让更多人都掌握机器学习的能力,它才能更好地服务于我们生活的每个方面,并造福于我们每个人。这也就是为何AWS会在今天的发布会最后,大力强调机器学习教育重要性的原因,毕竟AI的时代已经到来,而我们每一个人都不应该被这个时代抛弃。
对于苹果昨晚刚刚上架的AirPods Max,或许“智能”才是它的主打方向。
如今突然爆红的社区团购,真能成为下一个热门赛道吗?