微软(中国)CTO韦青:很多人把AI简单理解成能代替人,这是很片面的

凤凰网财经讯(记者 鲁婧涵)3月20日,以“迈上现代化新征程的中国”为主题的“中国发展高层论坛2021年会”在北京线上线下同步举行。凤凰网财经全程报道。

当数字化浪潮来袭,数字技术的大规模应用成为备受瞩目的话题。大数据的发展更是一度让AI(人工智能)技术重回浪潮之巅。但在技术落地的探索过程中,人们开始发现AI现阶段的局限性。同时,当数字化技术开始遍布人们生活的每一个角落,大众对个人数据隐私的保护意识开始觉醒。

经过数年的应用,AI究竟渗透到我们生活的哪些方面?AI产业化的发展面临哪些困境?企业在收集数据的过程中如何才能安全合理?带着这些问题,凤凰网财经记者在中国发展高层论坛上专访了微软(中国)首席技术官韦青。

韦青指出,目前机器学习能力在人类社会中应用的深度极其广泛,无论是在国计民生,还是在制造、教育、医疗领域,都在海量运用机器学习能力。

但仍有隐忧。“现阶段仍然存在的一个问题是,大家对于机器和人的能力,以及二者的分别,还缺少足够的、清晰的理解。这导致有时人做了机器最擅长的事,或又误判了让机器做了人应该做的事,结果两边做的都不好,就产生很多伦理、道德、法律、规章制度的问题。”韦青说。

对于数据的安全问题,韦青认为,公司或政府对于大数据的使用需要有一个大家公认的规章制度,需要建立在信任的基础上,“一旦信任被打破了,这一切的一切都不会存在了”。

微软(中国)首席技术官韦青

以下为凤凰网财经访谈全文:

凤凰网财经:近几年市场关于AI技术应用的讨论十分火热,但随着时间的推移,质疑声也越来越大。目前AI技术的大规模应用的主要聚集在语音识别和图像识别领域,您认为,AI在哪些其他的场景也有大规模应用的潜力?

韦青:在我们看来,现在市场上对于机器的能力有一些误解。大家常常把机器的这种能力称为AI,也就是人工智能,这很容易引申理解成是一种与人类相关的智能。人有什么能力呢?人从感知能力来讲有眼、耳、鼻、舌、身的能力,从认知和意识的能力而言有思考、判断、推理的能力。

但是现阶段机器能够实现的是机器学习的能力,我们称之为machine learning,这种能力与人类的智能没什么关系。机器学习的本质是通过计算而对大量数据产生模式识别的能力。从这个维度来看,机器对于海量数据里潜在的洞察与模式识别的工作已经无处不在了。表面上看,大家常见的是机器会识别人脸、辨别语音、实现翻译,但实际上,机器的这种学习能力早已大量被用于业务流程的优化、财务报表的分析和任何由数据产生的可预测性风险或机会的评估与判断。目前,机器学习能力在人类社会中应用的极其广泛,在与国计民生相关的各行各业都在海量运用机器学习能力减轻人类负担,提高社会效率。

凤凰网财经:目前人们对机器学习领域的研究处于什么阶段?人工的干预在机器学习的过程中扮演了什么样的角色?

韦青:目前,我们还处于人类利用新型的机器学习能力的很早期的阶段,有很多的类别。有一部分研究是如何实现机器自己主动的学习,也就是常说的非监督学习。但要注意它的元模型一定是人给的。所以当有人说机器能完全自主的学习,这从逻辑上来讲是不存在的。

凤凰网财经:能不能请您举例说明,在产业化方面AI目前有哪些应用?

韦青:人们工作生活中的很多流程都可以被自动化。所有可以被识别的模式,理论上都可以由机器来执行,从而解脱人类重复性工作的负担。

目前AI的应用场景已经深入到人类工作与生活的方方面面,分类的方法也是多种多样。我有时会在介绍AI应用时把它们大致分成两类,一类是模拟人类感知能力的应用,比如与图像和语音识别相关的应用,好像人脸识别,医疗影像识别——看片子、看核磁共振等。但这里有一个很有趣的关注点,很多人把AI理解成能代替人,这是很片面的,也是很危险的。以医疗影像应用为例,我跟很多医生的交流中发现,他们在实操过程中,是让机器帮助他们做一些繁复的筛选工作,但最终的判断是留给人来完成的。

另一类应用是从人类不习惯或不擅长处理的信息中提取洞察,比如海量的财务数据、金融交易等等。现在机器的能力已经被广泛应用在各个公司来识别报表是不是有误差,是不是有错误的行为,但最终还是由人来做最后的抉择。

凤凰网财经:机器的归机器,人的归人。

韦青:没错。千万不要误解说机器现在能代替人。我们看到的现在很大的隐忧是大家对于机器和人的能力,以及二者的分别,还缺少足够的、清晰的理解。这导致有时人做了机器最擅长的事,或又误判了让机器做了人应该做的事,结果两边做的都不好,就产生很多伦理、道德、法律、规章制度的问题。实际上就让机器做机器的事,人做人的事,前途是非常光明的。

凤凰网财经:目前AI产业化方面还面临哪些困境?

韦青:这需要辩证分析,一方面以机器学习为代表的人工智能应用在飞速发展,另一方面大众对于机器与人的能力互补性还有很多误解。

人工智能和机器学习产业化面临的困境可以分两点。一是理解上的误区。如果仅仅将人工智能理解为所谓的像人一样来思考、来行动,这在很大程度上会受制于我们对人自身的有限理解。我们经常开玩笑讲说婴儿刚出生,没有经过任何学习就可以知道吃奶,能够哭闹,这个还没有人知道原因,就是“元始”(Meta)的问题,包括人类的神经活动、思考活动和计算活动及其成因。而现在人工智能的能力主要表现为机器学习的能力,从这个角度来看,现在业界的主要实践体现为如何让机器的学习能力尽快落地应用。

而在机器学习落地应用过程中,则面临缺少行业相关数据和领域知识的问题。因为机器学习主要是基于数据,通过数据计算产生模式识别能力,进而产生基于数据的洞察力,在具体应用过程中还需要与行业相关的领域知识相配合。目前虽然通用的计算机图形与语音技术已经比较成熟,但是具体到每一个行业,我们缺的是与行业特点相关的数据和领域知识,两者结合才能产生减轻人类负担和满足行业需求的机器学习能力。

凤凰网财经:正如您说的,现在AI的发展存在数据不足的问题。连微软这种大公司都存在这个问题,AI创业公司面临的这个问题更严重。有没有什么方法可以帮助解决这个问题,或者说现在大家在想一个什么方法来解决这个问题?

韦青:一个核心办法就是谋求AI能力的落地。真正把精力放在AI应用落地的人还是太少,落地就是解决人类工作与生活中的具体痛点。技术再重要也必须是痛点驱动,是问题驱动,而不是技术驱动。如果走到这一步的话,整个社会的关注度自然就会放在数据上。

无论是大公司小公司,如果你真是抱着一个痛点驱动的态度,你就会发现没有数据其实是一个伪命题。为什么?因为痛点背后必然代表着一种问题,而为了借助机器的能力解决这种问题,大家的第一个任务就是要去收集这个问题所表现的数据和尝试建立相应的数学模型,在解决问题的过程中就会发现数据不够,或者行业知识不够,然后自然要在数据上下功夫。现在很多人讲的数据不够,我觉得那是反过来了,是“以果为因”了。数据是“果”,具体需要解决的问题是“因”。没有问题就不会提前考虑数据与行业模型的需求,等到了应用时再发现没有数据就已经迟了。

大家都说数据不够,是什么数据不够?一方面有海量的数据,一方面又觉得数据不够,是为什么呢?就是因为它不是问题驱动的,不是痛点驱动的。明确需求之后,才会知道需要什么样的数据。一定得是先有痛点,再有相应的数据,再产生计算数据后得到的洞察。

凤凰网财经:关于数据收集的问题最近也引发了很大的争议,因为它面临一个数据泄露的问题。如何保证数据收集的安全合理,又能有效满足机器学习对于数据量的要求?

韦青:由于前几年个别宣传上的误导,让很多人误以为数据是免费的,或者说数据是不需要隐私保护的,这是非常严重的认知偏差。

数据是由人产生的,但人又是社会的一分子。在由数据驱动的智能时代,社会的发展需要数据,但人类又有保护隐私的需求。数据的收集与使用是一个平衡的过程,关键是需要达成一个全社会认可的共识。

这是一个很复杂的问题,可以初步先从两个方面起步。一是如微软公司的总裁施博德(Brad Smith)倡议的“数字日内瓦公约(Digital Geneva Convention)”,就是对于数据的使用需要有一个全人类的公认的规章制度、一个标准、一个共识。另一点是被采集数据的人得有知情权和确认/否决权。我作为个人你得告诉我你用了我的数据,然后我告诉你我同意或不同意你用我的数据。

当然,有一些数据可以被认为是公有的,但是这需要之前说的人类社会达成的共识来决定。在具体实施过程中,无论是大公司、小公司,还是国家、社会、个人,都要建立在一个信任的基础上。一旦信任被打破了,这一切的一切都不会存在了。所以微软CEO萨提亚·纳德拉(Satya Nadella)特别强调“信任”。就是你不能骗人家,你一定要告诉人家在干什么,这个是全球面临的巨大挑战。

(0)

相关推荐