在之前的节目中,我跟你探讨过人工智能会如何改变我们的工作这个话题。在那期节目中,我谈到了有些艺术创作类的工作有可能会被人工智能所取代,但我没有展开谈。今天,我想要深挖一下这个话题,我们来谈一谈,未来的人工智能会在多大程度上影响人类的艺术创作。由于艺术创作是一个非常大的门类,有几乎无数种表现形式,我不可能都谈,我今天会聚焦到绘画、音乐和电影这三种艺术形式上,看一看这三个行业中的人工智能正在做些什么,又会如何发展。在谈具体的艺术形式之前,我先跟你讲一小段令我非常感概的历史,你会看到我们的旧有认知是如何被不断颠覆的。在很长一段时间,几乎所有人都非常自信地认为,艺术是人工智能永远也没法学会的东西。因为艺术这个东西,很显然并不是一道计算题。同样的风景,在不同艺术家的眼睛里,完全是不同的画作,即便是同一位艺术家,如果心情不同,也不可能画出同样的画来。艺术作品的好坏,似乎完全只能靠人类的主观直觉来判断,他是纯主观的,无法给出一个精确的定量指标。
人工智能能够处理滤镜、学会修图但是却永远学不会什么是创作。艺术家之所以会创作,是因为他有创作和表达的冲动。人工智能计算能力再强,如果没有这种表达的冲动,它又如何能创作出一幅画来呢?就是因为这些理由,在很长一段时期,绝大多数人都坚定地认为,艺术创作将是人工智能永远无法攻克的堡垒。
但是,就有那么一些数学家和计算机科学家不这么想,他们坚定地认为,凡是人能创造出来的东西,就一定能用算法来模拟。历史一次又一次地证明,计算机科学家总是能给我们带来震撼。例如,我们曾经坚定的认为,下国际象棋是一种艺术,然而在计算机深蓝看来,那只是一道计算题而已。于是,深蓝在国际象棋上战胜了人类。后来,人类又说,围棋才是真正的艺术,人工智能在围棋上将永远无法战胜人类。然而,事实是,在围棋程序阿尔法 Go 看来,围棋也不过就是一道计算题而已,于是,人类又输给了阿尔法 Go。
不管是深蓝还是阿尔法 Go,让他们大显神通的都是“算法”,它不断地把我们认为的“艺术”成功转换成一道道人工智能精通的“计算题”。关于算法,我的感受是,不看不知道,一看吓一跳。第一次让我对算法产生敬畏大约是在四五年前,那是我第一次从一本叫《大数据》中的书中了解了机器翻译算法的进化史。关于机器翻译,最初的时候,人们都认为,如果没办法对自然语言进行理解,就别想搞定“翻译”这个职业。所以,搞机器翻译的公司首先想到的就是要聘请语言学家,人人都认为这是天经地义的。但是,谷歌翻译团队的一句话让我震撼了,大意是这样说的:我们每解聘一位语言学家,翻译的质量就上一个台阶。这完全颠覆了我的固有认知,一个惊人的事实是,做人工智能翻译的顶级团队中不需要语言学家,甚至不需要有人懂外语。
算法工程师的做法是这样的,他们先让人工智能阅读大量的书籍,人工智能虽然不知道书里说了些什么,但是它可以把任意相邻两个词出现的频率统计出来。人工智能看过的书越多,每一个词出现的概率就统计的越准确。一个句子里的所有词出现的概率相乘,就是这个句子可能出现的概率。人工智能会比对一个句子所有可能的翻译方法,然后输出那个最有可能出现的句子。你看,人工智能看不懂书,也能把句子翻译正确,这就是算法的威力。好了,有了上面这些知识的铺垫。现在我再来跟你说,做艺术创作其实跟翻译一样,机器也不需要“懂”绘画,同样可以创作出让人觉得艺术感十足的作品。你大概就不会感到十分吃惊了。那么,计算机科学家到底是怎么解决人工智能绘画问题的呢?在给你揭晓答案前,我们先来看一个新闻。2018 年 10 月 25 日,一幅名叫《爱德蒙·德·贝拉米》的肖像画在佳士得拍卖会上拍出了 43 万 2 千 5 百美元的高价。这幅画上画着一位身穿白衬衫和黑西装的男子,身材略微有些发福,脸上的五官也有些模糊,但是从这幅画的色彩和笔触看起来,这确实就是一幅地道的油画作品。这是一幅完全由人工智能算法生成的画。除了用于人工智能学习的 15000 幅作品是人工挑选的以外,整个作品的创作过程,都没有人的参与。创造这个人工智能的小组成员还把生成这幅肖像画的主要算法当作签名,写在了这幅画的右下角上。
到底是什么样的算法这么厉害,它的原理又是什么呢?说句实话,当我第一次知道了这个算法的原理后,真的有一种“哎呀,真巧妙,我怎么想不到”的感概。这世界上有很多发明都像是一层窗户纸,没有捅破之前觉得很厚,一捅破才发现并不复杂。这个算法的全称叫“生成对抗网络”,简称 GaN。之所以把这个算法叫做生成对抗网络,是因为这个算法真的就是由互相对抗的两部分组成的。这个算法的原始设计者名叫古德费罗,是一名在谷歌工作的算法工程师。
图:GAN 训练算法流程
据说,有一次聚会中,他和朋友多喝了几杯,在聊天的过程中,古德费罗突然提到,如果让两个神经网络互相竞争,会发生什么事呢?有了想法就立即动手。古德费罗设计了两个互相竞争的算法,
而作者不断地从被打的分数中尝试寻找提高分数的改进方向。就这样,在不断地对抗中,作品的分数就会越来越高。“把这些算法用于画画,最初只是源于一个灵机一动的想法。我们现在证明了自己的观点,那就是算法确实是可以模仿人类的创造力的。”你可能还是不能完全理解这个算法的工作原理,我再给你讲的通俗一点。首先,计算机科学家先训练一个评价程序,就是让这个程序尽可能多的读取全世界的各种画,有名画也有小学生画,每一幅画都有一个得分,这个得分不一定是某一个人给出,还可以综合考虑这幅画的知名度、拍卖价格等等。总之,评价程序通过大数据自己找出画的数字特征和分数之间的规律。
然后,机器作者在创作第一幅作品的时候,什么都不管,只不过随机地在画布上画一些线条、色块上去。然后评价者就给它打分,分数当然很低嘛。两个程序就这样,一个作画,一个打分,创作者积累的数据越多,它就会不断地朝得分高的方向自然演化。这个又需要用到遗传算法,很像是绘画的进化论。
实际上,GaN 算法的设计思路非常有价值,用来画画,只是 GaN 算法应用的冰山一角而已。它还可以做更多模仿人类创造力的事情。只是目前来看,人工智能的绘画水平还比较低,离超越人类还有一些距离。从科学原理层面上来看,GaN 算法肯定不是人工智能绘画算法的终点,未来肯定还会有很多更巧妙和新颖的算法被用于人工智能的绘画创作。
不过,从技术飞轮三个条件的角度来看,人工智能的绘画水平可能并不会发展的十分迅速。因为,它没有通过技术飞轮的第二项检测,即有旺盛的市场需求。我实在没想出来,一个能自己作画的人工智能程序能满足人类的哪一个需求,这个需求必须是普遍的、旺盛的,能产生巨大经济效益的。所以,我的预言是,作为一项技术来说,它还是会不断地发展,这些人工智能画家们肯定还会继续发表自己的作品,但在未来的很长一段时间里,它们与千千万万默默无闻的人类画家一样,不会成为艺术巨匠,更不会引领人类的审美潮流。绘画的艺术阵地并没有丢失,这对于从事绘画的艺术家来说,算是一个好消息。但是,接下去我要说的两个艺术创作领域,可就没有那么幸运了。好,讲到这里,我们先放松一下,一起来听一小段音乐。不知道你听起来的感受怎么样,作为一个曾经的古典发烧友,如果让我评价这段音乐,我觉得这是一段水平平庸的古典交响曲,但不难听。但是,当有人告诉我说,这段音乐完全是由算法自己作曲、配器的,我依然震惊了。没想到这个时代已经悄悄来临了,人工智能创做的音乐,已经能与人类作曲家分庭抗礼了。
如果深入思考一下,会发现,音乐首先被人工智能所突破不奇怪。因为音乐比起绘画,有两点明显得弱势。
在人工智能强大的算力面前,音乐这门艺术,早就变成了一道计算题了。大多数人可能都不知道,现在人工智能的作曲水平已经可以和一流的人类作曲家相媲美了。但是很多人不知道这一点的原因,也好理解,就是因为即便我们听到了人工智能创作的音乐作品,你也根本听不出来。或者说,可能你花钱请人创作的音乐,作曲的人其实是在人工智能创作的基础上做了一些改编,但是你又哪里能知道呢?
在一个叫做爱娃的网站上(https://www.aiva.ai),你只需要花 14 到 39 欧元每个月的价格,就可以无限次地请爱娃帮你创作指定风格、指定长度的音乐,想要多少有多少。你前面听到的那段音乐,就是爱娃创作的。说实话,我前不久还花了一笔不小的钱,具体多少就不说了,在某网站上购买一次人工音乐创作服务。这两天因为做这个选题,我看到了爱娃的价格和品质后,我的内心是有点崩溃的。同时,我也为音乐创作这个行业,感到深深的危机。
爱娃背后的技术,叫做多层神经网络强化学习。这种算法的工作模式与作曲家的工作模式很类似。它们先是去分析大量现存的音乐作品,然后尝试将音乐作品进行分类。也就是说,你可以给爱娃听任何音乐,但它自己则在听完之后,自动的把贝多芬和巴赫的曲子分开。然后,爱娃会建立更深层次的模型,来寻找同类乐曲中的艺术规律。“通过多层神经网络强化学习,爱娃已经能够抓出音乐理论的规律,而不仅仅停留在现有音乐作品的分析上。”最重要的是,从技术飞轮的角度来看,人工智能的音乐创作水平用不了多久,一定会对人类的作曲家形成碾压的优势,就好像阿尔法 go 碾压了人类的棋手那样。为什么?因为技术飞轮已经在转动了。科学原理没有瓶颈,巨大的市场需求。要知道每年有多少影视剧、广播剧、舞台剧需要原创音乐,原创音乐的市场是巨大的。本期节目的背景音乐其实全部都是爱娃创作的,你听出来了吗?而且我相信,人工智能还会侵袭歌曲演唱市场。我也实在没找到任何不能用钱解决的阻力。所以,未来,这个市场必然是人工智能的天下,可能用不了 20 年,人类作曲家将会列入非物质文化遗产的保护清单中,就像保护民间艺人一样。说完了作曲,我们再来说说电影剪辑。没人否认,电影是艺术,而电影的好坏,剪辑非常非常重要。有很多优秀的导演,在出道以前,都曾经是优秀的剪辑师。有些风格独特的电影导演,在拍摄期间甚至不提供电影脚本,他们完全凭感觉拍摄素材,然后依靠后期剪辑来完成创作。毫不夸张地说,导演有一半的工作量是铺在了后期剪辑上。
那么,电影剪辑这种又是叙事、又是审美的复杂工作,在人工智能眼里,是不是也会被看作一道数学题呢?从目前的情况看来,是有可能的。
我之所以说很有可能,是因为目前的人工智能还没能独立的完成一部优质电影的剪辑工作。也就是说,
IBM 沃森制作出全球第一部 AI 操刀的电影预告片,当然,这也可以算作电影的宣发方为科幻电影《摩根》做的一次巧妙的营销。
我也看了这部 AI 剪辑的预告片,和同样是这部电影,人工剪辑出的预告片相比,那还是有明显的差距。但这个不重要,谁都知道蹒跚学步的小孩前途不可限量,这也可以看做是人工智能侵袭电影剪辑领域的一次标志性事件。现在,很多短视频 APP 都在努力研发自己的人工智能剪辑技术,对于不需要展现故事情节的宣传型短视频,人工智能独立完成的作品,水平与人工剪辑已经差距不远了。如果大家用苹果手机的话,一定会对相册中的“回忆”功能印象深刻。苹果自动剪辑出来的回忆小视频,在我看来,已经超过了大多数人类剪辑师。但是,电影与音乐的最大差别是,在创作音乐作品时,只要大致的把握一下音乐的风格就可以了,而电影是有故事情节的,在不理解电影故事情节的前提下,想要运用好镜头语言,似乎只用当前已知的算法还不太行。换句话说,人工智能电影剪辑,目前在算法层面上是存在的瓶颈的。视频剪辑行业是一个劳动强度大,同时对个人能力要求很高的行业。所有有这类特征的行业,对人工智能的需求都会非常旺盛。所以,我的观点是,目前人工智能剪辑电影或者电影预告片的技术还在等待算法上的突破,一旦算法有所突破,那么飞轮就一定会飞快地转动起来。又一个职业将不复存在。最后,让我来开点脑洞,用一些科幻的思维来畅想一下有可能在未来 20 年发生的事情,不过,以下纯属畅想,不要太认真。想像一下,就在未来的 5 年后的一个早晨,你打开微信后突然发现,朋友圈被各种各样的音乐分享疯狂刷屏。原来,这是一个名叫人人作曲的 APP 突然走红。
输入你喜欢的乐器
输入你期待的风格
再输入你想表达的情绪
只需要花费几分钟,一首独一无二的音乐作品就这样诞生了。一个全民作曲的时代就这样被开启了。没过多久,更多的作曲类娱乐软件开始崛起,一些软件推出了填词和人声演唱功能。如果你在作曲之前提供了歌词,并且指定好演唱风格,创作好的作品就不再是一首纯音乐作品,而是一首歌曲了。你还可以在线提交自己的声音,那么最终的歌曲,就完全是用你自己的音色演唱的了。
10 年后的某一天,又一幅人工智能创造的画作在拍卖会上卖出了 500 万元的天价。不过,这一次卖出的这幅画并不是一张印刷品,而是一幅货真价实的油画。这幅油画由一个创造画作的人工智能和一台绘画机器人共同完成。人工智能一边创作,机器人一边用真正的画笔在画布上绘画。但这次活动本质上是某一家高科技公司的公关活动,向世人展示他们的技术水平。有一天,你的手环上突然弹出了一则广告。广告让你邀请你的爱人,一起用你们两个人最近一年的心跳、步伐等生理数据打造一件独一无二的情侣项链。你被这项创意深深的打动了,于是果断的点下了邀请按钮。于是你创造了你的第一件私人数码雕塑。
20 年后的某一天,一部名为《我是 AI》的纪录片引起了大众的关注。
这部超长的纪录片从图灵测试开始一直讲到人工智能的艺术创作。最重要的是,人类在这部纪录片中什么都没有做,所有的素材也是 AI 从网上爬来的。这是一部完全由人工智能独立创作的作品。而这部作品讲述的,正是人工智能自己的故事。在未来,科技与艺术之间的界限正在变得模糊不清。为了探索和解释这个世界,人类发明了艺术和科学。它们代表着感性和理性,站在好奇心的左右两边。或许艺术与科学曾经泾渭分明,但它们现在却正以惊人的速度合二为一,把我们引向美好的未来。好,这就是本期的未来科技体验馆,我是汪诘。下周,我就要带你离开地球,飞向浩瀚的太空,让我们一起去看一看太空旅行在多远的未来,会成为我们每一个普通人都可以消费得起的旅游项目。