挑演员?选剧本?大数据说了到底算不算
<数据猿导读>
一部电影或一部电视剧,想要获得观众认可,除了拥有高颜值、高演技的演员外,很大程度上依靠的还是编剧精心的剧情设置。7月22日的“影视遇到大数据巅峰思享会”上,关于机器能否读懂并筛选剧本的问题引发了影视圈与数据界的巨大关注。
来源:数据猿 记者:张叶
精彩继续!
一部电影或一部电视剧,想要获得观众认可,除了拥有高颜值、高演技的演员外,很大程度上依靠的还是编剧精心的剧情设置。换言之,剧本始终还是影视剧获得高收视的制胜法宝。
此次分享会上,关于机器能否读懂并筛选剧本的问题引发了影视圈与数据界的巨大关注。
在影视从业者看来,数据参与影视制作与推广的过程,可能更多的是对演员、导演的评估、对观众喜好的统计,以及利用线上线下数据对票房的预判行为。那么利用大数据,究竟能不能让机器对剧本做很好前期筛选呢?我们来听听爱梦娱乐的雷鸣怎么说?
雷鸣 ABD爱梦娱乐CEO
雷鸣:ABD爱梦娱乐是一家研究娱乐媒介的公司。所谓的娱乐媒介,包括明星艺人、院线电影、周播电视剧、网络内容等方面内容。但我不觉得爱梦娱乐就是一家纯粹的大数据公司,因为我们搜集这些数据,主要是研究它们在娱乐市场上可能会导致的结果。
我们在艺人和影视内容方面做了两年多研究,现在整个团队对院线电影和网剧内容有很高的商业敏感度。我们的很多市场分析结果,也跟传统人士看法不一样。
我们发现,所谓公开的数据和我们得到的数据,比如舆情监控,其实并没有真正解决影视制作过程中的很多本质问题。大家用到的一些指数,实际上有很多盲点。另外,在内容模型上,我们觉得剧本类型即市场,市场即观众,也就是说剧本决定了一部片子本质上针对的人群会是哪些,但对一部真正的院线电影而言,在剧本选择阶段会耗费大量精力。
所以我们现在在教机器读剧本,做早期筛查。而且机器不仅要读懂剧本,读完之后还要给出分析结果,比如,这个剧本拍摄完成之后,电影明年上映,那么在不同档期里的票房区间可能会是多少?
这件事听起来匪夷所思。但事实上,从今年1月到3月,我们已经搜集了过去3到5年上映的、有票房结果的、不同类型的大概100部电影,之后将这100部电影剧本作为机器的训练册,最终机器给出的分析结果,与电影实际票房相比,准确率能达到25%。
牟蕾 数据猿创始人(左)
牟蕾:你们具体怎么教机器阅读剧本?电影题材有那么多种,这100多部剧本,你们是按什么原则挑选?
雷鸣:为了让机器理解剧本,我们会让懂剧本的人从内在冲突、外在冲突、主人翁的确立、剧情矛盾性等几个方向“教”机器读剧本。这也是跟电影学院的专业学生在分析剧本时是一样的角度。也就是说,机器在读剧本之前,肯定是人先去打标签。目前我们已经设定了大概22个维度让机器分析。
虽然让机器读懂并筛选剧本是件很难的事情,但在北美,这件事情已经做了至少10年。
另外,挑出的100多部用于训练的剧本,虽然类型很多,但像低成本的悬疑类、惊悚类我们一般不太考虑,这也就一定程度上降低了因类型过多导致的分析难度。
刘鹏 猫眼电影大数据中心高级经理
刘鹏:机器读懂剧本后,如何对电影进行票房预测?你们从哪几个维度进行数据分析?
雷鸣:在我们的数据模型里,电影的类型和剧本决定票房成功的概率是60%。机器在做票房预测的时候,会从三大方面进行分析,这也是我们主要研究的方向。
首先,是演员。在中国院线电影和网络电影市场上,演员是有票房号召力的。当剧本进入拍摄阶段,演员的上一部电影情况对这部电影的口碑和指数是会产生影响的。我们会用数据告诉制片方,这个演员在这种类型下表现的好不好,大家的预期会不会降低。
事实上,从近两年的数据监控上看,明星对院线电影票房影响最大的时间节点是上映首日,到第二天的时候,明星的大牌程度与票房关联度会降到32%左右。
第二,我们经常说到IP,IP对一部院线电影的整个影响其实也只在放映前三天,而且第三天就已经很弱了。
电影《中国合伙人》,因为有新东方这个大IP,又安排在暑期档,可是票房只在5000万左右,原因是中国社会对女性创业这件事情其实并不太关注。事实上,绝大部分国产片都是这样,即使有明星号召力,但票房就是上不去。
我们对2015年上映的每一部电影都用机器做了票房预测。在上映的7到10天内,准确率能达到64%。在这个过程中,购票网站的用户数据、市场数据都会被我们列入参考数据。因为我们自己的数据没那么多,所以也做了大量线下问卷。但如果可以和你们猫眼合作,那么我相信机器对票房预测的准确率还会上一个台阶。
第三,我们还会对观众进行研究。在做票房预测时,我们有16个“票仓人群”分析,基本会知道什么样的电影是什么样的人在看。而且,我们根据城市级别,对观影人群做了六个层次的数据分析,第一层和第二层是尝鲜的人群,他们看完电影之后没什么信息反馈,也没留下什么口碑,如果一部电影的观影情况是这种程度,很可能就会下线。
此外,我们还分析发现,三四线城市的观影人群很容易受题材和线下口碑影响。
吴晓 阿里数娱原创出品总监
吴晓:你们用机器阅读电影剧本并预测票房,那么对网络电影和网剧剧本有数据模型吗?
雷鸣:我们主要研究商业电影。在我看来,网络电影或者网剧首先要解决的不是内容好坏问题,而是要有基本的故事线。
我们都知道,优质的故事内容一定会对整个影视剧制作有帮助。但是反过来,中国真正开发院线电影和电视剧项目的人数远远不足,其中还有一部分人去做网剧,那么,我想这些人制作出来的内容可能并不会太好。
不过,在网络方面,我们今年开始做网络艺人的数据分析和融合。各种网红数据投放到模型上,得到的结果非常有意思。因为网剧和电影不一样,虽然受众范围小,但网剧明星的作用比院线电影明星大的多,而且在品牌端,哪些产品植入到哪类网剧中效果会更好,这也是机器特别难理解的事情。所以目前机器在这方面也只是尝试做分析。
刘倍贝 爱奇艺自制剧中心资深制片人
刘倍贝:我再来补充一点,网剧的观众主要以年轻人为主。所以网剧更注重标题入口,也许一张海报就能体现它的营销思路,看出来是不是具有吸引力。而且网剧的制作前期,会用很长时间做营销铺垫,即使热搜的关键词不那么清晰、明确,也可以通过前期宣传片、概念片,包括核心宣传的价值点,逐步吸引观众来看。所以从这些角度看,我觉得机器更适合分析网剧。
雷鸣:我们也发现了这个问题。事实上,对机器来讲,网剧的题材、片名,都更容易作为流量入口。我们希望通过数据挖掘,能知道每一种垂直人群他们感兴趣的点是什么,什么样的题材和标签是具有吸引性的,这样就能更好的让机器分析。总之,我们想利用机器解决中国影视制作行业内容方面的问题。
而通过这几年的研究我们发现,大数据实际上解决了影视制作的三大问题。第一,项目开发,也就是剧本选择问题,这也是中国院线电影的制作瓶颈;第二,艺人问题。我们经常见到,在影视立项过程中,挑选了很久的演员结果要么因为档期来不了,要么就是来了之后发现角色根本不合适,所以分析演员是很有必要的;第三,优质项目和优质资源的匹配问题。
The end
后记:
人工智能是大数据技术发展的未来,试想阿尔法狗都战胜了李世石,机器读懂剧本又有什么不可能?
虽然我们此次的巅峰思享会已经结束,但行业内对影视大数据的研究与探讨还远没有结束。无论什么样的研究,大家的目标都是一致的,那就是为观众提供更娱乐化、更个性化的内容,真正将中国电影电视剧打造成能满足观众需求的优质产品。
大数据已经慢慢渗透到各行各业,距离我们的生活已经不再是咫尺天涯,以后数据猿还会与更多行业的人士一起探讨大数据的应用与发展方向。敬请期待吧!
精彩回顾:
【多图】数据猿走进凤凰卫视北京总部:坐卧在朝阳公园的“灵魂壳体”