越过5G的时代断崖:搜狗分身技术会为IP产业带来什么?
提到IP产业,在最近的第三届中国“网络文学+”大会上,搜狗与新华社新媒体中心、咪咕、掌阅签订的战略合作协议,或许可以给我们一些新的灵感。
AI合成主播意外现身,
音容笑貌是如何被复制的?
在大会现场,开幕仪式上负责暖场播报的主持人不是人类,而是搜狗AI合成主播“雅妮”。雅妮的发言自然流畅,让现场来宾感到十分惊艳。在雅妮背后,则是搜狗的分身技术。
对于分身技术我们并不陌生,在去年的世界互联网大会上,搜狗已经展示过同新华社合作开发的全球第一个全仿真智能合成主播。只要输入一句既有的新闻文本,屏幕上的新华社新闻主播就会进行播报,这些AI主播不仅声音惟妙惟肖,连唇形、面部表情也能完全吻合。
简单来说,分身技术就是通过对视频内容中人类五官、嘴唇动作的捕捉学习,用来模拟出对象的样貌。再提取声音中音色、语气等等特征,通过语音生成复制对象的声音。如此以来就能模仿真人的音容笑貌,将一个人复制出无数“虚拟分身”。
除了新闻主播这个落地案例以外,今年六月,搜狗还推出了全球首个“AI虚拟法官”,实时在线为用户提供“智能导诉”服务,引导用户更流畅地使用网络诉讼平台。
那么IP产业会是适合分身技术的舞台吗?
5G彼岸的一步之遥
随着5G带来的网速提升和一直以来的流量资费下降,视频内容的消费频率正在不断攀升,B站、抖音、快手的火热证明了这一点。
这对于掌阅这样的IP聚集方和咪咕这样的影游音内容渠道方来说,都是值得把握的好机会。
可现实情况距离5G带来的IP产业繁荣彼岸,还间隔着一道断崖,断崖的距离不大,可下面却是万丈深渊。
第一, 视频内容制作困难、新品研发困难
虽然流量资费下降和资本注入一定程度上增强了视频产业的活力,但视频内容的制作仍然是个大问题。在B站一些Vlog博主的揭秘视频中我们可以看到,看似简单的一段视频,不仅需要昂贵的拍摄设备还需要复杂的剪辑过程。尤其对于一些明星艺人来说,就算不在意拍摄成本,他们自己的时间是有限的。这些问题都在限制着视频内容的生产效率。而当内容制作效率无法提升时,人们也很难进行一些实验化的尝试,无法向IP新物种迈出关键的第一步。
第二, 流程打通困难
一款IP从诞生到影视化、游戏化再到登陆发行渠道,其中的流程和层层环节是非常复杂的。尤其网文写作,影视制作等等产业又相对传统,他们对于新技术的接受并没有那么快。如果迟迟不能引入技术提高效率,显然是无法赶上5G带来的东风的。
因此想要获得机遇,首先就要越过断崖。
打通IP产业链条:
分身技术如何成为越过断崖的关键?
搜狗同掌阅、咪咕的合作,或许就是合力越过断崖的方法之一。
首先搜狗分身技术为IP产业带来的,是批量生产内容的可能。只需要足够的视频和音频资源,就能脱离真人表演制作视频内容。无需扛着摄像机实地拍摄,通过几行算法就能自动生成内容。
从文字到有声书/有声新闻,再到声形并茂短片或主播播报,这些以往需要复杂拍摄过程的内容,只需要计算就能诞生。
如此以来,IP产业在内容丰富程度上会大大增强——不仅是内容数量,也包括内容的形式:
第一, 是对新鲜类型的尝试
当人们可以以更低成本制造内容时,必然会出现更多样内容形式的尝试。例如当掌阅上某一武侠IP非常红火时,搜狗分身技术可以通过对说书大家的音容笑貌进行模拟,将小说变成说书视频。
第二, 是用户选择的自主化
在过去的内容生产逻辑中,我们完全看不到同一IP在同一时间段被制作成不同演员表演的内容。在正常的商业逻辑中,这样的成本显然是无法承受的。实际对于用户来说,这样的商业逻辑限制了他们的选择权。虚拟分身技术降低内容生成成本后,也意味着用户对于内容的选择参与大大增强。同样一段影片,完全可以根据用户自己的喜好来进行AI“换脸”和“换声”,让用户看到自己喜欢的艺人。
可见对于IP产业来说,虚拟分身的应用不仅从产业角度进行涡轮增压,加强运行效率,也在通过提供更丰富自主的选择来提升用户的消费兴趣。产业端和消费端的共同加持,正在帮助IP产业越过5G的时代断崖。
结束语
搜狗分身技术之于IP产业,展示出了这项技术极为广泛的适用性。实际上除了娱乐业和传媒业,我们还能找到很多分身技术的生长空间。
例如在教育行业中,可以通过采集教师的图像信息,建立虚拟分身为每个学生提供一对一的视频教学;医疗行业中,结合医疗知识图谱可以为用户打造可供咨询的“虚拟医生”;在智能助手领域,冷冰冰的“Siri”可以变成用户喜欢的明星形象……
其实虚拟分身是一层盔甲,可以将很多与人类交互的AI技术武装起来,让他们更接近我们所熟悉的样子。有了这一层盔甲,AI也将更好地融入人类的生活。