去高热、解沉疴、建地基，AI与短视频故事才刚刚开始 / 四六文摘

短视频产业虽然红火了几年，却一直被看做一个“没有壁垒”的行业——依靠头部用户出产内容，流量随着MCN机构的迁移而迁移，短视频平台自身缺乏主动权。

实际随着短视频行业竞争越来越激烈，以往短视频巨头的流量正在被“分配”给其他平台，今年年初，Digiday在报道中指出，Facebook上的很多短视频流量已经呈现出腰斩的趋势，而NowThis开始大力制作和推广长视频节目，以暂时避开短视频行业的激烈竞争。

目前在中国，短视频的势头仍然一片大好。根据艾瑞咨询调研报告显示在去年一年中，短视频市场规模达到了57.3亿，到2020年将达到300亿。

可最近腾讯大力推进微视入局，快手、抖音、微视展开“三国杀”战局，同时在2012到2017年间，短视频行业有44.8%的融资都投向平台方。巨头和新贵站上同一起跑线，竞争业态只会愈演愈烈。中国短视频平台能否跳出怪圈，找到自己的壁垒？

我们或许可以在最近图灵大会上，快手展示出的AI技术中寻找答案。

治愈沉疴：

用技术缓解短视频平台的流量焦虑

首先我们可以来看看短视频平台最严重的沉疴——流量焦虑，上文提到，短视频平台的流量往往依靠头部用户生产的内容，而这些头部内容又会被各个平台所争夺。实际上海外老牌短视频平台Vine就是因为网红集体迁移到Instagram上，最终导致流量枯竭，最终被关停。

这也是短视频平台、直播平台都着急打出“社交牌”的原因——在平台为用户提供关系价值，从而更好的维系住流量。

不过从以映客为代表的移动直播平台看来，脱离社交产品本身谈社交，本身就是一件非常困难的事。

但在这次图灵大会快手CEO宿华的演讲中，我们或许可以找到社交元素的新灵感。

山崎正和在《社交的人》里面写到，人的交往对象不仅仅是个人，也包括了自己所在的整个文化世界。也就是说短视频平台与其想方设法让用户与用户之间产生沟通与关系，不如加强用户与文化世界的联系。

而能够创造这一价值的，就是AI技术。

我们可以先反向理解一下，为什么那么多短视频、直播等等平台需要头部用户、需要MCN？最直接的原因是，这些用户和机构可以保证内容的优质性。那么，难道普通用户出产的内容就一定是劣质的、一定是别人不感兴趣的吗？

当然不是这样。只是平台的运营能力有限，无法从数量巨大的普通用户中寻找他们出产的优质内容，维系住少数高产、优产的头部用户，是一种性价比更高的做法。

但通过AI对于用户和内容的双向理解，就可以弥补这方面的不足。

在快手上，大量用户的评论、点赞、关注、转发、播放时长等等行为就是在不断的进行数据标注。建立在用户行为数据之上，结合强大的视频多模态分类、高层语义分割等等技术，就可以细致发掘用户所发布的内容：拍摄的是人物还是美食？展示出的情感倾向是快乐、悲伤或是搞笑。

所以在快手平台上50亿海量视频内容，都能够通过独有的多媒体内容理解算法及平台被AI“看懂”，从而通过内容与用户的匹配度进行分发，并非一味以热度、粉丝数为参照。

通过上述这些注意力分配技术，我们会发现快手相比其他短视频平台，最大的特点就是“没有网红”，更准确的说是，普通用户和网红同样都能获得关注，拥有同样表达自我的权力，利用技术照顾到99%的长尾内容，也就能给予大多数用户被看到的“幸福感”。

这样一来，短视频平台就向用户提供了与整个文化世界交往的价值。这样独特的社交模式可以把用户牢牢吸引在平台上，让他们不会随着头部用户去留，也就缓解了短视频平台的流量焦虑症。

茧房陷阱高烧不退，

AI为短视频平台对症下药

除了流量焦虑症之外，短视频平台目前还面临的一大“症状”就是信息茧房。

在推荐算法几乎已经成为一切内容平台标配的今天，发掘用户的喜好再为他们推荐相应的内容已经成为了一件容易的事。但这样很可能出现两个问题：

1、平台只顾吸引流量为用户推荐吸引眼球的内容（很可能是不当内容），导致用户行为在平台圈定的范围内不断进行反馈，使得信息茧房越来越牢。

2、平台对于用户的理解过于片面和被动，无法获知用户喜好的变化。也许一位用户刚进入平台时喜欢看搞笑内容，可慢慢开始关注烹饪，如果平台没能及时捕捉这一变化，用户自然就会分流到能提供相应内容的平台中去。

这样一来，信息茧房就成为了一个巨大的陷阱，看似给予了用户他们想要的东西，实际上对用户需求的满足是非常片面的。

在这两个问题的解决上，快手首先是通过年龄、性别、地域、手机连接情况等等用户特征来建立包括了用户理解向量、用户兴趣和用户关系的神经网络，结合上文提到的内容理解，在两者之间形成精准的匹配。

同时在内容分发时，快手已经率先实现实时的标值响定——随着用户每一次行为调整信息流推荐内容，这种实时在线学习推荐系统不仅更加精准，也一定程度上避开了信息茧房的现象。平台可以捕捉用户喜好的每一丝变化，通过更新模型来核定甚至促成变化的发生。

例如实时日志系统发现用户为烹饪内容点了个赞，就立刻在下一屏信息流中展示出更多烹饪内容，用户或许就此对烹饪内容生出了兴趣。这样对瞬间想法和行为的捕捉，是传统内容推荐、编辑推荐模式完全无法想象的。

除此之外，协同推荐算法也是一个解决信息茧房的常用方法。除了用户自身的喜好之外，还会基于某一个内容点来研究大量的用户具有哪些共性，找出这种共性，再来用它拓展单个用户的兴趣边界。简单来说，就是AI让成千上万的用户和你一起来探，给予用户一个更广阔的世界。

壁垒的地基：AI与短视频的无限未来

治好了流量依赖症和信息茧房，AI技术就可以成为中国短视频平台的壁垒了吗？

恐怕我们目前还不能下这个定论。AI之于短视频，不仅仅是简单用户理解和内容分发。AI对于影音数据的理解和学习，创造和加工内容的能力，对于情感信号的细致分析，都与短视频产业有着密切的联系。而AI技术能否真正成为中国短视频平台的壁垒，还要看短视频平台能否利用AI技术的未来成长能力。

简单看来，AI技术与短视频未来还有以下几种可能。

1、图像处理技术对短视频制作的加持

我们拍短视频时用到的背景抠图、美颜滤镜等等，都是由AI供能。但AI与短视频制作之间绝对不仅于此。

在去年快手成立的AI技术实验室Y-Lab里，我们可以看到很多关于图像语义分割、AR贴图等等技术的全新进展。比如精准捕捉人体姿态进行进一步的图像处理，通过视觉惯性里程计让AR贴图效果更真实等等。同时Y-Lab还研发出一套可以在不同硬件能力手机上运行的深度学习推理引擎，支持CPU和GPU两种模式，和硬件架构进行了深度优化。

加上移动AI芯片、陀螺仪等等手机硬件能力的不断，未来用手机结合AI拍出电影特效般的短视频并不是幻想。就看谁能将算法和硬件完美结合了。

2、多模态信息融合带来的强理解能力

今天我们仍然在通过图像识别和标签来识别视频中的信息，等随着多模态信息融合能力的加强，我们可以分别通过图像、标签、音频和其他传感器信号来共同识别一个视频中的内容。

宿华在演讲时也提到，多模态信息融合是快手正在关注的一个新兴技术。更强大的感知能力自然可以实现更好的内容理解和分发。比如现在很多配音视频是把悲情画面配上搞笑的对话，以往单纯依靠机器视觉对视频画面进行分析，往往可能产生错误的理解。但如果把NLP对于语音的分析和机器视觉的分析结果融合在一起，或许可以让AI也理解到其中的反差笑点。

3、压缩技术的发展

还记得美剧《硅谷》里贯穿全剧压缩技术吗？实际上随着AI技术的发展，更小的内存占用和更高质量的画面正在成为现实。2016年谷歌就曾经推出过一种用循环神经网络压缩图片的技术，让AI学习人眼对图片的理解模式，忽略掉人眼难以发掘的数据细节。

如果这一技术进入短视频领域，由此带来的带宽成本降低和用户体验提升，很可能成为短视频平台竞争中的重要筹码。

另一方面，对于图像处理算法模型以及计算量的压缩也十分重要。Y-Lab就通过自主研发神经网络架构，在这方面做了大量的工作。更快的处理视频特效、让视频特效可以在所有手机上运行，对于短视频这种下沉比率极高的产品而言至关重要。

总而言之，AI技术刚刚露出了成为短视频平台壁垒的潜质，打下了地基。目前我们看到的技术差距仅仅是个开始，未来在不同短视频平台之间是会相互追赶，或是差距拉大，才是中国短视频平台竞争的好戏。

去高热、解沉疴、建地基，AI与短视频故事才刚刚开始

相关推荐