比世界主流标准还厉害的视频压缩算法,让字节跳动做出来了
在视频技术界的权威官网 JVET 上显示,字节跳动(Bytedance)在美国的研发团队发起了一项新的视频压缩技术提案,命名为 DAM(Deep-filtering with Adaptive Model-selection)。相比与国际上通用的 H.266/VVC 最新标准,DAM 能够为视频编码性能带来显著提升。这是现在已发布的视频压缩算法中单个的智能性能增益最佳的产品。
目前主流的视频压缩算法是H.264 ,但这个标准并不是最新的最高效的版本,更高效的是H.265/HEVC ,在同等视频质量下,H.265/HEVC 标准可以让视频体积减小一半。但是现在H.265 尚未完全普及,未能普及的原因也是很令人遗憾。一方面,H.265 的专利授权费相当的高,高昂的专利授权费用导致生产硬件设备和生产内容的厂商无法承担,结果是大部分的用户也买不到支持 H.265 标准的设备;另一方面,H.265 的专利收费很复杂,想要使用 H.265 得分别多次缴专利费。结果都是专利的问题,使得种优秀的压缩技术没有办法普及开来。因此,目前最常见的还是 18 年前的 H.264 标准。
而这次字节跳动的新的视频压缩算法比起上的新一代标准 H.266/VVC 又让视频又减小一半。这个算法的对于拥有 抖音、今日头条 这种大型流视频传输的公司来说十分的重要。视频的压缩算法是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送尽可能高质量的视频数据,这样子我们作为用户也可以以更小的流量损耗,并且以更快的速度浏览高清视频。
这项技术名为 DAM,是通过深度学习来构建减少视频压缩时的失真模型,从而做到优秀的视频压缩编码的。原理是通过AI的技术来学习,是基于残差单元堆叠的深度卷积神经网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。这种AI训练的模式需要的东西正好就是海量的视频素材,而字节跳动就不缺这东西。该技术由字节跳动先进视频团队(AVG) 的美国加州研发团队实现,成员来自高通、英特尔、微软等巨头以及海内外多家顶级院校。
字节跳动先进视频团队(AVG)的这项视频编码技术创新,可以让视频的数据体积相比 H.266 最新国际标准再缩小 13%,性能的表现非常的优秀。如果能够普及的话,就是双方的益处,对视频提供商来说,存储和带宽成本将降低很多;对于我们来说,在人很多的地方也可以流畅地刷抖音,追剧了。
尽管新技术的普及之路一直很漫长,字节跳动 AVG 的技术探索并不会停止,这种激素的发展就算是不能普及开来,也可以作为自己独家的竞争力,在自家的产品上面下放使用。不单单是视频应用,我觉得这种编码技术还可以在云系列的产品上面发力,给以用户在画质和传输速度上面有更大的提升。