什么是超高清浅压缩？

元宵节将近，意味着“年”就要过完了。趁春晚的余温未过，我们再来回味下支撑这场“文化年夜饭”现场直播的技术：超高清浅压缩。这技术一看就是处理视频的，那么它到底有何神奇之处呢？“超高清”好理解，无非就是说视频画面的清晰度高，分辨率达到4K乃至8K。

那这里的“浅压缩”又是什么意思呢？我们先从视频的一些基础概念说起。

视频的一些基本概念

视频在本质上将一幅一幅独立的画面快速地连续播放，利用眼睛的视觉暂留效应让人产生“动”的感觉。视频中每一幅画面称作一“帧（frame）”，每秒钟播放的画面数量被称作“帧率”，单位为FPS，即Frame Per Second。一般来说，如果眼睛所看到的画面帧率高于每秒约10至12张的时候，就会认为是连贯的。为得到更为细腻的效果，电影制作常用24FPS、25FPS、30FPS等帧率。

更高的帧率，比如60FPS 和 120FPS 用于录制视频以慢动作播放。每一秒都要连续播放这么多画面，视频的大小一般来说都远大于图片，在线流畅播放占用的带宽也要大得多。如果不做任何处理，理论上要在线播放分辨率为4K，帧率为30FPS的视频，需要占用的带宽接近6Gbps。这简直就是流量饕餮。采用有线还能近距离传输还能扛住，用无线的方式就可太难了，即使强如5G也捉襟见肘。因此，我们需要对视频进行压缩。

视频的深度压缩

为什么视频可以被压缩呢？是因为每一帧的内部，以及多个帧间存在着大量的冗余信息。首先，在每一帧画面内，一幅图像之内相邻像素的颜色相关性很强，纹理大概率是连续变化的，背景还可能有大量重复的颜色。如果采用适当的算法，就可以去除冗余，使数据量得以压缩。然后，在多帧的画面之间，如果没有场景切换，相邻帧之间绝大部分画面是一样的：比如一只蝴蝶在花丛中飞行，多帧画面之间除了蝴蝶的姿态变化，其余都是不变的，数据自然就可以被压缩。

因此，视频的压缩有“帧内预测压缩”和“帧间预测压缩”两种方式，将视频分解为多个像素块，再结合当前帧和前后帧的内容进行压缩。

帧内预测的主要思想是：画面纹理是连续的，存在大量的“空间冗余”，因此可以使用相邻的已解码的像素预测未知像素。实际编码时只需对原始块减去预测块之后剩下的残差块进行操作，这样数据量可以有效减少。

帧间预测的主要思想是：既然相邻帧之间存在极强的相关性，存在大量的“时间冗余”，那么就只要找到当前块在参考帧中的位置，计算对应的位移并得出两帧之间的残差，然后只发送这个数据量很小的残差帧就可以了。

这样一来，压缩算法就把视频内容编码为I帧以及P帧。其中I帧作为关键帧，必须能够完全独立解码，因此只能使用帧内预测；P帧作为预测帧，仅反映上一个I帧变化的部分，既可以使用帧内预测，也可以使用帧间预测，但离开了I帧就无法解码。除了I帧和P帧之外，还有一种B帧（双向帧）。B帧的编解码可同时参考左右的帧，需要传输的数据量更小。

由于视频内容是连续的，往往时域的相关性更大，所以一般而言帧间预测的压缩效率更高，因此P/B帧一般都远小于I帧。这种帧内预测压缩和帧间预测压缩双管齐下的效果非常好，可以在画质基本没有损耗的前提下将原视频压缩得非常小，因此也叫做“深度压缩”。

以目前主流的压缩编码标准H.264 举例，1080P分辨率，60FPS的视频，经过压缩编码，仅需4Mbps的网络带宽，在手机上就有不错体验。

深度压缩的不足

然而，万事万物都有两面性。深度压缩的代价是什么呢？

最容易想到的就是：直播的播放延时。

前面已经说过，P帧和B帧的解码需要依赖其他帧，当终端观看直播时，极有可能接入的时间点是不能独立解码的预测帧，那么播放程序必须要等到关键帧后，才能正常解码播放，这就不可避免地导致了时延。

想象一下，如果两个I帧之间的间隔被设置为2秒，那么如果运气不好，接入直播后就有可能要等2秒后才能看到画面。

上述播放的接入时延其实还算小问题，深度压缩对视频制播的影响才是不可接受的。众所周知，在视频制播时，导播台的作用十分关键。导播台主要作用是将多机位的视频信号整合到一起，根据现场需求，由导播人员进行实时切换。

让我们把视线聚焦到上图的左侧。假设在春晚舞台上，艺术家正引亢高歌，多个机位拍摄不同角度的画面传回导播台进行制播处理，进行切换、分屏、叠加元素等。但由于这些视频流采用了深度压缩，极有可能导播员在将直播画面由机位1切换到机位2时，刚好赶上了不可解码的非关键帧，这下可好，所有观众的屏幕都卡住了。

因此，在这种场景下，使用深度压缩是不合适的。再说了，从机位到导播台的距离一般都不远，用超大带宽的有线传输就行，也不需要节省带宽，自然也没必要那么极致的压缩，采用“浅压缩”技术就够了。

为什么需要浅压缩

所谓浅压缩，其实就是舍弃掉会产生P帧或者B帧的帧间预测编码，全部采用帧内预测编码，这样生成的视频就全部都是I帧，每一帧都可以完全独立解码，虽然视频的数据量大幅增加，但也消除了深度压缩的不足之处。

既然浅压缩技术如此顺理成章，为什么还是在春晚直播时产生了轰动呢？

这是因为5G的引入。

传统的拍摄，要么使用固定拍摄机位，要么使用拖着线缆的可移动拍摄机位。这是因为传输浅压缩视频需要的带宽大，如果压缩率为1/8，每路4K视频也需要1Gbps的带宽，同时时延还要低，普通的无线方式难以满足。但5G可以。5G-A搭建的视频制播专网可实现10Gbps以上的带宽，自然可以实现“5G超高清浅压缩制播”了。由于时延低，无线机位和有线机位所拍摄的画面还可以实现丝滑混切。最后我们来总结一下。

浅压缩的主要用于场景是显示接口和专业的视频制播，信道的带宽非常充裕，要求的是无损的画质和低时延，压缩率一般就是1/8。普通用户一般情况下接触不到浅压缩，因此叫做ToB压缩。深度压缩主要是面向用户的，因此也叫做ToC压缩。视频从导播台制播完成之后，即采用深度压缩之后进行分发，压缩率能达到1/200甚至1/500。这样一来，不但可以最大化节省传输带宽，观众看起来也流畅。

非常感谢能看到最后。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
SA604AD/01,112	1	NXP Semiconductors	SA604A - High performance low power FM IF system SOP 16-Pin		$7.43	查看
SA614AD/01,118	1	NXP Semiconductors	SA614A - Low power FM IF system SOP 16-Pin	ECAD模型下载ECAD模型	$3.47	查看
SI8244BB-D-IS1R	1	Silicon Laboratories Inc	Audio Amplifier, SOIC-16	ECAD模型下载ECAD模型	$4.61	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

SA604AD/01,112

NXP Semiconductors

SA604A - High performance low power FM IF system SOP 16-Pin