chinavideoonline.com
中国视频在线(www.chinavideoonline.com)致力于收集各种流媒体相关的技术资料,以及流媒体常识和应用方案,力求为广大朋友了解学习和使用流媒体技术提供帮助

MPEG端到端

作者/来源:未知
MPEG已经成为视频技术最被人误会的一面。如果我不得不用一句话来描述MPEG是做什么的,我通常说,它是复合视频的一个现代的替代品。

两者都接受送往编码器的分量输入,编码器必须产生一个标准化的信号,令兼容的解码器能懂得它。两者都是压缩技术,跟输入之和相比,需要较少的通道带宽。两者解码的信号与原始信号相比,都有损,所以两者都可能产生压缩失真。两者都有长的时间序列,这是在编辑和切换时需要注意的:在复合信号时是彩色成帧序列,对MPEG而言是一个图像组(Group of Picture,GOP)。

大多数MPEG版本都令垂直和水平色度取样率相同,因为这是最有效的方法。因而色度的取样在竖直和水平方面都相当于亮度的两倍。这把演播室制作的视频信号(过度的)垂直带宽减少了一半。对模拟来说有一个对应的,就是PAL和SECAM两者都执行2:1的垂直滤波。在PAL的情况下,行平均摆脱了传送的相位误差,而在SECAM里,它把彩色分量在交替的行里独立地传送。

只要是用在信号传送系统里,在复合信号或者MPEG里色度的降取样在本质上是看不出来的。不过若是在一个制作系统里多级串接,它就引起多代损失。

复合视频的编码器相对比较简单,但精密的解码过程很复杂。因而复合视频是一个不对称的过程,意味着在信道的每一端的复杂性是不相等的。图2表明,MPEG也是有意地不对称,编码器复杂而且需要大量的算法(因此很贵),而解码器已定型了,简单地做比特流告诉它要做的事。对于点对多点的应用,例如广播和DVD,这非常理想,这里昂贵的编码器数量小而关系不大,而从大量廉价的解码器得到节约。这是MPEG得分高于复合视频的地方,它的不对称方式占了优势。

在编码器和解码器都必需的录像机里,不对称就没有优点了。事实上,当和对称系统相比较的时候,不对称可能就成了一个弱点。在一个对称系统,同样的线路可以重新配置使之成为一台编码器或者一台解码器。这对ENG非常有用。

留意一下音频的情况,世界上销量最好的录音压缩系统——Dolby降噪系统是对称的,同样的硬件能在编码和解码之间转换。在EBU/SMPTE工作小组进行的测试里,对称的DVC和D-9编解码器的性能优于所测试的不对称MPEG编解码器。

当要比较它在哪里顺利工作和在哪里不顺利的时候,MPEG和复合视频之间极为相似。在将后期制作好的材料分配给观众(现在这被称为发射)时,MPEG就开始崭露头角,因为它本来就是为此设计的。观众对编辑或者后期制作的步骤不感兴趣,因此也不受色度降取样或者从播出或DVD来的长GOP序列的影响。

在广播环境下,误码校正部分消除了通讯信道的特征,摆脱了噪声和重影,以极小的压缩失真代替噪声和重影,总体有所改善。在DVD里,编码失真通常很低,以致于和VHS一比较,VHS效果显得很差。

复合视频只有一套标准参数,所以很容易判断一个信号是否符合PAL标准,它们的性能都一样。与此相反,MPEG更像是一个压缩工具箱,在这里用户可以选择使用哪件工具。可怜的解码器必须能够用任何工具处理信号。

为使解码器可以在一定的复杂性范围内起作用,这些工具被安排在逐步复杂的“级别”里。一台给定级别的解码器可能懂得自己级别及其下面所用的所有压缩工具,但它将不懂得较高级别的工具。

因为有这种使用编码工具的自由,所以很难说将会得到什么性能。一般来说,能使用的工具越多,编码器对特殊类型输入的适应就越好,但也更复杂并引起更大的延时(滞后)。

在MPEG里有两种基本的工具:空间编码和时间编码。空间编码在一幅单个的画面之内工作,而时间编码在画面之间工作。MPEG的时间编码功能很强大,因为支持双向编码,即未来画面的数据和过去画面的数据都能用在解码器里,创造当前的画面。不幸的是,如果将MPEG里的时间工具的全部功能发挥出来就会给制作带来严重问题,因为在比特流领域里是不可能编辑的,而通过解码/编码进行编辑又会造成严重的多代损失。

在MPEG性能上,如果不让用时间编码,只容许有空间编码,结果就是只有I帧的编码。对同样的质量,比起双向编码,比特率的需求要高出两倍半,这说明MPEG是一种传输技术。

当年,复合视频受欢迎是因为它让彩色图像有黑白一样的带宽。它对于发射也是最佳的,只是当人们试图用它去制作的时候才出现问题,即彩色成帧和多代损失的问题。制作界的回应是,对制作的目的,转移到分量上工作:最初是模拟分量,然后是数字分量;留下复合视频做它善于做的事。

现在制作业有了无损耗的数字分量系统,它提供完全的垂直和水平编辑自由度,为什么世界上还有人需要回到复合视频上去?那正好也是用MPEG来进行制作时发生的情况。

支持在整个制作过程都停留在MPEG领域里听来似乎有些道理,这也是为什么它引起这么多注意。不幸的是,当真正实践时,它只是一个神话。

典型的信号链路。一台获取MPEG信号的VTR向一个MPEG磁盘制作系统发送信号,而制作系统又向一个MPEG传输(DVB)系统传送。这样我们就停留在MPEG领域,一切都很好。

但是稍等一下。发射标准要求降取样的色度和长GOP,以便用低比特率来广播,而制作过程需要只有I帧编码和完全的色度数据。获取信号的VTR可能用短的GOP。因而,虽然这些格式全部都符合MPEG规格,但它们是互相不兼容的,需要转码。每次转码都必然造成多代损失。

认为“呆在MPEG领域里”就没问题,这就像以为因为“呆在复合视频领域里”就可以用NTSC获取,用PAL制作,用SECAM播出一样。

解码再编码造成多代损失,这正是有损压缩的基本后果。可以认为这是把模拟的特性又运用到数字上。转码过程造成的损失更大,因为在输出码流里的图像和输入可能是不同类型的。当在各代之间进行处理的时候,损失甚至更大。

在制作过程中不会发生为了再编码而对一个压缩比特流解码的事,因此在这时多代损失并不成问题。真正要紧的是,当比特流解码,进行制作处理,画面被再编码的时候会发生什么。

在电视广播的情况下,有时需要把本地(节目)插入到MPEG的比特流里。这里,需要对进入的MPEG解码,好令本地素材淡入,然后再编码。利用边链数据,从输入码流对编码器控制,可以大大减少多代损失。

受控编码器输入的MPEG数据,在穿过期间,结果是几乎透明的。但是在转变期间,控制数据就不再有关了,也不能使用了,因此在转变时期内将有多代损失。对本地的插入,这不是一个问题,但对于严格的制作系统,这种控制不切实际,因为任何画面处理都会令控制数据无效。

在传统上,制作已经用了4:2:2采样,虽然这只是因为隔行扫描(另一个早期而且原始的压缩系统)而必需。MPEG-2支持隔行扫描,但它不像逐行扫描工作得那么好,对同样的质量需要一个较高的比特率。所以对于制作来说,MPEG-2主档次是不能用的,因为它用 4:2:0色度。其后,为制作而设计出一种新的级别——422P没有列在MPEG的级别里。对停留在MPEG领域里的问题就到此为止吧!

422P的问题是,它需要一个较高的比特率,由于有两倍那么多的色度,它一开始就多33%的数据。在一个压缩系统里,一开始就使用更多数据会令事情变得更困难。这就是为什么在EBU/SMPTE工作小组的测试中,SX的性能比不上DVCPRO的原因。

对于4:2:2取样,在大约25Mbps时,实在是没有足够的数据的能力,因此造成比4:1:1更高的多代损失。所以,对于严格的后期制作,25Mbps是不够的。在大约50Mbps的较高比特率,支持4:2:2是容易的,而且是值得的,虽然在同样的比特率下逐行扫描4:2:0效果更好。然而50Mbps只有4:1的压缩系数。

与此同时,存储媒体的性能不断改进。每比特的费用在降低而密度在上升,使得用同样的钱在同样的空间可以贮存进去更多的数据。其结果是,储存技术上只要稍微改进就有可以使用2:1压缩。这已是真正无损编码器做得到的了。

在那之后不久,对于演播室里的SDTV记录,将完全不需要压缩。随着无线电的带宽越来越贵,贮存器每比特的费用越来越便宜,MPEG的未来是在传输里,而不是在记录方面。

关于所有这些,我有一个稍微有点哲学性的问题。MPEG是一个节省比特率,因而节省费用的压缩系统。然而它提高了复杂性。要令一个端到端的MPEG系统正常工作,我们需要预处理器、变码器、边链处理器、可控编码器等等,还有一个危险,我们过去可能夸大了硬件费用的节省。假定我们以不同的方法再做一次所有复杂性的预算,我们有没有可能得到一个更好的结果呢?

我的意见是,MPEG系统并不适合端对端的情况,那会令到处充满了陷井,需要昂贵的盒子去解决问题。对于制作,必须用只有I帧的编码,对称的编解码器能够把MPEG比下去。
发表评论:
昵称 *

邮箱 *

评论* (最长不超过500汉字)