中国视频在线(www.chinavideoonline.com)致力于收集各种流媒体相关的技术资料,以及流媒体常识和应用方案,力求为广大朋友了解学习和使用流媒体技术提供帮助
从MPEG1到MPEG2
作者/来源:未知
MPEG是ISO/IEC的联合工作组,英文为Moving Picture Expert Group。80年代末成立,现已完成MPEG-1、MPEG-2、MPEG-4等标准。MPEG起因是过去在视音频和数据方面的标准化工作互相协调不足,而技术发展迅速,尤其是多媒体技术发展,有必要对其信息表达、编码进行统一规范,因此应运而生。MPEG与过去的电信领域和消费电子领域标准化过程在操作上的最大区别是先组织标准化组,再选择技术,即标准在先,产品在后;MPEG的另一个特点是编码端开放,为产品技术发展留出空间,这一点在标准化方面当时是领先的,它更关注数据结构,因此在技术上要求高,标准化难度大。
MPEG的组织由多个工作组构成,甚至于每个部分为一个工作组,活动极频繁。由于技术的多样性和发展的不确定性,MPEG采取了一种以最终结点时间定义的方式进行项目的组织与运行。
1.MPEG-1
MPEG-1的名称为Coding of Moving Pictures and Associated
Audio for Digital Starage Media at up to
about 1.5Mbit/S,即达到1.5Mbps的数字存储媒体所用的运动图像及其相关声音编码。
MPEG-1分五部分,其中系统、图像和声音三部分,93年通过成为标准,第四部分一致性测试95年通过,第五部分软件仿真为技术报告。
第一部分主要规定了基于MPEG-1图像和声音流合成为一个数据流的方案,它包含了多个流的时间信息,以便同步,使之易于存储或传送。
第二部分表达了可用于图像压缩的编码结构和数据格式。可支持625行和525行图像信号压缩至1.5Mbps的流中。选用了一系列的算法以达到高压缩率。首先是选择合适的空间分辨率(即352*288),然后采用基于图像方块的运动补偿算法以消除时间冗余度,运动补偿基于当前帧与过去帧及未来帧信息进行运算,取差后再进行离散余弦变换(DCT)去除空间冗余,再量化。最后将运动矢量和DCT信息结合进行变长编码。
第三部分表达了可用于声音压缩的编码结构和数据格式。可支持32K、44.1K和48KHz的采样频率,它利用人耳听觉的掩蔽效应,(即强单音对其相进频率的掩蔽),对单声道和立体声编码。编码过程为,首先将输入信号分为24个子频带,并做亚米样,同时听觉模型(计算掩蔽模型)创建一个数据集去进行子带参量量化和编码,最后由量化器和编码器完成。
第四部分主要规定了对数据流和解码器与标准1、2、3部分的测试方法。可用于制造商、节目商等。
第五部分严格说不是标准,而是技术报告,它给出了1、2、3部分仿真的全部源代码。
2.MPEG-2
MPEG-2由九部分组成,名为Generic Coding of Moving Pictures and Associated Audio
Information 。主要用于数字电视。由九部分组成,其中前5部分与MPEG-1名称功能相同,其余几部分为扩展。
第一部分系统描述了视音频和数据流的复用,并规定了不同用途节目流结构和传输流结构。
第二部分视频比MPEG-1支持更多的图像格式,直至高清和4:2:2;支持更高的图像码率。并可用于级联编解码,(演播室使用和交换节目用)。
第三部分音频在MPEG-1基础上支持多声道编码,立体声之外的声道编码在相当于MPEG-1的辅助数据段传送,因此向下兼容MPEG-1。
第四、五部分与MPEG-1相同。
第六部分DSMCC,数字存储媒体命令与控制,它规定了一组协议用于控制和操作MPEG-1、2数据流,它可支持单机和网络环境中设备,基本方式利用客户机/服务器模型。
第七部分多路音频,它不限于向下兼容MPEG-1音频,已选定为AAC。
第八部分本预搞10bit量化图像编码,因工业界对此无兴趣,已停止。
第九部分传输流实时接口,主要用于解码器,以适应于所有传
送传输流的网络。
第十部分是DMCC的一致性测试,正在进行中。
3. MPEG-4
MPEG-4主要针对多媒体应用而制定,其音视频等主要内容已在99年确定。具体应用目标为数字电视、交互式图形应用和交互多媒体(如Internet等),主要是在低传送速率下。
MPEG-4引入了媒体对象的概念,建立在面向对象的描述体系上,因此选用了多种图像声音压缩方案,其中包括自然的和人工合成可描述的。
4.MPEG-7
MPEG-7正式名为Multimedia Content Description Interface,目标在于创建一个多媒体内容的描述标准,以支持信息语义的翻译,内容接入和查询等。
5.MPEG-21
MPEG-21是一个多媒体体制标准,其方法是试图从消费者的角度自上而下地建立多媒体体制,目前在需求分析阶段。
MPEG的组织由多个工作组构成,甚至于每个部分为一个工作组,活动极频繁。由于技术的多样性和发展的不确定性,MPEG采取了一种以最终结点时间定义的方式进行项目的组织与运行。
1.MPEG-1
MPEG-1的名称为Coding of Moving Pictures and Associated
Audio for Digital Starage Media at up to
about 1.5Mbit/S,即达到1.5Mbps的数字存储媒体所用的运动图像及其相关声音编码。
MPEG-1分五部分,其中系统、图像和声音三部分,93年通过成为标准,第四部分一致性测试95年通过,第五部分软件仿真为技术报告。
第一部分主要规定了基于MPEG-1图像和声音流合成为一个数据流的方案,它包含了多个流的时间信息,以便同步,使之易于存储或传送。
第二部分表达了可用于图像压缩的编码结构和数据格式。可支持625行和525行图像信号压缩至1.5Mbps的流中。选用了一系列的算法以达到高压缩率。首先是选择合适的空间分辨率(即352*288),然后采用基于图像方块的运动补偿算法以消除时间冗余度,运动补偿基于当前帧与过去帧及未来帧信息进行运算,取差后再进行离散余弦变换(DCT)去除空间冗余,再量化。最后将运动矢量和DCT信息结合进行变长编码。
第三部分表达了可用于声音压缩的编码结构和数据格式。可支持32K、44.1K和48KHz的采样频率,它利用人耳听觉的掩蔽效应,(即强单音对其相进频率的掩蔽),对单声道和立体声编码。编码过程为,首先将输入信号分为24个子频带,并做亚米样,同时听觉模型(计算掩蔽模型)创建一个数据集去进行子带参量量化和编码,最后由量化器和编码器完成。
第四部分主要规定了对数据流和解码器与标准1、2、3部分的测试方法。可用于制造商、节目商等。
第五部分严格说不是标准,而是技术报告,它给出了1、2、3部分仿真的全部源代码。
2.MPEG-2
MPEG-2由九部分组成,名为Generic Coding of Moving Pictures and Associated Audio
Information 。主要用于数字电视。由九部分组成,其中前5部分与MPEG-1名称功能相同,其余几部分为扩展。
第一部分系统描述了视音频和数据流的复用,并规定了不同用途节目流结构和传输流结构。
第二部分视频比MPEG-1支持更多的图像格式,直至高清和4:2:2;支持更高的图像码率。并可用于级联编解码,(演播室使用和交换节目用)。
第三部分音频在MPEG-1基础上支持多声道编码,立体声之外的声道编码在相当于MPEG-1的辅助数据段传送,因此向下兼容MPEG-1。
第四、五部分与MPEG-1相同。
第六部分DSMCC,数字存储媒体命令与控制,它规定了一组协议用于控制和操作MPEG-1、2数据流,它可支持单机和网络环境中设备,基本方式利用客户机/服务器模型。
第七部分多路音频,它不限于向下兼容MPEG-1音频,已选定为AAC。
第八部分本预搞10bit量化图像编码,因工业界对此无兴趣,已停止。
第九部分传输流实时接口,主要用于解码器,以适应于所有传
送传输流的网络。
第十部分是DMCC的一致性测试,正在进行中。
3. MPEG-4
MPEG-4主要针对多媒体应用而制定,其音视频等主要内容已在99年确定。具体应用目标为数字电视、交互式图形应用和交互多媒体(如Internet等),主要是在低传送速率下。
MPEG-4引入了媒体对象的概念,建立在面向对象的描述体系上,因此选用了多种图像声音压缩方案,其中包括自然的和人工合成可描述的。
4.MPEG-7
MPEG-7正式名为Multimedia Content Description Interface,目标在于创建一个多媒体内容的描述标准,以支持信息语义的翻译,内容接入和查询等。
5.MPEG-21
MPEG-21是一个多媒体体制标准,其方法是试图从消费者的角度自上而下地建立多媒体体制,目前在需求分析阶段。
(C) 2004-2006 中国视频在线 技术支持:梦想家网络工作室
