高保多声道音频技术探秘_深圳市永阜康科技有限公司

当前位置：首页 --> 方案设计

高保多声道音频技术探秘

发布时间：2011/4/25 18:42:00 来源：

在线咨询：

李湘宁 2850985550

鄢先辉 2850985542

姚红霞 3003214837

13713728695

从1958年出现立体声系统时，利用左右声道不同，使得横向声音具备了基本的方向性与空间感，让人类的听觉感受得到大幅的提升，从此之后，不论是电视或者是黑胶片唱盘以及后来的录音带以及CD唱片等等，无不以立体声为主要卖点，迅速普及于消费市场中。

但是立体声环境还是有其极限存在，因为立体声音源的定位与使用者与喇叭之间的相对位置关系甚大，如果使用者稍微偏离了音效预设的平衡点，那么所得到的听觉感受将会大打折扣。因此就有业者提出多声道系统，自1991年起于电影院环境中首先采用，这些多声道系统里，除了基本的左右声道以外，还另外加入了左右环绕声道、中央声道以及1个额外的超重低音声道，藉以营造出更全方位的真实听觉感受。

音效编码技术的演进

■声音的数字化

一般来说，声音是由一连串由震动体及介质的交互作用所产生的波动而来。以我们平时最常遇到的语音为例，人类所具有的声带本身就是一个非常复杂的发声机制，而传递语音所必须要的介质就是存在于我们四周的空气。声带周期性振动造成的长程相关性与音波在声道共振造成的短程相关性，可充分运用于消除语音中所含的多余讯息，因此这也成了后来语音以及相关声音压缩技术的衍生基础。

如果要将声音作为数字录音，我们首先要使用麦克风将空气压力变化转换成电子信号，再经模拟/数字转换成0与1位形态的数据来储存。转换过程有取样、量化、及脉冲编码调变3个步骤。取样是读取声音讯号在相等时间间隔的瞬间值；量化是将各个取样瞬间值的振幅以有限的数值表示；而脉冲编码调变则是将量化后的数值用2进位数的符码表示。

影响数字录音质量的两个主要因素为取样频率与量化过程的分辨率，量化所用的位数目决定其分辨率，而取样率的下限则是该声音所包含最高频率的两倍。例如，电话语音频宽为200?3,200Hz，交响乐的频宽则为40?20,000Hz，因此电话语音与音乐光盘的取样率分别为8,000Hz与44,100Hz。传统的有线电话与音乐光盘都是利用这种脉冲编码调变技术来进行数字化，因此需要极大的储存空间及传输频宽。举例而言，目前音乐光盘所采用的量化分辨率为16位，则其立体双声道的位率为每秒1411200字节（44100*16*2），因此12分钟的音乐大约需要10亿位的储存空间。为了配合HDTV与多媒体通讯发展的需求，各式各样的数字语音与音效编码技术也不断地研发进步中。

■音效编码的实作

音效编码的目的，是为了将声音数据进行压缩，以节省传输时所需的频宽以及在内存中所占的储存空间，同时需保证解碼端在还原后还能听到和原来相差无几的声音。理想的音效编码机制，除了可以利用讯号取样点之间的相关性来移除多余的讯息以外，并且也要能够从声音心理学来加入人耳对于声音感受的影响，从中删除许多不为人耳所辨识的声音信息，藉以在不影响人类听觉感受的前提下，取得更大的压缩比。

■音效编码技术的发展

以目前市场上的音乐储存媒体主流来说，常见的光盘片仍是采用脉冲调变编码的录音格式，虽然音质相当出色，人耳不易分辨出有减损的状况，但是在储存上显得非常没有效率。因此自从1992年起，国际标准组织（ISO）便制订了一系列的影音编码标准，藉以处理相关视讯与音效的编码处理。MPEG-1是第一个针对音效压缩制订的标准，总共可支持3种取样率，而依照其复杂度，共可分为layer 1、layer 2以及layer 3，压缩率分别为4分之1、8分之1以及12分之1。

MPEG-1中的3个layer的转换技术都是以32个次频带的多向滤波器组为其技术基础。相较于layer 1高位率，layer 2采用傅立叶转换来提供较高分辨率的遮蔽临界曲线计算，并且降低相邻数据区域的多于讯息，以达到中低位率应用的需求。而layer 3则是将每个次频带讯号再做修正余弦转换，藉由去除频域系数之间的相关性，来大幅提高压缩率。事实上，MPEG-1 layer 3也是目前最为风行的格式，而以该格式压缩的音乐档案就称为MP3档案，因为此格式的兴起，加上唱片业在营销理念上的故步自封，以及音乐制作质量上的缺乏控管，便理所当然的造成了整个唱片产业的冲击，

MP3（MEPG-1 Layer 3）的兴起虽然带起了风潮，但是基于其编码规则的播放器却是需要支付授权费的，因此也有诸如OGG等格式的兴起，该格式完全开放而且免费，且因为其压缩过程应用了更为高阶的声学模型，压缩质量要比相同位率下的MP3格式来得高。但是MP3流行的早，支持的设备也多，因此OGG只能居于二线。类似状况的还有WMA以及AAC等音效压缩格式，WMA的压缩质量与MP3相差不多，在低位率的表现上比起MP3稍好，但高位率压缩质量却不见得更优秀，因此WMA相当适合用于网络串流传输之用。

至于AAC，则是由Fraunhofer IIS、Dolby、苹果计算机、AT＆T以及SONY等公司联合开发，基于MPEG-2的压缩技术，原本是定位为取代MP3格式之用，作为声音压缩技术，其压缩比高达18：1至20：1，可以说远胜MP3，后期整合MPEG-4标准之后，音质表现更是突出，但是从1997年出现之今，支持的音乐播放设备相当少，除了SONY自家的MP3播放器以外，就以iPod支持的最为完整，其它厂商的支持并不踊跃。而以上介绍的都是属于有损音效压缩格式，意思即是依照其压缩编码规则的不同，都有程度不等的舍弃部分声音细节的情况。

多声道编码技术的现身与发展

目前最为风行的两大多声道编码标准，便是Dolby Digital以及DTS两大阵营，在光学储存媒体迈入蓝光世代之后，两者也都跟随这潮流推出了高音质多声道标准，但是技术的发展有其轨迹，我们就分别针对这两大多声道标准来进行介绍：

■Dolby labs

杜比一开始是以发展声音减噪技术起家的，该技术被称为Dolby NR（noise reduction），可分为Type A/B/C/S这四种，被应用于当时相当普及的录音带以及FM收音设备中，虽然其原理是藉由遮蔽特定的高频以及低频讯号，来降低杂音的音量，以取得较佳的音质表现，但是也因此会损失了不少细节。

图说：杜比多声道音效技术的应用。（资料来源：Dolby labs）

随后杜比也发展出杜比环绕技术（Dolby Surround），这项技术包含了3个声道，分别是2个前置以及1个后方声道，算是多声道的鼻祖。不久杜比环绕技术的延伸规格—杜比专业定向逻辑（Dolby Pro Logic）则扩充为4个声道，分别是前置左右声道、中央声道，以及由2个喇叭共享的后方声道。而在1990年代，该公司正式推出了Dolby Digital 5.1技术，该技术也称为杜比AC-3（Audio code-3），此技术包含了6个声道，包含了前置左右、后方左右、1个中央声道以及1个独立的重低音声道。5.1中的5代表了5个定位声道，.1则是重低音LFE（Low Frequency Effects）声道。

图说：记录在胶卷的杜比声音信息。（资料来源：Dolby labs）

杜比AC-3采用的压缩方式为固定比例（Constant Bit Rate，CBR）的音效压缩，比率约为1：2，换言之，无论声音原先的样本数有多大，压缩比都是维持一定的比例，此种压缩方式有其优缺点，优点是占用的空间可以减少，但缺点是声音质量会随着音量的放大而降低，细微处的减损会相当明显。一般来说，AC-3的声音压缩都是采用18-bit编码，因此AC-3音效的标准输出流量为384kbps（6声道 x 18 x 48KHz），以目前的眼光来看，除了多声道的支持以外，即使是后期可以将流量扩增为640kbps，在音质的表现上，仍可以说比MP3还要不如。杜比AC-3包含了许多延伸的技术，比如说虚拟杜比数位（Virtual Dolby Digital）技术的音效系统。便是利用混音的处理，从前置喇叭发出虚拟的中央声道，后方声道则由使用HRTF算法的处理器仿真出对应的效果，再透过前置喇叭发声。藉此达到以3支喇叭（2个前置声道加上1个重低音声道）虚拟出多声道的听觉感受。不过HRTF技术对于使用者的相对位置非常讲究，如果使用者没有处在最佳的声音位置上，那么多声道的模拟效果就会大打折扣了。

其后也有推出针对更多声道的Dolby Digital Ex技术，最高可支持高达8的声道，包含了7个定位声道以及1个重低音声道。基本上Dolby Digital Ex只是在原有的5.1声道基础上，多加了1到2个声道，藉由不同声道数量的组合，来组成如6.1及7.1声道的声音系统。不过这个技术并不能真正提供超出5.1声道的声音轨道，因此多出来的声道都是计算出来的，无法做到如竞争对手DTS-ES般的真正6.1声道系统。

随着蓝光储存媒体的浮现，杜比也推出了相对应的多声道技术，此技术定名为Dolby Digital Plus，基本上也还是原有AC-3编码的延伸，只不过流量被大幅扩充至6.144Mbps（普通7.1声道约为3Mbps），且支持了高达14个声道（13.1）的系统架设。不过高声道数有其应用限制，目前也见不到其必要性，因此主要推行着力点还是在于其高流量所带来的音质改善。不过杜比也定义了一个新的无损音效多声道标准，此标准命名为Dolby True-HD。

图说：Dolby TrueHD的代表符号。（资料来源：Dolby labs）

Dolby True-HD与Dolby Digital Plus同样可支持到高达13.1的声道输出，不过在编码方式的改进才是其重头戏，由于支持了Meridian Lossless Packing技术（MLP技术，也称为LPCM）。此技术是由Meridian Audio公司所发展，基本上MLP技术并不是什么新玩意，早从标准DVD-Audio音效标准中，便定义了此种压缩格式，许多只提供2声道的高音质DVD影片也都采用此技术进行声音编码，音质表现比起传统的AC-3格式高出不少，且几乎所有的DVD播放装置都支持了MLP格式。

那或许读者会有疑问，为何不在DVD时代就采用此编码技术来推出多声道系统？首先，我们必须要考虑到，标准的DVD传输流量并不高，因此若5.1声道采用此种格式压缩，2声道LPCM流量通常为1.5Mbps，6声道可能要高达4.5Mbps，加上影片本身所需的流量，一般DVD播放装置上可能就无法使用，其次，虽然DVD容量是传统CD的6、7倍以上，但是MPEG-2视讯压缩格式也会用去更大的流量以及储存空间，加上音效所需的储存空间，更是显得捉襟见肘。因此，到蓝光世代才提出无损多声道格式，也是着眼于蓝光规格动辄2、30GB以上的储存容量，在储存空间上较无限制的缘故。

由于Dolby Digital技术出现较早，且被采用为国际标准，因此不论在电影院或者是多媒体激光视盘、电视声音讯号中，都可见到其被大量应用的范例，虽然早期有着音效质量较差的缺点，但是在进入蓝光世代之后，随着蓝光媒体的高储存容量以及HDMI的高流量支持，并藉由改善编码规则达到真正原音重现的能力。

■DTS（Digitial Theater System）

DTS是在1993年1月由DTS公司所开发成功的1种多声道编解碼技术，在当年6月便被大导演史蒂芬史匹伯的经典名片侏罗纪公园所采用，当时藉由此多声道技术所传达出来的声音细节，震撼了无数观影人的耳朵。

DTS与Dolby Digital的技术非常相似，DTS同样也是采用有损压缩的数字编译码技术，将5.1声道压缩成1条数字声音串流，记录到储存媒体上，播放时才由设备进行解压缩，还原为各自独立的5.1（或6.1、7.1）声道音效讯号。

DTS公司推出了多种声场技术，其中DTS Digital Surround是最广为流传的一种，属于5.1声道系统，人们通常说的DTS技术，或者DTS环绕，一般就是指DTS Digital Surround。DTS采用CAC（Coherent Acoustics Coding，相干声学编码）方式工作，和Dolby Digital一样也属于利用心理声学原理来对声轨进行编码的有损数字压缩技术。在电影院中，DTS的音轨录音采取了特殊的声音画面分离的数字立体声，数字音轨烧录在光盘上，由专用的光驱读取，另外在拷贝的模拟音轨与影片画格之间纪录有时间同步码，用来控制光驱播音与画面的同步。

由于DTS讲究音质表现，因此在储存空间上的需求较大，这主要是因为其编码架构的不同，首先，DTS采用24-bit编码，比起AC-3只用18-bit，在动态范围上就广了许多。而取样频率方面也高达96KHz，为AC-3的2倍，不过平均压缩比约为1：3，因此比起AC-3要占用更大的储存空间。而DTS采用的是VBR（Variable bit rate）动态压缩技术，会随着声音数据的多寡来调整压缩比，而这些压缩比介于1：1到1：40之间，已平均数据速率来说，每秒1.5Mbps的传输流量，为一般AC-3编码的3到5倍，因此声音的质量要比AC-3高出不少，不仅是整体音场的动态范围，在高音与低频的量感更是AC-3所不能及的。

不过由于DTS所需要的储存空间较大，同常采用DTS技术的DVD影片，只会储存单一DTS声轨，或是搭配另一个AC-3声轨，而不能如同AC-3可以让DVD影片同时容纳多个多声道声轨，同时也会压缩到其它附加内容的储存空间，因此采用DTS声轨的DVD影片通常也都只有正片内容，而缺少诸如幕后花絮、多种结局等内容。不过由于DTS是属于选配规格，并不是所有的影片都会采用此种音效规格，因此大部分都是针对具有高传真音效需求的影音玩家市场，而不是针对一般家庭。

图说：DTS-HD的商标

在进入蓝光世代之后，DTS同样也推出了自家的无损多声道音效格式，更为DTS-HD，DTS-HD具有格式升级能力、数据串流传输广泛的前后兼容性、可移植性以及可加密性。理论上DTS-HD可以支持无线数量的独立环绕声道，并且也具备有向下混音至5.1甚至是2.1声道的能力。HTS-HD是1种具有高质量低码率（Low Bit-Rate，LBR）的声音压缩技术，采用的也是DTS最引以为傲的核心技术Coherent Acoustics技术，在128Kbps时即可具备有CD音质表现，也可进行低于64Kbps的声音编码，并且可以进行动态自我调整，以利于网络传输，因此在编码灵活性以及音质表现上，可以轻易取得平衡。

图说：DTS-HD的转码流程。

DTS-HD另外一个优势就是只要扩大机支持DTS解碼，利用Set-Top-Box内建的转码功能，将高流量的DTS-HD串流转换为标准的1.5MBps流量音轨，即可被现有支持DTS解碼的扩大机还原为正确的声道与声音表现。

结论

虽然在DVD世代，两大多声道编码标准有其各自不同取向，因而形成了不同的市场定位，但是在进入蓝光世代之后，两者之间的差距有缩小的倾向。Dolby技术由于是标准化，且占市场大宗，因此在竞争上也显得较具优势，而在DTS这方面，可以利用旧有的扩大机进行DTS-HD的译码，则是其优点之一，虽然如此一来DTS-HD的最大优势—音质，将不复存，但考虑到过去的硬设备投资仍可存续其价值，对于已经有不错硬设备的消费者，也会是个相当大的诱因。

您可能对以下产品感兴趣

产品型号

功能介绍

兼容型号

封装形式

工作电压