声卡综述（上）

您现在的位置是：首页 > 家电

声卡综述（上）

2019-12-25 16:00:33

第一部分声卡发展回顾篇

作为多媒体电脑的象征，声卡的历史远不如其他PC硬件来的长久。不过笔者觉得在这个专题的一开始，回顾一下声卡的技术发展历程是非常有意义的。这有利于我们更全面的认识声卡的技术特点和发展趋势。

1.从PC喇叭到ADLIB音乐卡

在还没有发明声卡的时候，PC游戏是没有任何声音效果的。即使有，那也是从PC小喇叭里发出的那种“滴里搭拉”的刺耳声。虽然效果差劲，但在那个时代这已经令人非常满意了。直到ADLIB声卡的诞生才使人们享受到了真正悦耳的电脑音效。

ADLIB声卡是由英国的ADLIB AUDIO公司研发的，最早的产品于1984年推出，它的诞生开了电脑音频技术的先河，所以ADLIB公司是名副其实的“声卡之父”。由于是早期产品，它在技术和性能上存在着许多不足之处。虽然我们称之为“声卡”，但其功能却仅局限于提供音乐，而没有音效，这实在是个非常遗憾的缺陷。由于ADLIB声卡实在是一个离我们比较“遥远”的事物，笔者无法找到更多的技术参数和产品资料，但我们必须认识到“ADLIB”这个字眼在多媒体领域的重要性。在相当一段时间里，ADLIB的声卡曾是多媒体领域的一个重要标准，直到CREATIVE崛起后，ADLIB才逐渐推出历史舞台。如今我们已经很难在市场上看到它们的产品了，不过Windows的驱动程序信息库中却依然保留着ADLIB的位置，由此我们可以看到其辉煌的过去。

2.Sound Blaster系列——CREATIVE时代的开始

如今谈到大名鼎鼎的CREATIVE公司，可谓无人不知、无人不晓。港台人将其译为“创巨，创通”，而我们国内叫它“创新”。一直以来，在许多发烧友的心目中，CREATIVE几乎成为了声卡的代名词。但是前面我们已经提到过，声卡之父是ADLIB公司，而并非CREATIVE，那么创新公司又是如何在多媒体领域树立起自己老大地位的呢？这要从Sound Blaster声卡说起。

Sound Blaster声卡（声霸卡）是CREATIVE在80年代后期推出的第一代声卡产品，但是在功能上已经比早期的ADLIB卡强出不少，其最明显的特点在于兼顾了音乐与音效的双重处理能力，这是CREATIVE引以为豪的，所以在声卡发展的历程中，Sound Blaster具有划时代的意义。虽然它仅拥有8位、单声道的采样率（关于采样率等技术概念我们在后文会专门介绍），在声音的回放效果上精度较低，但它却使人们第一次在PC上得到了音乐与音效的双重听觉享受，在当年红极一时。此后CREATIVE又推出了后续产品——Sound Blaster PRO，它增加了立体声功能，进一步加强了PC的音频处理能力。因此SB PRO声卡在当时被编入了MPC1规格（第一代多媒体标准），成为发烧友们追逐的对象。

在取得了音乐与音效的完美组合之后，CREATIVE并没有满足现状，它们在技术上寻求新的突破。前面提到过，Sound Blaster与Sound Blaster PRO都只有8位的信号采样率，我们可以将其直接理解为音质的粗糙，虽然SB PRO拥有立体声处理能力，但依然不能弥补采样损失所带来的缺憾。Sound Blaster 16的推出彻底改变了这一状况，它是第一款拥有16位采样精度的声卡，人们终于可以通过它实现CD音质的信号录制和回放，使声卡的音频品质达到了一个前所未有的高度。在此后相当长的时间内Sound Blaster 16成为了多媒体音频部分的新一代标准。

从Sound Blaster到SB PRO，再到SB 16，CREATIVE逐渐确立了自己声卡霸主的地位。期间技术的发展和成本的降低，也使得声卡得以从一个高不可攀的奢侈品高度（早期的声卡非常昂贵），渐渐成为了普通多媒体电脑的标准配置。

3.SB AWE系列声卡——MIDI冲击波

Sound Blaster系列声卡发展到SB 16这一款，已经是非常成熟的产品体系了。但是SB 16与SB、SB PRO一样，在MIDI（电子合成器）方面采用都是FM合成技术，对于乐曲的合成效果比较单调乏味。到了90年代中期，一种名为“波表合成”的技术开始趋于流行，在试听效果上远远超越了FM合成。CREATIVE便在95年适时的推出了具有波表合成功能的Sound Blaster Awe 32声卡。SB Awe 32具有一个32复音的波表引擎，并集成了1MB容量的音色库，使其MIDI合成效果大大超越了以前所有的产品。

不过人们在接触了一些专业的MIDI波表合成器后却发现，Awe32的效果虽然与FM相比高出不少，但是远远不能体现出MIDI的真正神韵，其中音色库过小是主要原因。基于此，CREATIVE又在97年推出Sound Blaster Awe 64系列，其中的“重棒炸弹”——SB Awe 64 GOLD更是拥有了4MB的波表容量和64复音的支持，MIDI效果达到了一个空前的高度。当然这款经典声卡的售价也是不斐的。

Awe32和Awe64作为与SB 16系列共存的产品系列，在MIDI合成能力上下了不小的功夫，但是由于这种性能提升需要以增加产品成本为代价，真正的市场反应并不好。

4.PCI声卡——新时代的开始

从Sound Blaster一直到SB Awe 64 GOLD，声卡始终是采用ISA接口形式的。不过随着技术的进一步发展，ISA接口过小的数据传输能力成为了声卡发展的瓶颈。把接口形式从ISA转移到PCI成为了声卡发展的大势所趋。PCI声卡从理论上具有加大传输通道（ISA为8MB/s，PCI可达133MB/s），提升数据宽带的功能。从而在声卡上实现三维音效和DLS技术，使得声卡的性能得到多方面提升，但总体成本却能大幅度下降，可谓两全其美。眼下CREATIVE的主力产品——Sound Blaster Live!系列就是最为典型的高档PCI声卡产品，代表了当今较高的技术水平。

上面笔者为大家介绍的4个产品阶段，可以说代表了声卡发展的简要历史——ADLIB开创了声卡技术的先河；Sound Blaster首次综合了音乐和音效；SB PRO和SB 16则完善了这一系列的技术规格；而SB Awe 32和Awe 64开创了新的波表合成技术；PCI声卡的出现标志着新技术和新挑战的不断涌现。

或许细心的读者会发现，声卡的发展史就好像是一部CREATIVE的产品升级史。这是由于CREATIVE在技术上始终处于领先地位，因此在各种多媒体标准中“Sound Blaster”始终占有主导地位。但是，如同其他硬件产品的发展一样，有了一个“主流品牌”，就必然会造就许多“兼容品牌”。许多厂商看到多媒体领域有利可图，便纷纷加入了兼容声卡芯片的设计开发中，这就产生了厂商之间的相互的竞争，对于推动市场发展非常有利。在这些兼容芯片开发厂商中比较著名的当数ESS和YAMAHA。

ESS公司是一家专门从事影音通讯半导体开发的企业，其设计的兼容声卡芯片在用户中一直有着比较好的口碑。譬如：ESS-688、ESS-1869等都是很受欢迎的Sound Blaster 16等级的兼容芯片。而YAMAHA公司的大名大家可能更加耳熟能详了，它的地位在电子乐器界是举足轻重的。所以从ADLIB声卡时期起，YAMAHA就把声卡的MIDI合成器部分的份额牢牢控制在自己手中。ADLIB卡普遍采用YAMAHA的OPL-2 FM合成器，而Sound Blaster系列（包括PRO型和16型）则都采用了OPL-3 FM合成器。同时YAMAHA也自主开发声卡主芯片，YMF-719就是SB16时代的典范之作。当然还有诸如ALS、Crystal、OPTI等，也有一定的市场占有率。

近年来又涌现出了不少新兴的声卡芯片开发设计厂商，客观上起到了进一步加剧市场竞争作用。而且随着技术的迅速发展，厂家们已经不再局限于在性能上兼容CREATIVE的产品，而是力求取得属于自己的特色和发展空间。可以预见：今后声卡将向功能的多样化，声音信号的数字化方向发展，相信明天的声卡将会给我们带来更多的惊喜。CREATIVE一家独霸天下的历史将一去不复返。

　第二部分基本术语解析篇

相信有些读者在看到第一部分中诸如“采样率，FM合成，波表合成”等专业词汇有些头疼吧。在以下的第二部分中，我就着重为大家解释这些专业词汇，力争做到深入浅出。

一、关于声音采样

声卡的主要的作用之一是对声音信息进行录制与回放，在这个过程中采样的位数和采样的频率决定了声音采集的质量。

1.采样的位数

采样位数可以理解为声卡处理声音的解析度。这个数值越大，解析度就越高，录制和回放的声音就越真实。

我们首先要知道：电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之，在播放时则是把数字信号还原成模拟声音信号输出。声卡的位是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。声卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方——256，16位则代表2的16次方——64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。

如今市面上所有的主流产品都是16位的声卡，而并非有些无知商家所鼓吹的64位乃至128位，他们将声卡的复音概念与采样位数概念混淆在了一起。如今功能最为强大的声卡系列——Sound Blaster Live！采用的EMU10K1芯片虽然号称可以达到32位，但是它只是建立在Direct Sound加速基础上的一种多音频流技术，其本质还是一块16位的声卡。应该说16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。

2.采样的频率

采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。在当今的主流声卡上，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级，22.05只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值。

二、关于声道数的概念

声卡所支持的声道数也是技术发展的重要标志，从单声道到最新的环绕立体声，我们来仔细来探究一番。

1.单声道

单声道是比较原始的声音复制形式，早期的声卡采用的比较普遍。当通过两个扬声器回放单声道信息的时候，我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的。这种缺乏位置感的录制方式用现在的眼光看自然是很落后的，但在声卡刚刚起步时，已经是非常先进的技术了。

2.立体声

单声道缺乏对声音的位置定位，而立体声技术则彻底改变了这一状况。声音在录制过程中被分配到两个独立的声道，从而达到了很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用，听众可以清晰地分辨出各种乐器来自的方向，从而使音乐更富想象力，更加接近于临场感受。立体声技术广泛运用于自Sound Blaster Pro以后的大量声卡，成为了影响深远的一个音频标准。时至今日，立体声依然是许多产品遵循的技术标准。

3.准立体声

准立体声声卡的基本概念就是：在录制声音的时候采用单声道，而放音有时是立体声，有时是单声道。采用这种技术的声卡也曾在市面上流行过一段时间，但现在已经销声匿迹了。

4.四声道环绕

人们的欲望是无止境的，立体声虽然满足了人们对左右声道位置感体验的要求，但是随着技术的进一步发展，大家逐渐发现双声道已经越来越不能满足我们的需求。在专题的第一部分笔者就提到过，PCI声卡的大宽带带来了许多新的技术，其中发展最为神速的当数三维音效。三维音效的主旨是为人们带来一个虚拟的声音环境，通过特殊的HRTF技术营造一个趋于真实的声场，从而获得更好的游戏听觉效果和声场定位（后文会有详细介绍）。而要达到好的效果，仅仅依靠两个音箱是远远不够的，所以立体声技术在三维音效面前就显得捉襟见肘了，新的四声道环绕音频技术则很好的解决了这一问题。

四声道环绕规定了4个发音点：前左、前右，后左、后右，听众则被包围在这中间。同时还建议增加一个低音音箱，以加强对低频信号的回放处理(这也就是如今4.1声道音箱系统广泛流行的原因)。就整体效果而言，四声道系统可以为听众带来来自多个不同方向的声音环绕，可以获得身临各种不同环境的听觉感受，给用户以全新的体验。如今四声道技术已经广泛融入于各类中高档声卡的设计中，成为未来发展的主流趋势。

5.5.1声道

5.1声道已广泛运用于各类传统影院和家庭影院中，一些比较知名的声音录制压缩格式，譬如杜比AC-3（Dolby Digital）、DTS等都是以5.1声音系统为技术蓝本的。其实5.1声音系统来源于4.1环绕，不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号，在欣赏影片时有利于加强人声，把对话集中在整个声场的中部，以增加整体效果。相信每一个真正体验过Dolby AC-3音效的朋友都会为5.1声道所折服。

大家千万不要以为5.1已经是环绕立体声的顶峰了，更强大的7.1系统已经跃跃欲试了。它在5.1的基础上又增加了中左和中右两个发音点，以求达到更加完美的境界。当然由于成本比较高，趋于流行还要假以时日，这里就不多介绍了。

三、三维音效概念谈

作为时下众多声卡追求的新兴技术，下面我们就来仔细看看被炒得火热的三维音效，究竟有哪些奥秘。

1.3D音频API与HRTF的区别与关系

API是编程接口的含义，其中包含着许多关于声音定位与处理的指令与规范。它的性能将直接影响三维音效的表现力。如今比较流行的API有Direct Sound 3D、A3D和EAX等。而HRTF是“头部相关转换函数”的英文缩写，它也是实现三维音效比较重要的一个因素。简单讲，HRTF是一种音效定位算法，它的实际作用在于欺骗我们的耳朵。眼下有不少声音芯片设计厂商和相关领域的研究部门参与这种算法的开发和设计工作。虽然原理大同小异，但由于在分析和研究过程中的手段稍有不同，所以各类HRTF算法之间也会有或多或少的性能差异。人们很容易将API与HRTF混淆起来，其实两者有着本质的区别，也有相互的联系。

举一个例子：A3D是时下最为流行的3D音频API之一，眼下大部分主流PCI声卡都表示支持A3D 1.0。但是有些用户会反映，为什么我的这块XXX声卡号称支持A3D，但实际效果却为何不如朋友的那块DIAMOND S90？原因就在于，S90采用Aureal自己的AU8820芯片，采用的HRTF算法自然也就来源于Aureal；而XXX声卡没有采用AU8820芯片，而采用了其他的HRTF算法，虽然也可以支持A3D的函数变化，但由于算法的先天不足并且需要经过函数转化，在效果上自然就不能和S90相比了。因此眼下许多声卡称自己支持A3D、EAX和DS3D，这只能表明它支持这些规范与指令，究竟实际效果如何，还要取决于芯片所采用的HRTF算法。在选购声卡前了解一下其芯片采用何种HRTF算法对于最终三维音效的实现能力是非常重要的。

2.主要的3D音频PAI

(1)Direct Sound 3D——源自于Microsoft DirectX的老牌音频API。对不能支持DS3D的声卡，它的作用是一个需要占用CPU的三维音效HRTF算法，使这些早期产品拥有处理三维音效的能力。但是从实际效果和执行效率看都不能令人满意。所以，此后推出的声卡都拥有了一个所谓的“硬件支持DS3D”能力。DS3D在这类声卡上就成为了API接口，其实际听觉效果则要看声卡自身采用的HRTF算法能力的强弱。

(2)A3D——美国Aureal公司所开发，分为1.0和2.0。1.0版包括A3D Surround和A3D Interactive两大应用领域，特别强调在立体声硬件环境下就可以得到真实的声场模拟。2.0则是在1.0基础上加入了声波追踪技术，进一步加强了性能，它是当今定位效果最好的3D音频技术。

(3)EAX——是CREATIVE的新招牌，意为“环境音效扩展集”。EAX是建立在DS3D上的，只是在后者的基础上增加了几种独有的声音效果指令。EAX特点是着重对各种声音在不同环境条件下变化和表现进行渲染，对声音的定位能力不如A3D，所以EAX建议用户配备4声道环绕音箱系统。

3、主要的HRTF算法。

诸如Aureal和Creative这样的大公司，他们既能够开发出强大指令集规范，同时也可以开发出先进的HRTF算法并集成在自己的芯片中。下面给大家介绍的CRL和QSound则是主要出售和开发HRTF算法的，自己并不推出指令集。

CRL开发的HRTF算法叫做Sensaura，支持包括A3D 1.0和EAX、DS3D在内的大部分主流3D音频API。并且此技术已经广泛运用于ESS、YAMAHA和CMI的声卡芯片上，从而成为了影响比较大的一种技术，从实际试听效果来看也的确不错。而QSound开发的Q3D可以提供一个与EAX相仿的环境模拟功能，但效果还比较单一，与Sensaura大而全的性能指标相比稍逊一筹。

四、关于MIDI

MIDI是电脑音乐的代名词，问世于80年代初。MIDI究竟是什么？下面让我们来共同探究。

1.MIDI的概念

MIDI是Musical Instrument Digital Interface的简称，意为音乐设备数字接口。它是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议。我们可以从广义上将为理解为电子合成器、电脑音乐的统称，包括协议、设备等等相关的含义。

2.MIDI文件的本质

眼下在一些游戏软件和娱乐软件中我们经常可以发现很多以MID、RMI为扩展名的音乐文件，这些就是在电脑上最为常用的MIDI格式。MIDI文件是一种描述性的“音乐语言”，它将所要演奏的乐曲信息用字节表述下来。譬如“在某一时刻，使用什么乐器，以什么音符开始，以什么音调结束，加以什么伴奏”等等，所以MIDI文件非常小巧。

3.FM合成

既然MIDI文件只是一种对乐曲的描述，本身不包含任何可供回放的声音信息，那么一首首动听的电脑音乐又是如何被我们的声卡播放出来的哪？这就要通过形式多样的合成手段了。早先的ISA声卡普遍使用的是FM合成，既“频率调变”。它运用声音振荡的原理对MIDI进行合成处理。但由于技术本身的局限，加上这类声卡采用的大多数为廉价的YAMAHA OPL系列芯片，效果自然不好。

4.波表合成

波表的英文名称为“WAVE TABLE”，从字面翻译就是“波形表格”的意思。其实它是将各种真实乐器所能发出的所有声音（包括各个音域、声调）录制下来，存贮为一个波表文件。播放时，根据MIDI文件纪录的乐曲信息向波表发出指令，从“表格”中逐一找出对应的声音信息，经过合成、加工后回放出来。由于它采用的是真实乐器的采样，所以效果自然要好于FM。一般波表的乐器声音信息都以44.1KHz、16Bit的精度录制，以达到最真实回放效果。理论上，波表容量越大合成效果越好。

5.复音数的含义

在各类声卡的命名中，我们经常会发现诸如64、128之类的数字。有些用户乃至商家将它们误认为是64位、128位声卡。其实就现在的技术发展状况而言，声卡更本没有发展到，也没有必要发展到如此高的数据处理通道，64、128代表的只是此卡在MIDI合成时可以达到的最大复音数。所谓“复音”是指MIDI乐曲在一秒钟内发出的最大声音数目。波表支持的复音值如果太小，一些比较复杂的MIDI乐曲在合成时就会出现某些声部被丢失的情况，直接影响到播放效果。好在如今的波表声卡大多提供64以上的复音值，而多数MIDI的复音数都没有超过32，所以音色丢失的现象不会发生。
另外需要注意的是“硬件支持复音”和“软件支持复音”之间的区别。所谓“硬件支持复音”是指其所有的复音数都由声卡芯片所生成，而“软件支持复音”则是在“硬件复音”的基础上以软件合成的方法，加大复音数，但这是需要CPU来带动的。眼下主流声卡所支持的最大硬件复音为64，而软件复音则可高达1024，令人炸舌吧！

6.DLS技术的作用

PCI声卡的问世和普及带来了波表合成的一次小小“革命”，其关键在于DLS技术的运用。DLS全称为“Down Loadable Sample”，意为：可供下载的采样音色库”。其原理与软波表颇有异曲同工之处，也是将音色库存贮在硬盘中，待播放时调入系统内存。但不同点在于运用DLS技术后，合成MIDI时并不利用CPU来运算，而依靠声卡自己的音频处理芯片进行合成。其中原因在于PCI声卡的数据宽带达到133Mb/秒，大大加宽了系统内存与声卡之间的传输通道。从而既免去了传统ISA波表声卡所要配备的音色库内存，又大大降低了播放MIDI时的CPU占用率。而且这种波表库可以随时更新，并利用DLS音色编辑软件进行修改，这都是传统波表所无法比拟的优势。（未完待续）

上一篇：声卡综述（下）

下一篇：浅谈环绕音效系统

声卡综述（上）

相关文章

文章排行

栏目更新