您好,欢迎来到中国企业库   [请登陆]  [免费注册]
小程序  
APP  
微信公众号  
手机版  
 [ 免责声明 ]     [ 举报 ]
企业库免费B2B网站
搜产品 搜企业
客服电话:400-000-8722

第三章 声音的传播和处理(下)

3.3 信号处理

任何可以用于信息交流的物质可被定义为信号。声波,电路中电压变化,电脑或智能手机中储存信息的0,1序列都可以是信号。在声学中,我们通常认为信号有声波、模拟声、数字声、电子声这几种表现形式。所以当我们讲到信号处理时,我们通常指的是用某种装置以某种方式来处理声波或声波的其它表现形式。

3.3.1 滤波器

通常来说,滤波器是可用来改变声音或者信号中频率成分的相对大小和相位的仪器。比如说,放大器上的低音控制和高音控制就是分别通过低通滤波器和高通滤波器来实现的。低通滤波器允许低频通过并且降低或者衰减高频。高通滤波器允许高频通过并且衰减低频。高通滤波器和低通滤波器都有一个特定的截止频率。在低通滤波器中,高于截止频率的频率成分会被衰减。在高通滤波器中,低于截止频率的频率成分将会被衰减。

另外一个通过改变声音各频率成分的相对大小来改变声音频谱的方法是使用带通滤波器。带通滤波器只允许限制范围内的频率成分通过,这个范围叫做滤波器的通带。一个带通滤波器的特性可以通过中心频率和带宽来反映,中心频率是最灵敏的(通常处在通带的中心附近),带宽是允许通过且不会有很大衰减的频率范围的大小。在3.1节提及的有些共振器就是带通滤波器。举个例子,声道内的共振腔之所以能够产生共振峰,其原因是因为声道内的共鸣腔是一个带通滤波器,它的中心频率等于共振峰的频率。除了带通滤波器外,还有带停滤波器(带阻滤波器),可以将它理解为和带通滤波器功能相反的滤波器。带停滤波器衰减某一个范围的频率,允许低于和高于这个频率范围的频率通过。

通常我们通过频域图来描述滤波器的特性,显示输入声中哪些频率成分被衰减而哪些不受影响通过。图3.12展示了低通、带通和高通滤波器的频谱特性。Y轴表示的是输出级相对输入级的大小。以图中的低通滤波器为例,从图表我们看出,输入声的频率越高于通带,衰减得越大,因此输出信号声的能量越低。

3.13最上面的图表示的是一个复合音的波形和频谱。下面的两幅图,显示的是同一复合纯音通过两个中心频率不同的带通滤波器所出现的波形和频谱。注意波形重复率没有改变:波形重复率的决定因素是谐波的距离。这张图显示滤波器如何被用于改变复合声的频谱。相似地,当宽带噪声通过低通和带通滤波器时会产生低通和带通噪声,图2.15

滤波器可以被用于改变声音,有很多用处。虽然这里讨论的主要是一些简单的滤波器,但是理论上可以用于任何模式的频率衰减。滤波器也可以用于许多其它的物理形态。比如说模拟电子滤波器,可以改变电压。还有数字滤波器,它可以用软件改变数字信号:01序列。也有一些共振器也可用作滤波器——比如声道或者乐器(详见3.1.4节)

3.3.2滤波器特性的量化

3.14显示的是带通滤波器的频谱特性。所以图中输出级的单位为分贝。由此图我们可以推断出,当一个200Hz的纯音通过滤波器时,大约会被衰减24dB。虽然我们说距离滤波器通带的频率范围越远的频率成分,其衰减强度越大,但是即使是最好的模拟电子滤波器,也不能完全衰减掉通带外的频率成分。一般认为,滤波器有衰减通带外频率成分的裙边(Skirt)。裙边(Skirt)的斜度通常用分贝每倍频程表达。一个倍频程相当于频率增加一倍。如果一个滤波器通带范围是600Hz800Hz,且裙边(Skirt)的斜度为50dB每倍频程,那么相比在滤波器通带频率内的纯音,1600Hz的纯音声级降低或衰减了50dB。举个更具体的例子,想想我们有一个与此频率特性相同的电子滤波器,在此滤波器上连上一个麦克风,并将滤波器输出和一个放大器连接,再在放大器上连接一对扬声器。给麦克风一个800Hz的口哨声(几乎是纯音),这个声音从扬声器里传出时变得响亮且清晰。但如果给的是1600Hz的声音,那么扬声器出现的声音将比原先轻。因为强度上50dB的衰减是非常明显的。(相当于原来的100000分之一)

另外,制造出一个通带完全平坦的滤波器是困难的。因此,我们需要规定通带截止频率,这样我们就可以确定带宽。我们可以任意定义通带的截止频率,截止频率就是指在这些频率处,滤波器的衰减量比通带中的最小衰减量(即滤波器的“峰值”)要多一定的分贝数。这些衰减的分贝数通常使用3dB10dB来确定带宽,分别定义为3dB带宽和10dB带宽。图3.14显示的是带宽为3dB10dB的典型带通滤波器。你还会遇到滤波器Q值的测量。Q值简单来说就是滤波器的中心频率除以带宽。举个例子,如果中心频率是1000Hz10dB带宽为400Hz,那么Q10 = 2.5。需要注意的是,Q值越高,滤波器对中心频率的调谐曲线越尖锐。

还有一个深受心理声学家们认同的滤波器特性测量方法就是等效矩形带宽,或者说ERB。一个滤波器的ERB就是指与该滤波器具有相同的峰值输出(即最小衰减)和面积(以强度为单位)(如图3.15所示)的矩形滤波器的带宽。ERB测量的好处是,如果给出一个平坦频谱的刺激声(如白噪声),已知刺激的频谱级、滤波器的ERB和最小衰减值,那么可以知道刺激声通过这个滤波器后的输出级。假设,滤波器的衰减峰值是零,因为宽度为ERB的矩形滤波器面积等于原来的滤波器面积,所以通过的强度是刺激的频谱密度(强度每赫兹)乘以ERB。如果以分贝为单位,意味着输出级相当于频谱级加上10×log10ERB)。

3dB带宽、10dB带宽和ERB之间的关系取决于滤波器的形状。想象一个峰值很尖的滤波器波形以5dB下降,这个滤波器可以有一个非常小的3dB带宽,但是10dB带宽和ERB都很大。另一方面,对于一个具有平坦通带和无限陡的斜边的标准矩形滤波器来说,3dB带宽、10dB带宽和ERB是一样的。我们发现第4章中耳朵的功能有点像一组带通滤波器。10dB带宽的滤波器的形状大约是3dB带宽的两倍,3dB带宽的形状比ERB稍小一点。

3.15 滤波器的等效矩形带宽(ERB)的图示。矩形滤波器(虚线以下)的面积和原始滤波器(实线以下)的面积相同。

3.3.3 脉冲响应

脉冲音是声压突然增加或减少产生的(从理论上讲是瞬间产生的)。图3.16显示了脉冲音的波形和频谱。如果我们使脉冲音通过一个滤波器,会发生什么现象呢?脉冲的频谱将发生变化,那波形会怎么样呢?脉冲通过滤波器后产生的波被称为滤波器的脉冲响应。脉冲响应的频谱与滤波器的衰减特性相同。可以这样想,脉冲具有平坦的频谱,所以当脉冲通过带通滤波器时,得到的波形频谱与该滤波器的衰减特性相符。脉冲响应就是所得频谱对应的波形,因此,脉冲响应的频谱与滤波器的衰减特性相同。

带通滤波器的脉冲响应看起来像一个包络线上升和衰减的纯音。滤波器的带宽(赫兹)越窄,波形越陡,脉冲响应持续时间越长(见图3.16)。关于脉冲响应可以这样设想,一个带宽无限窄、波形无限陡峭的滤波器的频谱图与纯音的频谱图是一样的。纯音的频率成分是持续的,那么滤波器的脉冲响应也应该是。相反,滤波器的带宽越宽,脉冲响应的频谱越宽,因此,脉冲响应就会更简短,这是2.3.2节讨论的时间—频率权衡规则的另一种解释方法。这样做的后果是,如果一个信号突然终止,一个高度调谐的滤波器可能会继续反应,发出持续一段时间的声音,滤波器的调谐曲线越尖,声音响的时间会越长。由于滤波器会修改声音的频谱特性,它们也必然会修改时间特性:频谱决定时间波形,反之亦然。

3.1.2节共振的讨论中,握住杯脚的酒杯相当于一个高度调谐滤波器,敲击会响相当长一段时间。玻璃响起来其实就是它的脉冲响应。而握住杯沿的酒杯,阻尼很高,就相当于一个宽调谐滤波器,有一个短暂的脉冲响应(看图3.2)。可以想到有许多类似的事物。例如,汽车上的弹簧和阻尼器(或减震器)作为一类低通滤波器,过滤掉路上一些小碰撞和不完美而可以平稳行驶。当你跳上引擎盖,弹簧会使车子弹起。这个变化就是汽车的脉冲响应。大多数物理结构被敲击时会有某种反应(震动经常会产生声音),所以滤波器和脉冲响应在我们身边很常见。

3.3.4线性和非线性

线性系统是一个信号处理器,其中,输出是输入的恒定倍数,与输入级无关。如果放大器是线性的,则输出电压是输入电压的恒定倍数。它遵循这个性质——如果两个声音叠加在一起之后通过一个线性系统得到的输出,与两个声音独立通过线性系统然后叠加在一起的输出是相同的。图3.17的左上图为两个线性系统输出级与输入级关系的图。轴线上的单位可以是声压,用于声学装置,或是电位,用于电子设备。线性系统的输入输出关系始终是一条通过坐标原点的直线。图3.17的右上图是将输入输出关系用分贝作单位表现出来。这是一条斜率为1的直线(输入增加一定分贝数将导致输出增加相同分贝数)。线性系统产生的输出水平分贝数是在输入水平分贝数上加一个常数。这是因为以分贝为单位时的一个恒定增量相当于一个恒定倍数。

3.16最上面的图显示脉冲的波形和频谱。下面的两幅图显示通过两个不同的带通滤波器之后,脉冲的波形(脉冲响应)和频谱。该滤波器的频谱特性与脉冲响应的频谱是一样的。短暂的脉冲响应与宽滤波器相关。窄滤波器与长时脉冲响应相关。

3.17 线性和非线性函数的例子。左边的图显示的是以声压或电位为单位时设备的输入和输出曲线,轴线在原点处交叉。右边的图显示的是 dB/ dB模式的相同函数。

非线性系统的输出不是输入的恒定倍数。两个声音被叠加在一起通过一个非线性系统,和两个声音独立通过非线性系统然后被叠加在一起,两者的输出是不同的。两个非线性系统的输入/输出函数显示在图3.17的左下图。在两种情况下,输入与输出值的比率随输入而变化,因此,该函数不是直线。图3.17的右下图是以分贝为单位所得的函数曲线,非线性曲线不是斜率为1的直线。

线性和非线性之间的区别是非常重要的。通过测量纯音的输出响应能说明线性系统的特性。例如,我们可以通过测量纯音在不同频率上的衰减来确定滤波器的类型。通过测量,我们可以预测任何复合音经过滤波器后的输出。如果滤波器是非线性的,则预测结果无效。描绘非线性系统的特性非常难。听力学家为了应用常设想耳朵是线性的,但现实是存在非线性因素。

3.3.5 失真

线性系统的一个重要特征是它们不会在输出频率中产生输入频率中没有的成分。线性滤波器可能会改变频率成分的相对大小,但是它从来不会产生原来不存在的成分。如果只有200Hz400Hz的成分被输入,你不会在输出中找到600Hz的成分。然而,非线性系统中,输出信号包含了输入信号中所没有的频率成分。这些额外的频率成分就被称为失真产物。失真是非线性系统的特性。

当一些纯音通过非线性系统,常产生两种类型的失真:谐波失真和互调失真。谐波失真是非线性系统的一个非常突出的特征,顾名思义,它仅包含频率是输入成分中频率整数倍的成分。图3.18所示为两种非线性系统对1000Hz纯音波形和频谱的影响。从频谱的右边可以看到谐波失真产物。谐波失真不会听起来不舒服,因为一个复合音在同一谐波系列中的频率也会产生谐波失真。

当不同频率成分相叠加并通过线性系统时,它们不会产生任何相互作用。一个复合音经过线性系统的输出等同于该复合音中每个独立频率成分所产生的输出总和。把这些频率成分通过一个非线性系统,它们会相互作用,产生谐波和互调失真产物。互调失真产生于两个或者两个以上频率成分的相互作用。互调失真的一个例子是差音。差音的频率是两个输入成分的频率差值。例如,如果一个775Hz频率的成分和另一个975Hz频率的成分,可能产生200Hz频率的差音。图3.19使用与图3.18相同的两个非线性函数来处理由两个纯音组成的信号。在频谱图上可以清楚地看到互调失真的效果。

削峰是一个典型的失真途径,在电子放大器过度放大时会发生。放大器的某一部件输出超过其规定限度的电压时,削峰发生。当输入电压过高时,会产生一个被削去峰值的声波。通过削峰放大器的纯音,会产生频率为该纯音频率3579等倍数的谐波失真。如果多个不同基频的信号和大量谐波共同输入时,其结果十分复杂。不仅谐波失真是由各频率成分混合后产生的,互调失真也是不同的频率成分相互作用而产生的。这样就会使声音听起来非常杂乱,特别是音乐演奏会上的音乐家们在演奏多个和弦时,电吉他的失真就会显得非常吵闹。

压缩器是非线性的,经常被用于录音室中(以及大多数的现代助听器中,详见第13.6节),其目的是为了缩小声音输出的强度范围。在录音时这可以帮助控制设备的强度,尤其是录歌的时候,因为歌声通常不稳定。而上段所述说的削峰是限制强度的一种极端形式,输入声的强度限制仅仅是通过防止电压超过(或少于)某一值来实现的。压缩器也可以通过一种更柔和方式来限制输出。它可以使低强度的声音被增强,使高强度的声音略有降低。但是,压缩器是非线性的,会产生一定失真,尽管这些影响几乎察觉不到。慢压缩时,振幅不立即随信号振幅的变化而改变,而是随着时间的推移缓慢变化。例如,一个高强度的声音会逐渐被降低。这时声音的精细结构几乎不受影响,只会产生非常小的失真。

3.4 数字信号

随着一些价格低、品质高的,可使用电脑和其它数字仪器来记录和处理声音的设备问世,数字记录的背景知识就变得非常有用了。任何一个希望在听觉科学领域有所发展的人都应该熟悉数字技术的基础知识。我在实验中使用的所有声音都是在我自己的电脑上合成的。有了这些知识,我几乎可以自由控制实验测试音的所有特性。

3.4.1 声波转换成数字

当模拟记录一个声音时,声压通过麦克风转换成电压。然后该电压转换成磁带上的磁场。声压、麦克风传出的电压、磁带上的磁场之间存在着一对一的关系。连续变化的声压将会通过连续变化的磁场表现出来。数字记录时,麦克风的输出电压将被转换成一系列的数字来记录。这些数字以二进制数字代码(由10组成的序列)的形式存储。连续变化的声压被有效地转换成一个只有两个值(10)的序列。一个10称为位(计算机的最小存储单位)。
用来产生对应于电压的数字代码的装置被称为模拟数字转换器(ADC)。如果采样率为44100赫兹———光盘记录的标准,那么ADC每秒44,100次将电压转换成数字。对于立体声记录,每秒需要生成88,200数字。在光盘的公认标准16位记录时,每个数字被存储为由1610“16位码)组成的数字代码的形式。图3.20显示了声波是如何被转换成一系列数字,以16位二进制码(图中右下角)代表ADC的输出。

3.4.2 数字信息的限制

16位码中的每一位可以取两个可能的值(10)。一位可以存储两个不同的值;两位可以存储2×2,也就是说四个不同值(00011011给出了四种可能性)。十六位可以存储2×2×2×2×2×2×2×2×2×2×2×2×2×2×2×2=216——65,536个不同的值。在实际应用中,这段代码可以代表-32,76732,768之间的任何整数(总共65,536个不同数目,包括零)。这个代码记录最大均方根声压是最小均方根声压的65,536倍。该跨度被称为此记录的动态范围。动态范围对应强度65,536×65,536=42.9亿。16位码的动态范围对应强度级为96 dB。从分辨率(位)转换成动态范围(分贝)时,要记住,每增加一个位对应增加一倍范围的声压或电压,声压或电压可由数字代码表示。压力加倍相当于增加大约6 dB。因此,仅通过将位数乘以6就可以得到记录的动态范围(分贝)(例如,16×6=96)。

16位码表示声压或电压,大多数情况是足够的(即使现在24位分辨率在听力实验室很常见)。虽然人类可以听到120 dB的动态范围,但是阈上96dB的声音已经相当响亮了,96 dB的范围足够再现现实情况。模拟记录的强度范围通常远小于96 dB,因为低强度的输入常被磁带或录音的嘶嘶声掩盖。

此外,尽管信号通过采样过程被分解了,数字记录与原始声音仍相差无几,而且通常比模拟记录更加保真。为什么会这样?因为数字记录可以呈现从0Hz到采样率的一半(也叫做尼奎斯特频率)中的任何频率成分。你只需要2个数据(例如一个波峰,一个波谷)来确定一个纯音的频率。因此,一个44100Hz采样率的模拟数字转换器(ADC,可以记录从022050Hz(比人能感知的最高频率还大)的任何频率。

3.4.3数字处理的优点

用数字存储声音信息意味着在记录时不会添加噪音,因为声音就是一系列数据。数字延迟,过滤,调制,混响等等都可以通过调整这一系列数字来完成。此外,可以很容易地在电脑上合成特定声音。首先,将方程(如第二章的波形方程)应用到一组时间值,并生成一组数字来表示随时间变化的声压的改变。第二,使用与ADC相反的DAC数字模拟转化器,将这些数据转化为电压变化。最后,通过扬声器或耳机用这些电压变化产生声波。在本书中提到的很多波形都是数字生成的,其频谱都是通过数字分析确定的。一切皆有可能。

3.5 总结

本章通过引入一些主题对物理声学进行了简单介绍。本章的讨论旨在强调频谱对于理解声音产生,传播和修改时的重要性。声源的特殊频谱特性取决于它们的共振特性;声音的频谱可以因为与环境中的物体相互影响而被改变。声音和它的其它表现形式可以使用滤波器和非线性设备改变声音的频谱而被改变。频谱分析对理解进入人耳的声波和理解人耳如何察觉声波是非常重要的。

1.声源是产生空气压强波动的一个物体或事件。许多物体有一个固有的共振频率,当被敲击时,将产生共振频率的声波。振动的频率取决于材料的质量与劲度。有些声源在被撞击后被高度调谐并持续振动一段时间,而其它声源会被衰减只产生短暂的振动。

2.物体的共振特性非常复杂。不仅由物体被撞击后的特定声音决定,也由物体对不同频率刺激的反应方式决定。若以物体共振频率刺激一个物体,会产生最强烈的振动响应。

3.共振可以发生在封闭的空间中,作为在空间内反射的结果。在共振频率的刺激下将形成驻波,驻波包含声压变化最小的地方(波节)和声压变化最大的地方(波腹)。

4.人类发音器官和乐器包含产生复合音的振动源,产生的声音的频谱分别被声道和乐器体的共振结构所改变。

5.声波在空气中三维传播。声音的强度随与声源距离的平方增加而减少。

6.当声波遇到一个物体,它可以被物体反射回来,通过物体传送,衍射或被吸收(声能作为摩擦热被消耗)。材料和空气的阻抗之间越不匹配,越多的声音能量被反射。在一个封闭的空间中,反射的复杂组合被称为混响。低频成分衍射更远并且更不容易被物体吸收。

7.滤波器修改声音或其他信号的频谱。低通滤波器允许低频通过,并降低或衰减高频。高通滤波器允许高频通过并衰减低频。带通滤波器只允许通过有限范围内的频率成分,并且衰减低于和高于这个范围的频率。

8.改变声音的频谱特性也会引起声音的时间特性的改变,每个滤波器都具有对应的的脉冲响应(滤波器对一个瞬态声或脉冲声的反应)来描述对声音的频谱和时域特性改变。滤波器脉冲响应的频谱和其衰减特性相同。

9.在线性系统中,输出声压或电压是输入声压或电压(一个给定的波形形状)的常数倍。输出信号的频率成分只包括在输入信号中存在的频率成分。而在非线性系统中,输出声压或电压不是输入声压或电压的常数倍。存在于输出信号但不存在于输入信号里的频率成分,被称为失真产物。

10.一个连续波形可以被转换成一系列的二进制数,这些数字数列可代表离散时间点上的声压或电压。在频率高达读取速率(采样率)的一半时,所得到的数字信号可以代表原始波形的任何成分。一旦声波信息输入进电脑,我们就可以任意对其进行调控了。数字革命极大地提高了我们合成和处理声音的能力。


我们会逐步将翻译整理好的中文内容发布在聆听世界网站微信公众平台上,欢迎您的访问。

更多精彩,请访问聆听世界官方网站

查看原文即可

www.my-ear.org

(本站拥有中文版权,转载请注名出处)


郑重声明:以上文章来源于网络,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库www.qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
会员咨询QQ群:902340051 入群验证:企业库会员咨询.

新的文章
 

微信号:
功能介绍: