搜索
查看: 957|回复: 0

[分享] 基于快速傅里叶变换的SmaartLive音频测量基本原理(上)

[复制链接]

332

主题

537

帖子

3836

积分

论坛元老

Rank: 8Rank: 8

积分
3836
发表于 2023-6-1 08:44:41 | 显示全部楼层 |阅读模式
基于快速傅里叶变换的SmaartLive音频测量基本原理(上)


本篇是关于SIA-SmaartLive® 测量平台上所使用的快速傅里叶变换(FFT)技术性实践分析报告的摘要。通过本篇,您将会了解到SmaartLive基于FFT测量的基本概念方面的时域采样、FFT分析、傅里叶理论、不同频谱视图的观测体验以及分数倍频程。


时域采样:将信号送入SmaartLive
一般来说,声信号和电信号都是连续的,它们在每个时间点上都有一个确定的值,故可以使用测量仪器来测量声压和模拟电压这类连续信号。然而,为了能够通过SmaartLive这种基于计算机的测量系统来分析这些连续信号,必须把它们转换为一系列数字样本,且每个数字样本能够代表一个在特定时间点上与被测信号成一定比例的有效数值。这一过程被称为采样:即把时间上连续的信号转换为时间上分离的信号。

用于SmaartLive测量(及其他数字音频应用)的采样过程在均匀间隔的时间点上产生数据。每秒的采样数值就是大家熟悉的采样率,缩写为SR(Sample Rate),单位为Hz。采样率直接影响计算机中能够分析的最高频率,即“尼奎斯特限定频率(fmax)”,它等于采样率的一半。对于电声信号和电声系统的测量,通常信号所处的频段约在20 Hz到20 kHz之间。因此,在大部分的测量中,最好选择声卡和SmaartLive能够同时兼容的最高采样率。一般情况下,48 kHz和44.1 kHz都能够提供一个至少为20 kHz的测量带宽。


采样周期是一个与采样频率反相关的参数,它表示的是采样之间的时间间隔(以s为单位),测量精度在时间上与采样周期T相等,见图1。这就意味着不能从持续时间短于这个精度的信号中分辨出任何的细节。例如,如果利用SmaartLive,通过寻找脉冲响应峰值的方法来测量信号延时,则无法测得小于T的延时量。


图片1.jpg




除了选择理想的采样率之外,在设置测量系统时也必须要考虑模数转换器的字长。对于每一个采样而言,模数转换器必须指定一个确切的数字比特模式来代表其振幅。实际上,模数转换的字长越长,或每个采样的比特数越长,测量的动态范围就会越大。更为重要的是,字长的增加会提高所测量振幅精度,因为信号振幅上的采样点被分配在了更小的间隔中。与采样率相同,在保证与硬件兼容的前提下,应将SmaartLive中的字长设为最大值。


FFT分析:观察频域信息
虽然在部分情况下,在时域进行测量是很实用的,但是大多数的音频测量需要频谱信息,了解音频信号及整个系统的频率内容和特征。幸运的是,目前已经存在一个特定的技术将数据从时域转换到频域。傅里叶变换能够将一个时序信号转换为复杂的频域信息,它包含了构成信号的正弦波分量的振幅和相位信息。另外,傅里叶变换提供了一个反向变换,在不丢失任何信息的情况下,把复杂的频域信号数据转换为时域信号。所以,时域数据和频域数据是相同的:它仅仅提供了观察同一信号的不同视角,详见图2。


图片2.jpg




傅里叶理论
19世纪,法国数学家Jean Baptiste Joseph Fourier 提出一个概念,把任何时间信号表达为若干基本频率的函数。傅里叶理论认为,任何复杂的时序信号,无论是噪声、语音还是音乐,都可以看作是一系列不同频率、振幅和相位的正弦波的组合。有了这一基本概念,可以通过数学的方式将信号在时域和频域之间进行转换。

为了把连续信号x(t)转换为它所对应的频域X (jw),用到前面提到的傅里叶变换:


公式1.jpg


值得注意的是,在最为严格的条件下,傅里叶变换需要一个完整的时间历史(无限长的时间)和无限数量的正弦频率分量来充分地描述一个信号。显然,这对于测量来说并无实际意义。为了利用计算机来进行傅里叶变换,必须使用时间窗将对信号的观察限制在一个有限的时间范围内。这是基于采样信号数据运行的离散式傅里叶变换(DFT:Discrete Fourier Transform),或通过计算机运算的离散式傅里叶变换,即快速傅里叶变换(FFT: Fast Fourier Transform)。


SmaartLive应用了快速傅里叶变换(FFT)将傅里叶变换进行了数字化,这是一种通过计算机来进行的高效方法。FFT的工作基于有限长度的采样数据块(被称作FFT数据窗)。一般使用NFFT为符号,以采样(或采样点)为单位来描述FFT数据窗的长度。通过这一数值,并利用采样率,可以很容易地计算出单位时间FFT时间窗的长度。这一数值称为时间常数(TC),它代表了每个FFT数据窗所观测的连续输入信号的时长。观测信号时,更高的TC数值能够提供一个更长的时间“窗口”,但它同时也增加了FFT频谱在更新过程当中所需要的时间以及系统必须处理的数据量。
公式3.jpg

作为一个与频率相关的函数,FFT所产生的频域数据是以线性间隔排列的,这与以对数方式感知频率的听觉系统有所不同。时间常数TC与频谱数据的频率精度FR(Frequency Resolution)成反比。FFT频谱中包含复杂的频率数据(振幅和相位)以频率精度为间隔分布在从0 Hz(直流)到尼奎斯特频率的范围中。在这一概念下,很容易看出精度在时域和频域中是如何反向相关的。使用较长的FFT(窗口)尺寸能够提供更高的数据精度,但是时间响应会更加“迟缓”,而较短的FFT(窗口)尺寸能够提供较低的频谱精度,但响应时间更快。图3以图形的方式描述了FFT参数的改变所导致的频域数据精度的变化。当在一个对数轴上以线性的方式排列FFT数据时,便不难看出过短的FFT可能会造成低频数据精度的不足,而过长的FFT则可能会导致高频数据精度过高。
图片3.jpg
公式4.jpg


常数和频率精度分别进行设置。任何一个参数的变化都会立即引起其他相关参数的改变,这就使得使用者可以着眼于所得数值的含义而不是它们的计算,见图4。
图片4.jpg

不同频谱视图的观测体验
通过快速傅里叶变换获得的频域数据被分布在一个连续的、拥有线性间隔的频率轴上。如果均匀地将FFT数据分布在一个图表上的话,需要采用等间隔的频率轴,即每个赫兹之间的间隔相等。相比之下,听觉系统是根据等频率比(Equal Frequency Ratios)的方式来感知乐音音高的,这导致与之相符的频率轴成对数规律分布(每倍频程之间等间隔)。显然,如果将线性排列的FFT数据分布在一个对数频率轴上,则该频率轴所呈现的精度无法保持一致,可能会在较低的倍频程出现精度不足,而在较高的倍频程上出现不适宜的高精度(如图3所示)。可以通过增加FFT窗口的尺寸来使低频分辨率最大化,然而这会导致一个更长时间常数,以及更长的时间响应。另外,对于传递函数的测量,增大时间窗会将多余的房间反射引入到测量结果中,进而有可能导致响应曲线中细节的模糊。显然,需要一种额外的方式来观测FFT数据,让图表数据与人耳听觉特性更加一致。




为了改变FFT数据在对数频率轴上的观测体验,SmaartLive 提供了若干种方法,可以针对不同的分析任务进行相应的选择。对于频谱模式下的数据,可以使用改变频域横坐标轴的分布(Banding)的方法,这一方法将数据等间距地分布在分数倍频程上,例如1、1/3、1/6、1/12或1/24倍频程。图5以一个输入信号为例,将对数分布的FFT频谱和分数倍频程分布的频谱进行比较。其中,图5(a)显示了原始的FFT频谱数据分布在一个对数频率轴上;图5(b)显示了频谱数据在倍频程带宽下;图5(c)显示了频谱数据在1/24倍频程带宽下。
图片5.jpg




分数倍频程
频谱模式下的频率轴分布(Banding)技术提供了一个基于FFT的滤波器,它近似于模拟实时分析仪(RTA)所使用的滤波器,通过电子手段将输入信号分配到不同的频带上,然后以均方根电平的方式进行显示。SmaartLive 中的频率轴分布(Banding)观察方式提供了以对数方式划分的各频段能量的总和(这与硬件实时分析仪十分相似),这样,在各倍频程当中具有相等能量的信号(如粉红噪声)将会呈现出一个平坦的频谱分布,如图6。在每赫兹上具有相等能量的信号(如白噪声)所呈现出的频谱分布规律为每倍频程提升3 dB。这种频率分布(Banding)的观察模式对于判断输入信号的频率内容十分有效,同时它也有助于查看回授频率和房间噪声的情况.
图片6.jpg
注意,在窄带对数频谱图当中呈现出明显下降趋势的信号在以对数方式划分的分数倍频程模式下呈现出平直的响应。在这种情况下,分数倍频程观察模式能够更加准确地反映出人们对信号音色的实际感知。


除了通过频率轴分布的方式来处理频谱模式的信号以外,在SmaartLive中还使用了每倍频程固定点FPPO(Fixed-Point per Octave)的技术来计算以对数方式分布的传递函数(频率响应)数据。这种技术等同于使用了一个随频率而变化的测量时间窗,在低频部分使用一个较长的时间窗(为了获得精确的频率精度),随着频率的上升,时间窗的长度也变得越来越短。这种方法有两种主要作用:一是可变时间窗与人而听觉感知机制所定义的扬声器在一个房间内的“感知频谱质量”(Perceived Spectral Quality)能够进行良好的匹配;这种可变的分析时间窗的长度为频域数据在每个倍频程内提供了相等的密度,在上述例子当中,是每倍频程24个数据点。


对于在SmaartLive中绝大多数传递函数的测量,尤其是那些包含了一些声学路径的情况(例如扬声器系统的测量),FPPO的观察方式能够提供系统响应函数的最佳呈现结果。除了固有的低频优势之外,FPPO技术还能够提供更加简单易读的高频曲线,而非由于过高的高频精度造成的FFT数据模糊的现象,如图7。其中,图7(a)是一个小型扬声器的传递函数,使用标准的32k采样点FFT数据精度;图7(b)是同一扬声器的测量结果,使用FPPO技术进行观察。
图片7.jpg


在SmaartLive的传递函数模式下,还有一种选项可以通过定义若干个数据点的方式将传递函数曲线变得更加平滑。实际上,这一平滑功能是一个在频率上可移动的求平均滤波器,它被施加在传递函数数据之上,在数据被最终显示之前,将数据曲线的起伏和不连续性进行最小化。可以选择3、5、7或9个数据点的平滑深度,这一数值定义了使用多少个相邻FFT数据点来进行平均处理来以获得实际显示数值。更高的数值能够获得视觉上更加连续的曲线。图8展示了平滑功能应用于一个小型扬声器的传递函数测量的例子,其中图8(a)对小型扬声器进行测量,测量结果未进行平滑处理;图8(b)则是同样的数据通过9点平滑的方式进行显示。曲线平滑功能可以同时用于标准FFT尺寸和FPPO曲线。
图片8.jpg



回复

使用道具 举报

您需要登录后才可以回帖 注册/登录

本版积分规则

关闭

站长推荐上一条 /2 下一条

Archiver|手机版|小黑屋|RF技术社区

GMT+8, 2024-4-24 02:36 , Processed in 0.080978 second(s), 9 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2024, Tencent Cloud.

快速回复 返回顶部 返回列表