您好,欢迎来到画鸵萌宠网。
搜索
您的当前位置:首页小波变换在语音信号处理中的应用

小波变换在语音信号处理中的应用

来源:画鸵萌宠网


小波变换在语音信号处理中的应用

XXX

(江苏科技大学 江苏 镇江 212003)

摘 要:利用小波的多分辨分析,以及其良好的空间域和频率域局部化特点,针对语音信号特征,选取适

当的小波算法进行去噪和增强语音,压缩编码,提取语音信号特征等处理。通过MATLAB仿真分析,得到增强后的信号图和压缩后的压缩比参数、能量保留参数、零系数比例,提取语音信号的特征。结果表明,基于小波变换的与语音信号处理表现出良好的特性。

关键词:语音信号处理;小波变换; 去噪; 增强; 压缩编码;特征提取 中图分类号:TB115 文献标识码:A

Wavelet Transformation Application in Speed Signal

Processing

XXX

(Jiangsu University of science and technology, Zhenjiang 212003, Jiangsu, China)

Abstract: By the time-frequency analytic feature of wavelet transformation, the appropriate wavelet functions

are selected to strengthen, to code, to compress and to extract signal features of speech according to the characteristics of the speech signals. Simulated by MATLAB, the strengthened signals, the compression ratio parameter, the energy reservation parameter, the zero coefficient parameter and the speech signal features were obtained. The results show that the speech signal processing based on wavelet transformation exhibits good characteristics.

Keywords: Speech Signal Processing; Wavelet Transformation; Strengthening; De-noising; Feature extraction; Condensation encode

1 引言

小波分析是近十几年发展起来的一种新的时频分析方法,它是泛函数、Fourier分析、调和分析、数字分析的最完美的结晶;在应用领域,特别是在信号处理、图像处理、语音处理以及众多的非线性可续领域,它被认为是继Fourier分析之后的又一有效的时频分析方法。小波变换是传统傅里叶变换的集成和发展。由于小波的多分辨分析具有良好的空间域和频率域局部化特性,针对聚焦到分析对象的任意细节,因此,特别适合于信号非平稳信源的处理,并已成为一种信息处理的新手段。目前,小波分析已成功应用于语音信号处理。

2 小波理论

2.1 连续小波变换

(t)为一平方可积函数,即(t)L(R),若其傅里叶变换(t)满足条件: 设2C(w)w2Rdw

2t)为一基本小波或小波母函数,则称(称上式为小波函数的容许条件。将任意L(R)空

间中的函数f(wavelet transform,t)在小波基下展开,函数f(t)连续小波变换(continue 简称CWT)表达式为:

WTf(a,)f(t),a,(t)其重构公式(逆变换)为:

1ntf(t)()dt (1) Raaf(t)1CtbW(a,b)()dadb (2) fa2.2 离散小波变换

为了减小小波变换系数冗余度,将小波基函数a,(t)1a(t)的a,限定在at)和分析小波a0,k0(t)中的时间一些离散点上的取值。在离散小波变换中,待分析信号f(变换t并没有被离散化,只是离散a,栅格下的小波变换。 2.2.1 尺度离散化

m对尺度进行幂数级离散化即取aa0(a00,mZ),此时对应的小波函数是:

jt] j=0,1,2,··· (3) a[a0j202.2.2 位移离散化

jt)的对进行均匀离散取值,以覆盖整个时间轴。在尺度j下由于(a0t)的宽度是(a0j倍,采样间隔可以扩大a0j,但信息也不会丢失。这样,a,(t)就改为

jtka00a[a0jtK0] (4) [a0j20记为a0,k0(t)。 离散小波变换定义为:

jWTf(a0,k0)nf(t)t)dt j=0,1,2,···,kZ) (5) a,k0(0其重构公式为:

f(t)ccj,kjk(t) (6)

,

其中,c是一个与信号无关的常数。 2.3 多分辨分析

定义函数:

j,k2j22tKj,kZ (7) j2则函数系j,k(t)|kZ为规范正交。三层多分辨率分析树结构如图1所示。设Vj代表图中的低频部分Aj;Wj代表分解中的高频部分Dj,则Wj是Vj和Vj1中的正交补,即:

VjWjWj1···WjmVjm (8)

则多分辨率的子空间V0可以用有限子空间来逼近。即有

V0V1W1V2W2W1···VNWN-1···W2W2 (8)

图1三层多分辨率分析树结构图

分解的最总目的是构造一个在频率上高度逼近L(R)空间的正交小波基,频率分辨率不同正交小波基相当于带宽各异的带通滤波器。从图1可以看出,多分辨率只对低频弓箭进行

进一步分解。频率分辨率变得越来越高。

22 小波变换在语音增强中的应用

在语音的产生、处理和传输过程中,不可避免地会受到环境噪声的干扰,使得语音信号处理系统,如语音编码和语音识别系统的性能大大降低。为了改善语音质量,提高语音的可信度,人们根据语音和噪声的特点,采取各种语音增强方法抑制背景噪声。小波去噪的基本原理首先将经过预处理对的含噪信号进行多尺度小波分解,然后在各尺度下尽可能提取信号的小波系数而去除属于噪声的小波系数,最后用逆小波变换重构信息,达到去噪的目的。 小波去噪的方法有很多种,概括起来主要有屏蔽去噪法、阈值去噪法、模极大值检测去噪法等。下面简单介绍阈值去噪法。它的思想是利用阈值对经过变换后的较低尺度上的小波系数进行处理,将那些对应于高斯噪声的小波系数置0,而保留那修对应于信号的小波系数,再由处理后的小波系数重构原信号,获得对有效信号的最优估计。阈值化处理的关键问题是选择合适的阈值。如果阈值太小,去噪后的信号仍然有噪声存在;如果阈值太大,重要的信号特征将被滤掉,引起偏差。从直观上,对于给定小波系数,噪声越大,阈值就越大。大多数阈值选择过程是根据本组小波系数的统计特性,计算出一个阈值。本文后边的MATLAB中采用db3母小波函数对语音波形进行5层分解,并选用全阈值进行信号去噪增强处理。

3 小波变换在语音压缩编码中的应用

语音信号的压缩编码是研究如何降低语音信号编码速率的问题。数码率低于Kbit/s的语音编码方法成为语音压缩编码技术。语音的压缩编码方法归纳起来可分为三大类:波形编码、参数编码和混合编码。波形编码比较简单,失真最小,方法简单。但数码率比较高。参数编码的编码速率可以很低,但音质较差,其次是复杂度高。混合编码吸收了波形编码和参数编码的有点,从而在较低的比特率上获得较高的语音质量。 小波变换编码属于变换域编码方式。变换域编码是将输入信号用时间窗分成短区间数据块,然后进行正交变换,并对比编码系数逐个地进行量化并传送的方法。它将时域信号变换到时频域中小波分析结合矢量量化编码,可以进一步压缩编码效率,图2为典型编码框图。

图2 典型编码框图

目前,较为完善的小波变换宽带音频编码解决方案是采用离散小波变换(Discreet Wavelet Packet Transform)。其基本特点是采用离散小波包取代传统滤波器组或正交变换基,由心理声学模型计算掩蔽域门限,直接控制自适应小波基的优化和比特分配。基于小波变换的宽带音频编码器在kb/s的速率可以达到透明质量,从技术前景来看,它还可以在10kb/s速率上合成音乐信号。但现行的小波变换的音频压缩编码方案还存在着计算复杂度高和时延长的缺陷一些优秀的音频特性,如高保真度、动态音频范围及丰富的音质都需要高采样率的保证。同时,在许多互联网和多媒体系统应用中,由于带宽,使这种高采样率技术不适用。现利用小波变换的方法来降低数据的传输比特率。其处理过程主要有以下四步:(1)小波的选择。设计高质量的语音编码器时,母小波的选择非常重要,其目标是最小化重构残差以及最大化信噪比。多次试验表明,针对语音信号的特点,选用母小波函数db5效果较好。所以,本场地仿真试验选用此函数来实现。(2)小波分解。基于小波压缩的思想,用少量的逼近系数以及某些细节参数准确表示原始语音。分解系数的决定取决于语音i信号的类型和其它一些参数。本试验中,对语音信号进行了5层分解,压缩参数取1.5。(3)系数的裁剪。对原始语音信号分解后,压缩过程可以通过较小某一阈值小波系数来实现。这是依据人耳的生理特性和人对声音的心里特征去除人耳朵不能感知的声音成分的原理,进行压缩裁剪。使用BirgeMassart策略进行语音波形的一维小波阈值计算,即用函数wdcbm 进行阈值压缩信号。此函数可以返回尺幅相关阈值和系数的个数,尺度相关阈值使用基于Birge-Massart策略的小波系数选择规则得到。(4)系数编码。最后进行剩下的小波系数编码,有利于传输。其中,压缩编码后原语音信号的长度比编码后的长。

这种压缩方法是一种有损压缩,但可用最小的数据量来表示音频信号,保持良好的失真度。

4基于小波变换的语音信号特征提取

小波分析在信号特征的提取上有很多应用,以语音基频的提取为例说明它的应用。语音的能量来源于正常呼吸时肺部呼出的稳定气流,而通过声带的开启和闭合使气流形成基音周期,其倒谱成为基音频率,简称基频(F0)。考虑到基音频率多分布在50-500Hz之间,而多分辨率分析有把频率逐级对分的特点,可用Mallet算法直接对语音信号进行分解,用低频小波系数对部分重构,然后用小波变换进行信号奇异点检测,通过奇异点确定得到基音周期。通过求倒数得到基音频率,再计算出F0平均值、F0最大值和F0变换范围(分别记为F0、F0max和F0range)。

对于基音周期的提取,采用了小波变换奇异点检测算法。选取具有紧支集正则的二次样条小波U(x)。则二次样条小波的相应滤波器传递函数为:

H(X)ejX2[cos(X/2)]3 (10)

G(X)4jejX2sin(X/2) (11)

j1j1j 在每一尺度s2上,信号分解为低装半袋s2f和高半袋W2f:

j1W2j1fs2f*G(n) (12) j1S2j1fs2f*G(n) (13)

jj当j=0时,S2fs2f,即f(x)的采样值,式(12)和式(13)即为小波变换。计

算Wsj1f(x),并求大于0.8Wsmax和极致点。在同一尺度下,相邻极值点的时间间隔就是基

音周期T,然后求基音周期的到倒数就是基音周期F0。

5实验结果与总结

原始语音信号波形如图3所示。其语音内容为A到G七个英文字母的发音。可以看见语音信号中含有一定的噪声,为使效果更加显著,首先对原始语音追加噪声,然后对其利用小波变换进行分解,最后重构。由于本文所采用的信号较弱,所以没有做加噪处理。在MATLAB中使用小波变换的图形方式(GUI),而得到如图4所示的增强语音波形信号。从图中明显看出,增强后的语音信号很光滑,提高原语音信号的信噪比。

图3 原始语音信号

图4 去噪增强后的语音信号

按照本文上述的语音压缩算法,将原始语音信号波形(见图3)进行压缩编码,得到如下结果。零系数的比例:pz=96.87;保留能量大小:saveenergy=88.48。Matlab实现如图5所示。

图5 压缩后的语音信号

根据上文关于语音信号基频提取的分析用MATLAB编写程序,运行后调用MATLAB结果得F0=124.2Hz,F0max=143.7Hz,F0range=79.7Hz。

通过MATLAB中仿真,可以看到一维小波变换可以对语音信号进行去噪、压缩,图特征等处理,并表现出良好的参数特性。在增强语音信号中,选用母小波db3进行分解,对于语音信号而言,5层分解已足够,采用全局阈值进行信号增强处理,主要用wavedec函数来实现。在压缩语音编码时,选用db5小波进行5层分解,但要通过函数wdcbm计算出阈值,函数wdcbm是以Birge-Massart策略设置一维小波压缩阈值。而后,用硬阈值法压缩语音信号。这种处理保存了低频信号,而灵活性很大。

1. 原始语音信号+原始语音信号的频谱

2. 加噪声后的信号 + 使用小波去噪(阈值去噪法)增强后的语音信号

从图中明显看出,增强后的语音信号很光滑,提高原语音信号的信噪比。

3. 含噪的原始语音信号+使用硬阈值压缩重构后的语音信号

按照本文上述的语音压缩算法,将原始语音信号波形进行压缩编码。零系数的比例:pzeros =94.2418; 保留的能量大小pnormen =92.1785; 压缩比compratio = 13.0946。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo8.com 版权所有 湘ICP备2023022238号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务