您的当前位置:首页正文

基于神经网络的语音信号识别

来源:画鸵萌宠网
毕业设计(论文)开题报告

附表二 课题名称 学生姓名 基于神经网络的语音信号识别 崔楠楠 学号 20102460304 专业班级 通信工程、三班 一、选题的目的意义 随着社会的不断发展,计算机的迅速普及,人们渴望一种符合人类自然交往的“人机对话”模式的出现,特别是人机自然语言对话。目前一些专家和学者在这方面进行了大量的开发和研究工作。但语音识别技术正处于蓬勃发展的时期,仍有待进行大量的研究工作以取得更进一步的突破。人机自然语言的接口是一个非常重要的部分。它要求计算机能说会听,应此要求出现了语音合成和语音识别两门学科。所谓语音识别,就是利用计算机,对人们的语音信号进行时域或频域处理,识别出所说的是什么,通俗地讲,就是让计算机能够模拟人类的听觉功能。国际上,对计算机语音识别的研究也有近四十年的历史,经过数辈科学家和科学工作者的艰辛努力,语音识别的研究方面取得了很大的成果。尤其是近一、二十年,提出了许多有效的语音处理和识别的方法和策略,使得语音识别这门学科的研究日趋兴旺,许多的语音识别系统也正逐步实用化。人们所期望赋予计算机能说会听的梦想正步步走向现实。预计在未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域(如门禁系统,手机语音自动拨号系统)。语音识别系统依照语音识别的单元、语音识别系统是否依赖人可以分成:特定人、孤立词语音识别系统;非特定人、孤立词语音识别系统;特定人、连续语音识别系统和识别系统和非特定人、连续语音识别系统四类。 神经网络是一门新兴交叉学科, 是人类智能研究的重要组成部分,已成为脑科学、神经科学、认知科学、心理学、计算机科学、数学和物理学等共同关注的焦点。它就是指模仿人脑神经网络的结构和某些工作机制建立一种计算模型的处理方法。 由于人工神经网络具备良好的自学习和自适应能力,将其应用于语音合成系统中的韵律模型研究具有很重要的意义。将神经网络模型与已有的文语转换系统有机结合,可以改变传统的文语转换系统的韵律模型,具有更强的适应性和可训练性,使合成语音的自然度得到显著提高,增加了系统的灵活性和风格的多样性。 二、国内外研究综述 在神经网络理论研究的历史进程中,其中的视觉神经系统的研究是最活跃和最成功的领域。所以,基于视觉理论的神经网络模式识别理论的研究也一直是非常活跃的学科,并且被认为是神经网络应用最成功的一个重要方面,它的发展与神经网络理论可以说是同步的。 50年代末60年代初,Rosenblatt提出的Perceptron(感知器)和Widrow提出的AdaLine(自适应线性元件1及一种有效的网络学习方法,即通常所说的Widrow—Hoff学习规则,从而使我们获得了简单的线性分类器[2]。但是,由于Perceptron缺少有效的训练法,致使研究工作非常缓慢。Minsky和Papert于1969年发表了很有影响的{Perceptrons))一书,指出Perceptron不能解决高阶谓词问题,直至1986年,Rumelhant和McClelland提出了多层网络的“误差反向传播算法(BP)”,使有导师学习多层感知器网络(MLPN)模式分类器走向实用化。紧接着在多层感知器网络的基础上,又派生出若干前馈网络,如径向基函数网络(RBFN)。当然,目前神经网络的学法已经完全突破原先的误差反向传播算法,如递推最小二乘法、投影算法等[3]。 1973年,Watanabe提出了使用模式子空间的概念来设计不同类别对应的子空间,由不同类别聚类的子空间来实现模式识别,这显然是模式识别最直观的概念。70年代末,Kohonen提出了学习子空间(LSM)模式分类的概念;Oia在此基础上又给出了平均学习子空间方法(ALSM),从而使子空间模式识别形成了较完整的体系,并已将这种方法成功地应用在语音音素识别实验中。 实际上,学习子空间方法是一种无导师学习的神经网络模式识别方法。1991年,L.Xu与E.0ja等人用大量并行结构的神经元来实现了这种方法,从而将学习子空间方法与硬件结构形式的神经网络联系起来,使这项工作走向实用化[5]。几乎,所有现有的神经网络物理模在模式识别领域得到了成功的应用。神经网络理论所取得的一些进步都会给模式识别理论的发展带来鼓舞,相反,识别理论的深入研究和进步又会大大推动神经网络的长足发展。它们的关系是相互影响、相互渗透的。 我国语音识别研究工作起步于上世纪50年代,但近年来发展很快,研究水平也从实验室逐步走向实用。国家863[4]智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平己经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。其中,具有代表性的研究单位是清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品—PattekASR[6], 彻底结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。 目前,国际上神经网络、机器智能都是热门的课题,这些理论日新月异的发展都会给语音识别带来新的希望,所以,开展神经网络模式的语音信号识别的研究具有重要的意义和价值。 三、毕业设计(论文)所用的方法 语音识别的关键在于特征提取算法和神经网络的结构设计。 语音识别一般包括几个步聚:预处理、特征提取、学习训练及语音识别。首先要做的工作是采集样本,将现实生活说话人的语音转化成计算机能够识别的波形文件(.wav),从文件中利用MATLAB 工具箱中的wavread 将语音信息读出来,显示成可以直观看到的波形。在特征提取之前所要做的是小波去噪,这样可以有效地近似还原原始信号。下一步便是特征提取,这一步非常关键,好的特征可以更容易的分类及识别,这里利用小波变换对原始信号进行特征提取,最后是样本训练,本课题中所用的是神经网络的原理,最后进行识别和精度计算。 流程如下: 预 处 理:利用小波进行去噪和端点检测。 特征提取:由于原始数据含有较多的冗余信息,并且数据量太大,所以利用小波变换对原始信号进行特征提取,抽取对后续的识别有用的特征,又能降低分类器的复杂度。 训练模型:向神经网络提供一系列输入一输出数据组,通过数值计算方法和参数优化技术,使节点连接的权重因子不断调整,直到从给定的输入能产生所期望的输出。 模式匹配:以训练好的网络,对未知的样本进行预测,检验训练精度和测试精度。 四、主要参考文献与资料获得情况 [1]孙光民,童笑盈.基于神经网络的汉语孤立词语音识别.北京工业大学学报,2002,28(3):289-292. [2]B.Widrow,M.E.Hoff.Adaptive switching circuits[C].IRE WESCON Convention Record, new York,1960,IRE Part 4:96~104. [3]李继飞.神经网络模式识技术在自动售货机中的应用研究【D】长沙:湖南大学,2004年:2~4. [4]刘润生.解读国家863计划项目一语音识别技术,科技日报2001,8. [5]杨建刚.人工神经网络实用教程【M】.浙江:浙江大学出版社,2002:1~2. [6] 王炳锡,屈丹,彭煊.实用语音识别基础[M].北京:国防工业出版社,2005. [7]徐丽娜.神经网络控制.北京:电子工业出版社.2003. [8]楼顺天,施阳.基于 MATLAB 的系统分析与设计——神经网络.西安:西安电子科技大学出版社.1999. 五、指导教师审批意见 签字: 年 月 日

因篇幅问题不能全部显示,请点此查看更多更全内容

Top