基于matlab的特定人语音识别软件开发与设计

基于matlab的特定人语音识别软件开发与设计

ID:20242427

大小:80.50 KB

页数:9页

时间:2018-10-11

基于matlab的特定人语音识别软件开发与设计_第1页
基于matlab的特定人语音识别软件开发与设计_第2页
基于matlab的特定人语音识别软件开发与设计_第3页
基于matlab的特定人语音识别软件开发与设计_第4页
基于matlab的特定人语音识别软件开发与设计_第5页
资源描述:

《基于matlab的特定人语音识别软件开发与设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于MATLAB的特定人语音识别软件开发与设计摘要:本文介绍了基于MATLAB的特定人语音识别软件开发方法以及GUI界面设计,阐述了具体开发设计的过程。本识别方法以Mel频率倒谱系数作为特征参量,采用DTW技术进行识别,识别效果较好。本软件仍有待改进的地方,如:在有背景噪声的条件下如何提高识别率。关键词:MATLAB;语音识别;Mel频率倒谱系数;DTW;GUI中图分类号:TN912.34文献标识码:A文章编号:1007-9416(2017)04-0170-031引言语音识别主要指让机器听懂人说的话,即在各

2、种情况下,准确的识别出语音的内容,从而根据其信息,执行人的各种意图[1]。当今,语音识别产品在人机交互应用中,已经占到越来越大的比例。语音识别系统根据对说话人的依赖程度,可以分为特定人和非特定人语音识别系统[2]。本文提出一种基于MATLAB的特定人语音识别系统,通过测试,能够达到试验要求。2系统功能及子模块介绍基于MATLAB的特定人语音识别软件开发与设计摘要:本文介绍了基于MATLAB的特定人语音识别软件开发方法以及GUI界面设计,阐述了具体开发设计的过程。本识别方法以Mel频率倒谱系数作为特征参量,采

3、用DTW技术进行识别,识别效果较好。本软件仍有待改进的地方,如:在有背景噪声的条件下如何提高识别率。关键词:MATLAB;语音识别;Mel频率倒谱系数;DTW;GUI中图分类号:TN912.34文献标识码:A文章编号:1007-9416(2017)04-0170-031引言语音识别主要指让机器听懂人说的话,即在各种情况下,准确的识别出语音的内容,从而根据其信息,执行人的各种意图[1]。当今,语音识别产品在人机交互应用中,已经占到越来越大的比例。语音识别系统根据对说话人的依赖程度,可以分为特定人和非特定人语音

4、识别系统[2]。本文提出一种基于MATLAB的特定人语音识别系统,通过测试,能够达到试验要求。2系统功能及子模块介绍基于MATLAB进行语音识别软件的开发与设计,识别过程分为录入语音、预处理、端点检测(即提取语音)、提取语音特征参数、与模板库中的特征参数逐一进行比较,然后选取失真测度最小的作为识别结果输出,其流程图如图1所示。2.1录入语音MATLAB中录入语音可以通过wavrecord函数来录入语音。2.2预处理预处理包括预加重、分帧、对语音信号加(1)预加重。预加重就是把语音信号乘以一个高通滤波器,用来

5、对语音信号进行高频率提升,高通滤波器用一阶FIR滤波器来实现,公式为:预加重对于语音信号有两个作用:①增加一个零点,用来去除声门脉冲的高频频谱下跌,使得语音信?频谱变得更加平滑,所提取的语音特征符合原始声道模型:②由于是乘以一个高通滤波器,不但对高频提升外,还把低频部分也进行衰减,同时降低基频对共振峰的检测的干扰。(2)分帧。由于语音信号是时变的,处理时变的信号计算非常复杂,也不容易观察到语音信号的特征。但是在很短的时间内,即10ms-30ms内,语音信号可以看成非时变的。这就用到了语音的分帧技术。如果两帧

6、不重叠,可能有一个跳变。为了使其平稳过渡,在相邻两帧设置重叠部分。3)加语音信号经过采样后为,实际上是无限长的,需要处理的量将会很大。但进行分帧处理过后相当于乘以一个有限长的窗函数,这样就可以很好的进行运算。加窗函数的数学表达式为:函数一般具有低通特性,窗函数的不同将会有不同的带宽和频谱泄漏。在语音分析中常用到的窗函数为矩形窗,汉明窗(Hamming)和海宁窗(Hanning)。本文采用的是汉明2.3端点检测在说话人识别的技术中,端点检测的好坏不仅关系到计算量的大小,而且关系到识别的准确率。端点检测的方法有

7、如下几种:短时能量法、短时过零率、短时自相关函数、双门限端点检测、能熵比端点检狈J。本文采用双门限检测法,该方法结合了短时过零率和短时能量法两种方法。在开始进行端点检测前,首先为短时能量和过零率分别确定两个门限。一个是较低的门限,其数值较小,对信号的变化较敏感,很容易被超过。另一个是比较高的门限,数值较大,信号必须达到一定的强度,该门限才可能被超过。2.4语音特征参数提取语音信号的特征参数提取主要是提取每个人的发音特征,个性特征。这些特征经过语音处理所表现的就是共振峰,基音频率,频谱,平均基频,说同一句子时

8、间长短的差异。而语音信号的特征提取就是要把这些参数提取出来,在训练阶段作为模板训练,形成模板库保存起来。在识别阶段,把测试语音的特征参数提取出来,与原来形成的模板库中的数据进行比较,最后识别说话人身份。选取特征参数的好坏直接影响到以后识别的准确率,因此如何准确完整的提取语音特征参数是当今说话人识别所面临的一个难题。在众多的特征参数方法中,经过比较最后选定MFCC(Mel倒谱系数)做为特征提取的方法。它能很好的反应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。