汉语语音合成.doc

汉语语音合成.doc

ID:59151721

大小:46.00 KB

页数:6页

时间:2020-09-11

汉语语音合成.doc_第1页
汉语语音合成.doc_第2页
汉语语音合成.doc_第3页
汉语语音合成.doc_第4页
汉语语音合成.doc_第5页
资源描述:

《汉语语音合成.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、汉语语音合成技术综述学生姓名:张超学号:指导教师:张石清摘要:汉语语音合成技术经历了三十几年的发展,涌现出许多新技术、新模式。首先介绍了汉语语音合成系统的原理,在综合对比目前所有语音合成技术的基础上,以效果较好的合成技术为重点,对汉语语音合成系统的文本分析、韵律控制、语音合成、语料库的建立4个关键性模块的实现技术进行了详细论述。关键词:语音合成;文本分析;韵律控制;语料库1. 课题背景随着计算机、智能手机等电子设备的发展,较为成熟、人性化的发音功能已经成为一个普遍的用户需求,因此语音合成技术亟待发展。英语语音合成系统经过几十

2、年的发展已经形成了一个比较完备的模式,并且取得了较好的发音效果。而汉语语音合成系统由于汉语独特的发音特点,一直未取得令人满意的合成效果。随着近十几年的研究探索,尤其是国内相关科研机构及公司研发力度不断加强,涌现出了许多新理论、新技术,合成的汉语语音在自然度方面也取得了较大的进步。但不同的开发者各自为营,采用的思想、模式有一定的差别,对汉语语音合成系统的发展造成了一定的阻碍。本文将从汉语语音合成系统的基本原理出发,详细论述关键模块的技术特点,最后在分析比较的基础上,针对不同的应用环境提出了较为通用的开发方案。2.语音合成系统的

3、原理最初的语音合成方法是基于规则的合成方法,这种方法采用数字信号处理的技术,将发声过程看作一个模拟声门状态的源,以激励一个表征声道谐振特性的时变数字滤波器,主要用波形叠加的方法模拟人的声带、口腔等器官。后来随着语音合成技术的发展,拼接语音合成技术因为具有相对高质量的合成效果,基于规则的合成方法逐渐淡出了主流技术舞台,所以本文不再探讨基于规则的合成方法,而是对目前应用广泛的拼接语音合成技术进行详细论述。基于拼接思想的汉语语音合成系统基本上借鉴了起步早且发展比较成熟的英语语音合成系统的发音模式,但由于汉语自身的特点,系统又有一些

4、不同,如增加了分词模块等。汉语语音合成系统的流程图如图1所示。首先系统读取所要发音的文本,由于汉语的词语与词语之间没有如英文中单词之间的空白来分隔,因此要根据制定好的文本分析规则对文本进行分析,以便经过语音合成后输出的语音在词与词之间加入适当的停顿,模仿人在朗读文章时的效果。接着为了使合成的语音具有较好的自然度,需要按照一定的韵律模型对发音的韵律进行分析、控制,以修饰原始的语音数据。最后按照相对应的拼接算法将不同的发音基本元素迸行拼接合成,从而获得整个文本的发音文件,实现语音输出的功能。3.汉语语音合成系统的关键技术3.1文

5、本分析文本分析的难点在于向文本加入适当的停顿,以此来模拟人在发音时的停顿效果,从而更好地实现汉语语意的表达。语句中的停顿主要包括词语之间的停顿和标点符号之间的停顿两种,标点符号的停顿是固定的,所以只要识别出即可实现。而词语的识别则需要一定的分词方法才能实现。目前的汉语的分词方法主要有无词库分词方法、有词库分词方法和基于统计学原理的可训练分词方法。3.2韵律控制汉语语音的韵律包含了系统的感知信息和说话人的意图信息,在帮助听者理解语言及意图时十分有用。从听觉的角度出发,常常利用音长、音强、音高和音色4个语音听觉特征来描述韵律信息

6、。要实现汉语的韵律控制,需要建立合适的韵律模型。韵律模型以文本分析的结果为输入,完成从韵律符号到韵律的声学参数的转换,如音高、音长、音强等。韵律模型是文语转换系统中的重要组成部分,对合成语音的自然度起着至关重要的作用,要使文语转换系统能够产生接近自然语言的语音效果,建立完备的韵律模型是关键所在。建立韵律模型的方法主要分为基于规则的方法和基于统计原理学习的方法两种。3.3语音拼接合成经过了文本分析和韵律修饰两步之后,语音合成最后的工作就是把若干个与文本相对应的独立的语音文件合成一个语音文件,从而实现语音输出。目前主流的汉语语音

7、拼接合成技术可以细分为基于语音编码的拼接合成技术和基于波形拼接的合成技术。3.3语音语料库的建立语音语料库作为目前主流的语音拼接合成技术的重要组成部分,对整个语音合成系统发言的效果有很大的影响。一个高质量的语料库可以为系统提供良好的语音源文件支撑,从而实现高自然度的发言。汉语自成独立语系,具有独特的规则结构和鲜明的特性。目前在语音合成方面对于汉语的发言单位的选取主要有两种观点。第一种观点是基于音节的合成技术,把每个汉字的发言作为基本的发言单元,不考虑汉语发言的具体细节,而是建立一个巨大的语料库,其中基本囊括所有汉字的发音样本

8、,针对不同的汉字直接从语料库中搜索出相对应的发音进行拼接,从而实现发音。第二种观点是基于音素的合成技术,把每个汉字的发音再进行细分,获得汉语的音素,再把音素作为基本的发音单元,语音合成时对音素进行拼接,从而实现发音。基于音素的合成技术具体又分为两个方面:一方面认为汉语为单音节字,由若干独立

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。