统计参数语音合成中的基频建模与生成方法研究.pdf

ID：50150789

大小：8.32 MB

页数：77页

时间：2020-03-07

资源描述：

《统计参数语音合成中的基频建模与生成方法研究.pdf》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、UniversityofScienceandTechnologyofChina硕士学位论义论文题目统计参教语告合成中的基频建模与生成方法研尧明作者姓名信息与通信工程学科专业凌震华到教授导师姓名二〇一五年五月完成时间?S辞苓在名大達硕士学位论文统计参数语音合成中的基频建模与生成方法研究作者姓名：高丽学科专业：信号与信息处理导师姓名：凌震华副教授完成时间：二〇一五年五月UniversityofScienceandTechnologyofChinaAdissertationformaster'sdegreeResearchonthemodelingandGenerat

2、ionofFundamentalFrequenciesinStatisticalParametricSpeechSynthesisAuthor:LiGaoSpeciality?SignalandInformationProcessingSupervisor:AssociateProfessorZhenhuaLingFinishedTime:May,2015中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文，是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外，论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究

3、所做的贡献均已在论文中作了明确的说明。作者签名：高冲签字日期：中国科学技术大学学位论文授权使用声明作为申请学位的条件之一，学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权，即：学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅，可以将学位论文编入《中国学位论文全文数据库》等有关数裾库进行检索，可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。公开□保密年作者签名：逾导师签名签字日期：減签字日期摘要摘要基于隐马尔科夫模型（的统计

4、参数语音合成是当今主流的语音合成方法之一。该方法在训练阶段利用录制的语音数据库，建立描述不同上下文环境下频谱、基频等声学特征分布的统计声学模型；在合成阶段，该方法依据输入文本的上下文信息，从训练的统计声学模型中生成声学特征，最终通过参数合成器重构语音波形。相对单元挑选与波形拼接合成方法，基于的参数合成方法具有系统构建自动化程度高、合成语音平滑流畅、系统尺寸小等优势，但是其合成语音的自然度仍有待提高。基频描述了浊音产生过程中声带震动的频率，是一种重要的语音声学特征。在基于的参数语音合成中，基频特征的预测性能对于合成语音的自然度有着直接的影响。此外，基频特征的差异对

5、于体现情感语音合成中的不同目标情感也起到重要作用。相对频谱特征，基频特征是一种超音段特征，长时的基频轨迹形状受到语调、短语边界、轻重读等韵律属性的影响。而传统基于的参数语音合成使用和频谱类似的基频特征提取尺度和建模方法，忽略了基频的长时特性，影响了合成语音的自然度。本文围绕统计参数语音合成中的基频建模与生成方法开展研究工作，使用长度规整基频矢量、目标通近特征等音节层表征作为基频特征，实现了基于目标逼近特征的基频建模，提出了基于音节层特征的生成基频后处理方法，提高了合成语音的自然度。此外，本文还进一步将基于目标逼近特征和高斯双向联想存器（的后处理方法应用于合成语音

6、的情感转换，对于高兴和生气情感，取得了优于传统的模型自适应方法的转换后语音情感表现力。本文的具体内容组织如下：第一章是绪论，将简要回顾语音合成技术的发展史，并介绍现阶段语音合成的主流方法、情感语音合成、以及基频的相关背景知识。在第二章将介绍基于的参数语音合成方法，包括方法概述、训练端与合成端的核心算法、存在问题分析等，最后阐述了本文研究内容的动机与出发点。第三章具体介绍基于目标逼近特征的基频建模方法。该方法在训练阶段利用目标逼近模型对音节层的基频轨迹进行参数化处理，然后构建聚类决策树来描述不同上下文环境下的目标逼近特征分布；在合成阶段，该方法从预测的目标逼近参数

7、中恢复音节基频轨迹，并结合传统方法生成的频谱特征恢复语音波形。实验结果表明了该方法可以生成较为自然的合成语音，也指出了其存在对于基频轨迹细节丢失的问题。第四章具体介绍基于音节层特征的生成基频后处理方法。该方法在训练阶摘要段首先提取传统合成方法预测基频以及录音语料中的自然基频所对应的音节层基频特征，包括基频矢量特征和目标逼近特征等，然后构建从预测基频音节层特征向自然基频音节层的特征映射的后处理模型，包括全局方差均衡化、、残差补偿模型等；在合成阶段，该方法对传统方法预测的基频轨迹进行后处理，以得到最终的基频生成结果。主观实验结果表明该方法可以有效提高合成语音的自然度

8、。第五章具体介绍基于目标

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 77



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

统计参数语音合成中的基频建模与生成方法研究.pdf

统计参数语音合成中的基频建模与生成方法研究.pdf

相关文章

相关标签