统计参数情感语音合成的研究

统计参数情感语音合成的研究

ID:35187270

大小:2.78 MB

页数:64页

时间:2019-03-21

统计参数情感语音合成的研究_第1页
统计参数情感语音合成的研究_第2页
统计参数情感语音合成的研究_第3页
统计参数情感语音合成的研究_第4页
统计参数情感语音合成的研究_第5页
资源描述:

《统计参数情感语音合成的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文M.D.Thesis统计参数情感语音合成的研究Researchonstatisticalparametricemotionalspeechsynthesis郝东亮HaoDongliang二○一六年五月西北师范大学硕士学位论文摘要随着语音合成技术的研究与发展,合成语音音质得到较大提升,但当前语音合成技术的研究仍以中性化语音为主,对情感语音合成的研究较少。人类生活对智能语音的需求不仅要涵盖基本的文字内容,还要承载丰富的情感信息,情感语音合成的研究将是智能语音研究领域的必然趋势。本文建立了一个多说话人的多种情感的情感语音语

2、料库,针对汉语统计参数语音合成中的上下文相关标注生成,设计了一套包含6层上下文信息的标注格式,在此基础上,采用多说话人的情感语音数据和统计参数语音合成方法,利用说话人自适应训练算法训练了情感语音的声学模型,实现了情感语音的合成。论文的主要工作和创新如下:1.建立了一个多说话人的多种情感的语料库。在专业录音棚中,采用诱发方式激发录音人的情感,并进行录音。录制了7个男性说话人和7个女性说话人的11种典型情感的情感语音数据,并以MicrosoftWAV格式(单通道、16bit、16kHz采样频率)进行保存。2.实现了一种面向普通话统计

3、参数语音合成的标注生成算法。针对汉语统计参数语音合成中上下文相关标注的生成,设计了一套包含6层上下文相关信息的标注格式。以声韵母做为语音合成的合成基元,利用基于隐Markov模型(HiddenMarkovModel,HMM)的统计参数语音合成方法,通过对合成语音音质的主、客观评测,验证了不同上下文信息对合成语音音质的影响。实验结果表明,本文设计的上下文相关的6层标注格式能够满足情感语音合成的需求。3.提出了一种利用多个说话人的多种情感训练语料,利用统计参数语音合成方法实现情感语音合成的方法。首先利用多个说话人的情感语音语料,通过

4、说话人自适应训练(SpeakerAdaptationTraining,SAT)得到多个说话人情感语音的平均音模型,然后利用目标说话人的目标情感的训练语料,经过说话人自适应变换,得到目标说话人目标情感的声学模型,进而合成出目标说话人的目标情感语音。实验结果表明,本方法合成得到的情感语音具有较高的自然度和情感相似度。关键词:情感语音合成;情感语料库;上下文相关信息;标注格式;说话人自适应训练;统计参数语音合成I西北师范大学硕士学位论文AbstractThequalityofsynthesizedspeechmakesaremarka

5、bleimprovementwiththeprogressofspeechsynthesistechnology.However,currentresearchesofspeechsynthesistechnologymainlyfocusedonneutralspeechsynthesis.Thereisthelackofstudiesonemotionalspeechsynthesis.Theneedsforintelligentvoiceinthehumanlifenotonlycoverbasictextualinfor

6、mation,butalsocarryalargenumberofemotionalinformation.Therefore,thestudyonemotionalspeechsynthesiswillbetheinevitabletrendintheintelligentvoiceresearch.Thethesisestablishesanemotionalspeechcorpusincludingavarietyofemotionsrecordedbymulti-speaker.Thenasix-levelcontext

7、-dependentlabelformatisdesignedforgeneratingcontext-dependentlabelsofMandarinstatisticalparametricspeechsynthesis.Speakeradaptivetrainingalgorithmisemployedtotraintheemotionalacousticmodelwithmulti-speaker’semotionalspeechcorpustoachievestatisticalparametricspeechsyn

8、thesis.Themainworksandoriginalitiesofthethesisareasfollows:Firstly,thethesisestablishesamulti-speakerspeechcorpuswith11kindsofemoti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。