欢迎来到天天文库
浏览记录
ID:35087213
大小:5.55 MB
页数:63页
时间:2019-03-17
《汉藏双语合成语音音质评测的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文M.D.Thesis汉藏双语合成语音音质评测的研究ResearchonspeechqualityevaluationforMandarin-Tibetancross-lingualspeechsynthesis张策ZhangCe二○一六年五月西北师范大学硕士学位论文摘要跨语言语音合成能够实现在同一个语音合成系统中合成出不同语言的语音,成为了语音信号处理领域的研究热点。目前,西北师范大学已经实现了汉语普通话和藏语拉萨方言双语语音合成系统。为了研究汉藏双语跨语言语音合成系统合成的不同语言不同说话人的语音质量优劣,本论文实现了一个汉藏双语跨
2、语言的语音合成系统,在此基础上对不同语音合成方案下合成出的汉藏双语语音音质进行了主客观评测,并提出了一种利用说话人识别和语音识别对说话人相似度和合成语音音质进行评测的方法。论文的主要工作和创新如下:1.设计了汉藏双语语音合成方案,实现了一个汉藏双语跨语言语音合成系统。设计了汉语普通话和藏语拉萨方言的语音语料库、文本语料,上下文属性标注格式以及上下文相关的问题集,利用说话人自适应训练的方法训练了汉藏双语语音的声学模型,利用声码器合成出语音。2.评测了不同语音合成方案合成的汉语普通话语音和藏语拉萨方言语音的音质。采用主观评测方法和客观评测方法。主观评
3、测方法包括平均意见得分、差异平均意见得分、相对平均意见得分以及诊断押韵测试;客观评测方法包括基频参数测量、时长参数测量以及感知语音质量评估。结果表明,参加说话人自适应训练的普通话语句为110句、藏语语句为300句时,合成的汉语普通话和藏语拉萨方言语音的质量较高。3.提出了一种采用说话人识别技术评测汉藏双语跨语言语音合成系统合成的不同说话人语音相似度的评测方法。以高斯混合模型为声学模型,结合传统的短时处理技术和经验模态分解来获得声学特征,训练了一个说话人识别系统。结果表明,当参加说话人自适应训练的汉语普通话语句为110句时,合成语音的说话人识别率达
4、到88.89%,当参加自适应训练的藏语语句300句时,合成语音的说话人识别率为94.44%。4.提出了一种利用语音识别技术进行汉藏双语跨语言语音合成系统的合成语音音质评测方法。采用了5状态的连续隐Markov模型为基元的声学模型,采用13维的Mel频率倒谱系数及其一阶差分和二阶差分形成一个13×3维的特征向量来训练声学模型。结果表明,当参加说话人自适应训练的普通话语句为110句时,合成语音的语音识别率为96.41%,当参加自适应训练的藏语语句300句时,合成语音的语音识别率为91.27%。关键词:汉藏双语语音合成;主观评测;客观评测;说话人识别;
5、语音识别I西北师范大学硕士学位论文AbstractSincecross-lingualspeechsynthesiscansynthesizespeechesindifferentlanguageswithaspeechsynthesizer,ithasbeenahottopicinthefieldofspeechsignalprocessing.Currently,NorthwestNormalUniversityhasrealizedaMandarin-Tibetancross-lingualspeechsynthesissystem.The
6、thesisfirstlyrealizedaMandarin-Tibetancross-lingualspeechsynthesissystem,thenthesynthesizedspeechunderdifferentschemeswasevaluatedusingsubjectiveandobjectiveevaluationmethod.Furthermore,thethesisproposedanapproachtoevaluatethesimilaritybetweenoriginalspeakerandsynthesizedspee
7、chbyusingspeakerrecognition.Thesynthesizedspeechqualityisalsoevaluatedwithaspeechrecognitionsystem.Themainworksandoriginalitiesareasfollows:Firstly,thethesisdesignedasetofMandarin-Tibetancross-lingualspeechsynthesisschemeforsynthesizingdifferentspeech.SpeechandtextcorpusofMan
8、darinandTibetanLhasadialectwasselected.Acontext-dependentlabelformat
此文档下载收益归作者所有