基于hmm的可训练中文语音合成

基于hmm的可训练中文语音合成

ID:5267656

大小:480.41 KB

页数:7页

时间:2017-12-07

基于hmm的可训练中文语音合成_第1页
基于hmm的可训练中文语音合成_第2页
基于hmm的可训练中文语音合成_第3页
基于hmm的可训练中文语音合成_第4页
基于hmm的可训练中文语音合成_第5页
资源描述:

《基于hmm的可训练中文语音合成》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中文信息学报第20卷第4期JOURNALOFCHINESEINFORMATIONPROCESSINGVo.l20No.4文章编号:1003-0077(2006)04-0075-07*基于HMM的可训练中文语音合成吴义坚,王仁华(中国科学技术大学,安徽合肥230026)摘要:本文将基于HMM的可训练语音合成方法应用到中文语音合成。通过对HMM建模参数的合理选择和优化,并基于中文语音特性设计上下文属性集以及用于模型聚类的问题集,提高其建模和训练效果。从对比评测实验结果来看,9815%的合成语音在改进后其音质得到改善。此外,针对合成语音节奏感不强的问题,提出了一种基于状态和声韵母单元的两层模

2、型用于时长建模和预测,集外时长预测RMSE由29156ms降为27101ms。从最终的合成系统效果来看,合成语音整体稳定流畅,而且节奏感也比较强。由于合成系统所需的存贮量非常小,特别适合嵌入式应用。关键词:计算机应用;中文信息处理;语音合成;HMM;可训练语音合成;时长模型中图分类号:TP391文献标识码:AHMM2basedTrainableSpeechSynthesisforChineseWUYi2jian,WangRen2hua(UniversityofScienceandTechnologyofChina(USTC),Hefe,iAnhui230026,China)Abstra

3、ct:Inthispaper,theHMM2basedtrainablespeechsynthesiswasappliedforChineseapplication.Theappro2priateHMMparametersareselectedandoptimized,andthecontextualfeaturesandcorrespondingquestionsetfortree2basedHMMclusteringaredesignedbyconsideringthecharacteristicsofChinese,toimprovetheeffectofHMMmodelinga

4、ndtraining.Fromtheevaluationresults,thepreferencescoreofthesyntheticspeechaftertheaboveim2provementis98.5%.Furthermore,inordertoimprovetherhythmofsyntheticspeech,atwo2levelbasedmodelisin2troducedfordurationmodelingandprediction,andthedurationpredictionRMSEwasimprovedfrom29.56msto27101ms.Fromthee

5、valuationresultsofthefinalsystem,thesyntheticspeechisstable,fluentandrhythmed.Asthespeechsynthesissystemonlyrequiresverysmallstorage,itisspeciallyfitforembeddedapplicationKeywords:computerapplication;Chineseinformationprocessing;speechsynthesis;HMM;trainableTTS;durationmodeling1引言[1,2]基于大语料库的拼接合

6、成方法是近年来语音合成中主流方法。其基本原理就是根据输入文本分析得到的信息,从预先录制和标注好的语音库中挑选合适的单元,然后拼接得到最终的合成语音。由于最终合成语音中的单元都是直接从音库中复制过来的,其最大的优势就是在于保持了原始发音人的音质。在现在合成音质和自然度都不错的情况下,人们对合成系统提出了更多的需求)))多样*收稿日期:2005-07-15定稿日期:2006-06-02基金项目:国家自然科学基金资助项目(60475015)作者简介:吴义坚(1981)),男,博士研究生,主要研究方向为语音合成.75化的语音合成,包括多个发音人、多种发音风格、多种情感表达等。虽然大语料库拼接合

7、成系统的效果不错,但是也存在不少缺陷,比如:合成语音的效果不够稳定,音库构建周期太长以及合成系统的可扩展性较差等,这些缺陷明显限制了它在多样化语音合成方面的应用,因此,近[3]年来基于隐马尔可夫模型(HMM)的可训练语音合成方法被提出并逐渐得到应用。[4][5][6]针对基于HMM的可训练语音合成应用,包括IBM、Microsoft和NIT等不同的研究机构提出了几种不同的实现技术和方法,它们的共同点就是都是基于HMM对语音参数进行建模,然后利用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。