基于语音识别和语音合成的汉语语音转换技术研究

基于语音识别和语音合成的汉语语音转换技术研究

ID:37371058

大小:3.96 MB

页数:54页

时间:2019-05-22

基于语音识别和语音合成的汉语语音转换技术研究_第1页
基于语音识别和语音合成的汉语语音转换技术研究_第2页
基于语音识别和语音合成的汉语语音转换技术研究_第3页
基于语音识别和语音合成的汉语语音转换技术研究_第4页
基于语音识别和语音合成的汉语语音转换技术研究_第5页
资源描述:

《基于语音识别和语音合成的汉语语音转换技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人或集体已经发表或撰写过的研究成果,对本文的研究做出贡献的集体和个人均己在论文中作了明确的说明并表示了谢意。研究生签名:』区晦日期:论文使用和授权说明本人完全了解云南大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交学位论文和论文电子版;允许论文被查阅或借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵循此规定)研究生签名:丛

2、五鸯新签名:塑蕴日期:竺!∑:互◆(i研究生签名:丛崆鸯导师签名:笪塑!斗!日期:竺!≥:互:I(i本人及导师同意将学位论文提交至清华大学“中国学术期刊(光盘版)电子杂志社”进行电子和网络出版,并编入CNKI系列数据库,传播本学位论文的全部或部分内容,同意按《中国优秀博硕士学位论文全文数据库出版章程》规定享受相关权益。研究生签名:二鱼游导师签名:坳日期:羔鱼!≥.s。z7摘要语音转换是语音信号处理领域一个比较新颖的技术,它是改变一个说话人的语音,使之听起来像是另外一个人的语音的技术。这项技术结合了语音信号处理领域的各种技术,如语音信号分析

3、,语音识别,语音合成,语音增强等。本文以开发汉语语音转换系统为目的,采用HMM语音识别和语音合成方法,研究汉语语音转换技术。根据汉语的特点,本文选择声母和韵母为语音识别和语音合成的基本单元。一个完整的语音转换系统由语音识别、参数转换和语音合成三部分组成。论文的主要工作包括:1.阐述语音转换系统的框架和实验数据准备,包括在考虑声母、韵母和音节覆盖率的前提下收集挑选1000句录音语料,邀请4位发音人录制语音库,录音格式转换,语音校对,对语音库中的语句进行语音识别,并从语音识别结果中提取声韵母时间信息。2.对语音识别结果进行人工校对、调整,在对

4、声母时长进行统计的基础上产生韵律标记,生成单音子和三音子训练标注文件,为训练HMM合成器设计上下文属性和问题集,并在HTS一2.0平台进行HMM合成器的训练。3.按上述方法,产生两个说话人的HMM模型,将待转换语句的标注文件分别通过两个模型产生声学参数,再利用插值的方法生成第三人,也称为“虚拟人”的声学参数。4.将生成的“虚拟人”的参数通过STRAIGHT语音合成器产生语音波形,并对常规语音合成的语句和经过参数转换后产生的语句分别进行MOS评测和ABX评测。语音合成器的自然度和语音参数转换算法是本文语音转换效果的决定因素。实验结果表明:(

5、1)本文语音合成器的初步MOS主观评测平均为集内4.2,集外3.9,说明语音合成的自然度己基本到达可以接受的水平。(2)采用声学参数插值实现语音转换后,经过ABX主观评测,结果表明该系统能够实现语音转换功能,可以控制转换后的语音更偏向两个源说话人中的某一个,且能综合两个源说话人摘要的个性特征信息。关键词:语音识别;语音转换;语音合成;隐马尔科夫模型;参数差值IlAbstractVoiceconversionisarelativelynewtechnologyinthefieldofspeechsignalprocessing,itisto

6、changeaspeaker’Svoice,SOthatsoundsliketheotherone’Svoice.Thistechnologycombinesavarietyoftechniquesinthespeechsignalprocessingfield,suchasthevoicesignalanalysis,speechrecognition,speechsynthesis,speechenhancementandSOon.Inthispaper,forthepurposeofdevelopingChinesespeechco

7、nversionsystemweusetheHMMspeechrecognitionandspeechsynthesismethodstostudyChinesespeechconversiontechnology.AccordingtothecharacteristicsofChinese,wechoiceinitialsandfinalsasofthebasicunitofspeechrecognitionandvoicesynthesis.Acompletespeechconversionsystemiscomposedofthre

8、eparts:thespeechrecognition,parametersconversionandspeechsynthesis.Themainworksinthispaperasfoll

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。