面向情感语音转换的韵律转换方法-论文.pdf

面向情感语音转换的韵律转换方法-论文.pdf

ID:57925756

大小:473.12 KB

页数:8页

时间:2020-04-16

面向情感语音转换的韵律转换方法-论文.pdf_第1页
面向情感语音转换的韵律转换方法-论文.pdf_第2页
面向情感语音转换的韵律转换方法-论文.pdf_第3页
面向情感语音转换的韵律转换方法-论文.pdf_第4页
面向情感语音转换的韵律转换方法-论文.pdf_第5页
资源描述:

《面向情感语音转换的韵律转换方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第39卷第4期声学学报、,01.39,No.42014年7月ACTAACUSTICAJu1.,2014面向情感语音转换的韵律转换方法术李贤於俊(1中国科学技术大学自动化系合肥(2中国科学院合肥智能机械研究所合肥230027)(3语音及语言信息处理国家工程实验室合肥230027)2013年3月15日收到2013年6月30日定稿摘要面向情感语音转换,该文提出了一种韵律转换方法。该方法包含基频转换和时长转换两个部分,前者选择离散余弦变换(DCT)参数化基频,根据基频的层次结构特点,将基频分解为短语层和音

2、节层两个层次,使用基于混合高斯模型(GMM)的转换方法对两个层次分别进行转换;后者使用基于分类回归树(CART)的方法以声韵母为基本单位对时长进行转换。一个包含三种基本情感的语料库用作训练和测试,客观评测以及主观评测实验结果显示该方法可有效进行情感韵律转换,其中悲伤情感在主观实验中达到了接近100%的正确率。汪PACS数:43.72增;iProsodyconv福ersionformandarinemotionalvoiceconversion23LIXian,。YUJun,3WANGZengfu,

3、。,。(1Dept.ofAutomation,UniversityofScience&TechnologyofChinaHefei230027)(2InstituteofIntelligentMachines,ChineseAcademyofSciencesHei230027)(3NationalEngineeringLaboratoryofSpeechandLanguageInformationProcessingHefei230027)ReceivedMar.15,2013RevisedJun

4、.30,2013AbstractAprosodyconversionmethodwasproposedfortransformingneutralspeechtosomerequiredtargetemotion,inwhichFOWaSmodeledbYDCTandconvertedbyGMM—basedmethodatbothphraselevelandsyllableleve1.whiledurationwasconvertedbyCART-basedmethodatphonemeleve1

5、.Acorpusconsistedofthreebasisemotionswonusedfortrainingandtesting.ObjectiveevaluationandThelisteningtestresultsshowedthatourmethodcanconvertemotionalprosodyefectively,thesademotionconversionachievedaccuracyofnearly100%inlisteningtest.影响语音情感的特征包括韵律和音质特

6、征[1]-其中韵律特征包含基频和时长。在语音转换领域,已经引言有大量关于频谱转换的工作[2-4],这些可以直接借鉴到情感语音转换来进行音质转换;然而对基频特征随着语音合成技术的发展,合成出高质量的语的转换最常使用的方法是以帧为单位的线性变换方音已经不是一个难题,然而目前基于大语料库的语法【引,即音合成方法并不能有效应用到情感语音合成,对于,f:+t(1)(7s情感语音,势必需要更大的语料库。相比较而言,语音转换使用一个小型语料库可实现从中性语音到情其中,。,t,,分别为源语音和目标语音的基感语音的

7、转换。频均值和标准差,由于情感语音基频的复杂性,这并木安徽省科技攻关计划语音专项(11010202192)、国家自然科学基金(61303150)、安徽省自主创新专项资金智能语音技术研发和产业化专项(13Z02008)和中国博士后科学基金(2012M521248)资助510声学学报2014益不能有效的进行转换。另外对于时长特征,采用得最文的方法将音节的浊音部分作为基频建模的最小单多的是不进行改变或进行等比例变换。近来,已有一位,在层次上将基频分解为短语层和音节层两个层些关于情感韵律转换的工作,陶建华

8、等[。]使用pitch次,分别采用DCT参数化,使用两个GMM转换模target模型描述基频,基于GMM和CART的普通话型分别对短语层和音节层进行转换。基频转换以及对时长特征的等比变换,Chung-Hsien同时本文还对时长特征的转换进行了初步的研、vu等【】使用层级结构模型描述基频,基于回归树聚究,以声/韵母为基本单位,使用基于CART的方法类的普通话基频转换以及基于GMM的时长变换,根据输入(中性语音)时长以及上下文特征预测输出ZeynepInanoglu等[8]基于HMM和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。