欢迎来到天天文库
浏览记录
ID:4132740
大小:194.51 KB
页数:3页
时间:2017-11-29
《基于gmm 的歌曲morphing 算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第36卷第24期计算机工程2010年12月Vol.36No.24ComputerEngineeringDecember2010·人工智能及识别技术·文章编号:1000—3428(2010)24—0172—03文献标识码:A中图分类号:TP391基于GMM的歌曲Morphing算法李锦珑,杨鸿武,梁青青,裴东,刘慧娟(西北师范大学物理与电子工程学院,兰州730070)摘要:针对业余歌手模仿专业歌手唱歌过程中音色不变的问题,提出一种基于高斯混合模型(GMM)的中文歌曲Morphing算法,采用GMM对语音频谱
2、建模,并通过混合业余歌手和专业歌手的语音频谱,实现歌曲的音色转换。结果显示,混合比例因子k=0或1时,ABX测试正确率均为100%,03、g,PEIDong,LIUHui-juan(CollegeofPhysicsandElectronicEngineering,NorthwestNormalUniversity,Lanzhou730070,China)【Abstract】Astheamateursinger’stimbreisnotconvertedintheprocessofvoiceimitationfromamateursingertotheprofessionalsinger,thispaperpresentsasingingvo4、iceMorphingalgorithmbasedonGaussianMixtureModel(GMM).ThespectrumparametersareextractedfromthesourceandthetargetsingingvoicesaremodeledbyGMMrespectively,andthesinging’stimbreisconvertedbymixingtheirmodelparameters.ExperimentsdemonstratethattheaccuracyofABX5、testcanbeupto100%inthecaseofk=0or1,andtheaccuracystillbehigherthan62.5%inthecaseof06、tation.【Keywords】STRAIGHTalgorithm;timbremodification;GaussianMixtureModel(GMM);singingvoiceMorphing1概述时,利用GMM对短时语音谱包络进行拟合,并对频谱进行声音转换技术是在保持语音内容信息不变的前提下对源参数化表示,从而实现按比例加入原唱的音色特征。说话人的语音信号进行转换,使之听来像目标说话人的技术。2系统设计它需要分析找出源说话人和目标说话人声音特征之间的差歌曲转换类似于特定人语音转换技术,首先对业余7、歌手别,通过修改源说话人的声学参数,使改变后的声音携带更和专业歌手的歌曲进行STRAIGHT分析,提取出它们的韵律[5-6]多目标说话人的声音特征。由于语音信号的音段特征与语音特征、频谱特征等参数,然后对输入的业余歌手的歌曲进发音器官的生理学和物理学特征紧密相连,可认为是不可改行参数修改,最后利用STRAIGHT算法进行合成。系统结构变的,因此说话人声音转换一般都是从音段特征方面进行的。如图1所示。声音转换的研究已成为目前的研究热点。文献[1]针对特定说话人情感语音考察了声音Morphing算法。文献[28、]提出了基于高斯混合模型(GaussianMixtureModel,GMM)和DFW(DynamicFrequencyWarping)的一种新的情感语音合成方法,从标准的中性语音中提取梅尔倒谱系数等情感语音参数,然后利用STRAIGHT算法进行合成。然而歌曲是一种旋律化的语言,要实现歌曲的转换,从而使合成歌曲和专业歌手一样地道,则不仅需要从描述语音韵律特征的超音段特征入手,也需要使用说话人声音转换的方法进行音色转换。在歌曲的M
3、g,PEIDong,LIUHui-juan(CollegeofPhysicsandElectronicEngineering,NorthwestNormalUniversity,Lanzhou730070,China)【Abstract】Astheamateursinger’stimbreisnotconvertedintheprocessofvoiceimitationfromamateursingertotheprofessionalsinger,thispaperpresentsasingingvo
4、iceMorphingalgorithmbasedonGaussianMixtureModel(GMM).ThespectrumparametersareextractedfromthesourceandthetargetsingingvoicesaremodeledbyGMMrespectively,andthesinging’stimbreisconvertedbymixingtheirmodelparameters.ExperimentsdemonstratethattheaccuracyofABX
5、testcanbeupto100%inthecaseofk=0or1,andtheaccuracystillbehigherthan62.5%inthecaseof06、tation.【Keywords】STRAIGHTalgorithm;timbremodification;GaussianMixtureModel(GMM);singingvoiceMorphing1概述时,利用GMM对短时语音谱包络进行拟合,并对频谱进行声音转换技术是在保持语音内容信息不变的前提下对源参数化表示,从而实现按比例加入原唱的音色特征。说话人的语音信号进行转换,使之听来像目标说话人的技术。2系统设计它需要分析找出源说话人和目标说话人声音特征之间的差歌曲转换类似于特定人语音转换技术,首先对业余7、歌手别,通过修改源说话人的声学参数,使改变后的声音携带更和专业歌手的歌曲进行STRAIGHT分析,提取出它们的韵律[5-6]多目标说话人的声音特征。由于语音信号的音段特征与语音特征、频谱特征等参数,然后对输入的业余歌手的歌曲进发音器官的生理学和物理学特征紧密相连,可认为是不可改行参数修改,最后利用STRAIGHT算法进行合成。系统结构变的,因此说话人声音转换一般都是从音段特征方面进行的。如图1所示。声音转换的研究已成为目前的研究热点。文献[1]针对特定说话人情感语音考察了声音Morphing算法。文献[28、]提出了基于高斯混合模型(GaussianMixtureModel,GMM)和DFW(DynamicFrequencyWarping)的一种新的情感语音合成方法,从标准的中性语音中提取梅尔倒谱系数等情感语音参数,然后利用STRAIGHT算法进行合成。然而歌曲是一种旋律化的语言,要实现歌曲的转换,从而使合成歌曲和专业歌手一样地道,则不仅需要从描述语音韵律特征的超音段特征入手,也需要使用说话人声音转换的方法进行音色转换。在歌曲的M
6、tation.【Keywords】STRAIGHTalgorithm;timbremodification;GaussianMixtureModel(GMM);singingvoiceMorphing1概述时,利用GMM对短时语音谱包络进行拟合,并对频谱进行声音转换技术是在保持语音内容信息不变的前提下对源参数化表示,从而实现按比例加入原唱的音色特征。说话人的语音信号进行转换,使之听来像目标说话人的技术。2系统设计它需要分析找出源说话人和目标说话人声音特征之间的差歌曲转换类似于特定人语音转换技术,首先对业余
7、歌手别,通过修改源说话人的声学参数,使改变后的声音携带更和专业歌手的歌曲进行STRAIGHT分析,提取出它们的韵律[5-6]多目标说话人的声音特征。由于语音信号的音段特征与语音特征、频谱特征等参数,然后对输入的业余歌手的歌曲进发音器官的生理学和物理学特征紧密相连,可认为是不可改行参数修改,最后利用STRAIGHT算法进行合成。系统结构变的,因此说话人声音转换一般都是从音段特征方面进行的。如图1所示。声音转换的研究已成为目前的研究热点。文献[1]针对特定说话人情感语音考察了声音Morphing算法。文献[2
8、]提出了基于高斯混合模型(GaussianMixtureModel,GMM)和DFW(DynamicFrequencyWarping)的一种新的情感语音合成方法,从标准的中性语音中提取梅尔倒谱系数等情感语音参数,然后利用STRAIGHT算法进行合成。然而歌曲是一种旋律化的语言,要实现歌曲的转换,从而使合成歌曲和专业歌手一样地道,则不仅需要从描述语音韵律特征的超音段特征入手,也需要使用说话人声音转换的方法进行音色转换。在歌曲的M
此文档下载收益归作者所有