语音合成系统中韵律参数的聚类研究new

语音合成系统中韵律参数的聚类研究new

ID:34654333

大小:74.96 KB

页数:4页

时间:2019-03-08

语音合成系统中韵律参数的聚类研究new_第1页
语音合成系统中韵律参数的聚类研究new_第2页
语音合成系统中韵律参数的聚类研究new_第3页
语音合成系统中韵律参数的聚类研究new_第4页
资源描述:

《语音合成系统中韵律参数的聚类研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音合成系统中韵律参数的聚类研究王玮蔡莲红(清华大学计算机科学与技术系北京100084)联系邮件:cliff_wang@263.net摘要表现,不同声调的基频值各不相同,从敏感的声学仪器上得出的声调频率值是千变万语音合成系统中韵律模块是由音节的化的。在语言学上,表述一个声调的音高值多个韵律特征参数组成,如音节的音高、音时,通常采用相对的物理量进行表示,即从长和幅度等,这些韵律参数有的是以单值形一个人或从几个人的声调频率中求出高低式表示如音节的音长,有的是则是序列形式曲直的相对的平均关系值来表示。然而声调如音节的音高,这里的序列指得音节本身所的音高值不是一个单一

2、的频率值而是一个具有连续频率特征。一般认为采用音节最大持续性的波段,而且在声调持续的过程中,值和最小值的平均得到基频中值可以描述从起点至终点往往又有频率的变化,语言学音高特征,但是这是依赖于语言学家的定性家认为通过对音节最大值和最小值的平均描述。本文从大量的音节基频序列中抽取数得到基频中值能够较好地描述一个声调的据,组成基频向量,通过对音节基频序列的变化规律。本文对这一问题进行了分析研进行聚类分析,说明采用基频中值作为音高究,采用动态数据聚类的方法分析基频数据特征的描述信息的合理性。的特征,并进行了实验分析,说明了这种表示方法的合理性。1.引言随着语音学和计算

3、机技术的发展,语音2.常用的聚类方法合成系统的研究已经取得了重大进展,并且聚类方法是数据分析的常用方法之一,成功地应用于许多不同的场合,但是合成系我们可以将聚类算法分成层次式和非层次统的输出语音带有浓重的机器味,与人类自式两种,非层次式聚类算法按照一定的标准然流畅的发音相比还存在一定的差距。其中将数据划分成K个聚类(K是算法要求输重要的原因是受制于人们对韵律特征和规入的期望聚类数),其中最常用的是平方差律的认识。标准,其目的在于找到使得平方差最小的K语音作为人的发声器官发出来的一种个聚类,即每个聚类内部数据点间的距离尽声波具有声音的物理特性,每一种音都具有可能

4、小,聚类间数据点的距离尽可能大。一定的音色、音调、音强和音长。音色也叫数据库中的聚类对象是例子,每个例子音质,是一种声音区别于其它声音的基本特由不同的属性构成,这些属性主要分成为两征;音调是指声音的高低,在汉语语音学中类:数值属性(NumericAttributes,可以比较称为音高,音调取决于声波的频率;声音的大小)和符号属性(CategoricalAttributes,强弱叫做音强,它是由声波的振动幅度决定不能比较大小)。在数据挖掘领域中,由于的;声音的长短叫做音长,它体现了发音持要处理非常大而复杂的数据集,所以对传统续时间的长短。的聚类方法提出两个需要尽

5、量满足的要求:语音的韵律参数也称为超音段参数,一1.能同时处理数值属性和符号属性;2.算般是指音节的音高、时长和幅度等参数,通法的效率要满足大的数据集的大数量、高复常以声音的基频表示音高,由于汉语是一种杂性、增量的要求。在现存的聚类方法中,声调语言,因此其音高值是声调中最重要的如果能同时处理数值属性和符号属性,那么特性。声调的音高值是声带基本振动频率的一般来说,效果很低;而对那些效率高的算法而言,他们大都只能处理数值属性。一般取得的是一个局部最优解。2.1神经网络方法2.3C均值方法神经网络方法中用于聚类的方法主要C均值算法是一种分割的而非分层的是SOM(Se

6、lf-OrganizingFeatureMap)神经网聚类方法,在数据分析中得到广泛的运用。络,它由输入层和竞争层组成,输入层由N其可以描述成给定的一个例子的集合X,个输入神经元组成,竞争层由m×m=M个集合X中每个属性均为数值属性,和一个输出神经元组成,且形成一个二维平面阵整数k(k≤n),算法将X分割为k个聚类列。输入层各神经元与竞争层各神经元之间实现全互连接。该网络根据其学习规则,通并使得在每个聚类中所有值和该聚类中心过对输入模式的反复学习,捕捉住各个输入距离的总和最小,每个聚类的聚类中心是每模式中所含有的模式特征,并对其进行自组个聚类的均值。织,在竞争

7、层将聚类结果表现出来,进行自C均值算法具有如下特点:1.能有效动聚类。竞争层的任何一个神经元都可以代的处理大数据集;2.经常终止于一个局部的表聚类结果。最优解;3.由于欧式距离的局限性,仅能处SOM方法是一种两阶段(制定聚类中理数值属性;4.聚类结果具有凸的外形;5.心、聚类中心的修改)基于欧式距离的反复算法的执行结果和例子的顺序有关。循环过程。显然这种方法只能针对于数值属鉴于C均值算法的特点,决定采用这种性。方式处理语音基频序列数据。SOM网络的最大局限性是,当学习模C均值算法描述如下:式较少时,网络的聚类效果取决于输入模式step1:选择把N个样本分成C个

8、聚类的先后顺序,而且网络连接权向量的初

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。