语音识别的翻译

语音识别的翻译

ID:32530729

大小:71.30 KB

页数:6页

时间:2019-02-11

语音识别的翻译_第1页
语音识别的翻译_第2页
语音识别的翻译_第3页
语音识别的翻译_第4页
语音识别的翻译_第5页
资源描述:

《语音识别的翻译》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、自然话语识别的字典学习斯诺波达,亚力怀贝尔互动系统实验室卡尔斯鲁厄大学-卡尔斯鲁厄,德国卡耐基梅隆大学-匹兹堡,美国摘要自然语音给语音识别增加了新任务:端点检测,人类和非人类的噪声,新词和其他非正常发音。当将一个语音识别系统应用于自然语音时,所有这些现象都需要解决。在本文中,我们将关注如何自动的将语音词典扩展和应用到自然语音识别。特别对于自然语音而言,重要的根据语音在数据库中出现的频率,而非词汇中的“正确”发音来选择一个单词的读音。因此,我们提出了一个数据加载方法,通过模拟数据库中已给出的单词把新的发音添加到已有的语音词典中。我们将展示这种程序将如何造出其他发音元组,以及一些经常被

2、错误识别的单词。我们还将讨论如何通过语音识别系统归纳已找到的发音,将知识进一步的整合到语音识别系统中。GSST已经利用JANUS2语音识别引擎和卡耐基梅隆大学与卡尔斯鲁厄大学的交互系统实验室的自然语音翻译进行了试验。1.引言对一个语音识别系统而言,语音字典是主要的知识来源之一,这保证了语音识别过程中假定的有效性。不过与声音模拟或者语言模拟相比,它往往被认为不太重要。在连续语音识别系统中,研究人员经常使用一个单词的“正确”发音,譬如这个发音可以在词典中找到。但是,这种“正确”的发音,对于一个已给的任务(尤其是自然语音),往往不是最常见的变异的读法,并且,考虑到目前的声音模拟,这种“正

3、确”的发音也不一定能带来最好的语音识别表现。如果字典中的音标与数据库中实际情况不匹配,在声学不足的训练过程中,语音单位将被损坏,而这将降低整体性能。国家文艺语音识别系统开始投入更多的努力来制作带有变异读音和缩略词的字典,这些词典同样能模拟替代发音,如协同构音词。当我们想要提高语音识别系统的整体性能时,我们特别感兴趣的是给定任务的最常见发音,更好的模拟常被错误识别的单词以及有着强烈的方言变异的单词顺序。我们将展示程序如何学习单词的发音,从而学习例如协同词那样的替代发音效果,单词的方言变异和单词顺序。2.字典学习通常是通过手工或利用语音规则来修改字典。手工调整和修改,需要一个字典专家。

4、尤其是当任务在不断增加或者系统要用于新的任务,将有大量的新单词添加到词典中,这将费时又费力。手工添加词典的条目通常关注单个单词的出现,并没有改善整体的识别性能。此外,这还容易出错。所有下面的错误都可能在手工修改时引入语音字典。·随着基本的语音单位的增加(通常介于40至100之间)和字典中的条目数的增加,在词典条目间持续应用语音单位将变得越来越困难。·专家倾向于使用“正确”的单词发音,而对于一个已给定的任务来说,这往往并不是使用最频繁,甚至不是最可能的发音。·实际发音和“正确”的发音可能很不一样。在自然语音和方言中有大量的替代发音,而这些往往不易预测。外国文字和名称的发音就是很好的例

5、子。·因为很难说哪一个变异读音对于给定任务是有统计意义上的价值性,字典的维护者很容易错过有价值的形式。如果使用语音规则来生成读音变体,规则的数目可以从几十到几千之间变化。只使用一部分规则不一定能涵盖所有的自然语音效果,另一方面,使用太多规则则可能导致过多的语音变体。即使在词典中运用了一小部分规则也会明显地增加读音数目。需要运用专家知识来限制规则的使用,否则过多的规则可能会导致假变种。最终也不能保证给定的规则能实际模拟一个单词常见的所有读音变异。因此,我们提出了一个数据加载方法来改善现有语音词典并且自动添加新的单词,假如需要的话,还可以自动添加新的读音变异。该程序应该做到:·在字典中

6、使用语音条目的的驱动性能优化,而不是一个单词的“典型”形式。·用基本的语音模型在语音词典中产生精确、一致的条目。·只有具有统计意义上的价值,才生成发音变体。·在重新优化后后能有更低的发音混乱。·能有更高的整体识别性能。我们给了一个词典学习程序的大纲,该程序目的是优化字典,使受损坏的语音单位得到更多的准确训练。在第一个实验中我们将展示,即使使用一个简单的程序来提取语音变体的候选者也会带来识别性能的显著提高。我们也将展示通过模拟单词来解决常被错误识别单词问题的实验。3.程序大纲我们把修改给定任务前的语音识别系统的训练作为一个音素识别与平滑音素。我们需要两个音素和语音识别算法来执行。我们

7、不需要他的任何标记的语音数据,但我们会需要一个字,因为它们在语音识别系统中需要被训练。此外,我们将需要以下先决条件:先决条件:1.在所有现有的语音识别训练的言论里,通过设置现有的语音识别创造字标签,来发现所有字的单词边界。2.为基础语音识别系统创建一个音素矩阵。3.创造一个语言平滑音素模型。4.分析在语音识别系统的训练和验证设置经常出现的错误。5.根据这个词的生成元组列表仿照字典。通过语音识别系统的分析,我们发现,他们往往由于简短的语句而造成错误识别。简单的术语字包含

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。