基于神经网络的蒙汉机器翻译研究

基于神经网络的蒙汉机器翻译研究

ID:17923009

大小:1.84 MB

页数:53页

时间:2018-09-10

基于神经网络的蒙汉机器翻译研究_第1页
基于神经网络的蒙汉机器翻译研究_第2页
基于神经网络的蒙汉机器翻译研究_第3页
基于神经网络的蒙汉机器翻译研究_第4页
基于神经网络的蒙汉机器翻译研究_第5页
资源描述:

《基于神经网络的蒙汉机器翻译研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10135论文分类号:TP391学号:20154019009研究生类别:全日制硕士学位论文基于神经网络的蒙汉机器翻译研究AStudyonMongolian-ChineseMachineTranslationBasedonNeuralNetwork学科门类:工学一级学科:计算机科学与技术学科、专业:计算机应用技术研究方向:自然语言信息处理申请人姓名:乌云塔那指导教师姓名:王斯日古楞二〇一八年四月十日内蒙古师范大学硕士学位论文中文摘要随着信息交流需求的增加及国家民族地区稳定的需求,蒙汉机器翻译的研究及应用迫在眉睫。蒙汉机器翻译的研究对推动内蒙古自治区的信息化,促进自治区社会进步和经济发

2、展,繁荣和发展少数民族文化教育科技事业有着重要的意义。近年来神经机器翻译取得迅速发展,已经取代统计机器翻译成为新的主流技术。针对蒙古语言自身特征,结合机器翻译的最新方法,本文开展了基于神经网络的蒙汉机器翻译研究,主要做了以下几个方面的工作。(1)利用TensorFlow搭建了蒙汉端到端神经机器翻译系统。该系统的框架为“编码器-解码器”框架,其中编码器和解码器都使用循环神经网络。然后在该系统上做了词级别的蒙汉机器翻译实验,其最优的评测结果的NIST值和BLEU值分别为8.9223和0.6067。(2)常规神经机器翻译模型使用固定大小的词汇表,蒙古语是黏着性语言,其形态变化丰富,存在词根相同的名

3、词和动词的许多变形形式,表示相似的概念,相同词根的不同变形形式被训练成不同的单元,从而增加了神经机器翻译的词汇词典的规模。为了权衡蒙古文形态丰富的特点和神经机器翻译的词汇表受限问题,本文采用短语翻译和CRF相结合的统计切分方法来切分蒙古文。首先采用基于短语的统计机器翻译模型切分蒙古文词,然后采用条件随机场模型来切分未登录词。(3)切分蒙古文后,将蒙古文词干、构形附加成分和分写附加成分等形态信息融入到蒙汉神经机器翻译中,研究了基于词素的蒙汉神经机器翻译。实验表明,基于词素的神经机器翻译优于基于词的翻译,其最优模型的NIST值和BLEU值分别达到了9.4216和0.6320。关键词:蒙汉神经机器

4、翻译,“编码器-解码器”结构,注意力机制,蒙古文词切分内蒙古师范大学硕士学位论文ABSTRACTWiththeincreasingdemandforinformationexchangeandtheneedofstablenationalethnicareas,theresearchandapplicationofMongolian-Chinesemachinetranslationisimminent.ThestudyofMongolian-Chinesemachinetranslationhavegreatsignificancetopromotetheinformatizationof

5、InnerMongoliaAutonomousRegionandfacilitatethesocialprogressandeconomicdevelopmentoftheautonomousregion,prosperanddeveloptheculturalandeducationalcauseofethnicminoritiesandprogressofscienceandtechnology.Inrecentyears,therapiddevelopmentofneuralmachinetranslationisexpectedtoreplacestatisticalmachinet

6、ranslationasthenewmainstreamtechnology.AccordingtothecharacteristicsofMongolianlanguageandthelatestmethodofmachinetranslation,westudytheMongolian-Chinesemachinetranslationbasedonneuralnetwork.Thisarticlemainlydoesthefollowingresearchwork.(1)UsingTensorFlowtobuildtheMongolian-Chineseend-to-endneural

7、machinetranslationsystem.TheframeworkofthissystemistheEncoder-Decoderframework,TheencoderandDecoderbothuserecurrentneuralnetwork.Thentheword-levelMongolian-Chinesemachinetranslationexperimentwasdoneonthissy

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。