基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用

基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用

ID:35067347

大小:5.93 MB

页数:81页

时间:2019-03-17

基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用_第1页
基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用_第2页
基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用_第3页
基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用_第4页
基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用_第5页
资源描述:

《基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用作者姓名潘炜深学科专业信号与信息处理指导教师金连文教授所在学院电子与信息学院论文提交日期2016年4月HandwritingWordRetrievalAlgorithmsandApplicationstoHistoricalDocumentsusingDeepLearningMethodADissertationSubmittedfortheDegreeofMasterCandidate:PANWeishenSupervisor

2、:Prof.JINLianwenSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP391学校代号:10561学号:201320109170华南理工大学硕士学位论文基于深度学习的手写英文单词检索算法研究及其在历史文本上的应用作者姓名:潘炜深指导教师姓名、职称:金连文教授申请学位级别:工学硕士学科专业名称:信号与信息处理研究方向:智能信息处理与模式识别论文提交日期:2016年4月20日论文答辩日期:2016年6月3日学位授予单位:华南理工大学学位授

3、予日期:2016年月日答辩委员会成员:主席:杨丰教授委员:黄庆华教授薛洋副教授黄双萍副教授华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研巧成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:曰期^〇;2〇&年^月曰;|冻系^/^学位论文版权使用授权书本学位论

4、文作者完全了解学校有关保留、使用学位论文的规定,艮P;研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可W公布学位论文的全部或部分内容,可W允许采用影印、缩印或其它复制手段保存、汇编学位论文一。本人电子文搜的内容和纸质论文的内容相致。本学位论文属于:□保密,在年解密后适用本授权书。保密,,同意在校园网上发布供校内师生和与学校有共享协议的单位

5、浏览;同意将本人学位论文提交中国学术期刊(光盘版)电子杂志社全文出版和编入CNKI《中国知识资源总库》,传播学位论文的全部或部分内容。上相应方框""(请在W内打V)作者签名:曰期:人指导教师签名心日期茄K.乙、多作者联系电话:电子邮箱:联系地址(含邮编):?‘,..摘要信息的高效检索在当今信息快速增长的时代变得越来越重要。对珍藏在世界各地的宝贵历史资源进行快速检索定位,合理挖掘和使用这些潜在的有效历史信息是信息检索领域的一个重大研究课题。信息检索技术一方面能

6、帮助我们快速地查找有用的资讯,减轻用户的搜索压力;另一方面也让我们迅速了解到前人有价值的研究工作。传统的基于光学字符识别的检索技术虽然在信息检索领域上取得了一系列丰硕的成果,但随着检索的信息越来越复杂,搜索的对象失真程度越来越大,传统的光学字符识别技术已经不适合未来快速准确检索的应用需求。本文将以深度学习理论作为主要的工具,结合目前的信息检索算法,从基于匹配的角度和基于识别的角度两个方面对历史文本上的手写英文单词检索进行研究。主要的研究工作和贡献包括如下:1.完成了英文单词图片的多特征提取,其中包括

7、梯度直方图特征(HistogramofOrientedGradients,HOG),局部二进制模式特征(LocalBinaryPatterns,LBP)和基于空间金字塔的多尺度梯度直方图特征(SpatialPyramidHOG,SPHOG)。2.实现基于度量学习的单词匹配算法。使用两种不同的网络结构:多层感知器(MultilayerPerceptron,MLP)和卷积神经网络(ConvolutionalNeuralNetwork,CNN)衡量两张英文单词图片的相似度。在使用CNN时,分别采用双通道卷

8、积神经网络,Siamese网络和Pesudo-Siamese网络进行对比实验。3.结合卷积神经网络和双向长短型记忆递归神经网络(BidirectionalLongShortTermMemoryRecurrentNeuralNetwork,BLSTM),实现基于文本行的无分割单词检索。使用CNN自动学习文本行图片的时序特征,然后利用BLSTM对文本行的英文单词进行无分割地识别,从识别的角度实现英文单词检索的功能;4.在两种不同规格的数据集GeorgeWashington

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。