欢迎来到天天文库
浏览记录
ID:35186153
大小:4.54 MB
页数:52页
时间:2019-03-21
《汉语简单名词短语的识别及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、乂產键是大葦D化IANUNIVERSITYOFTECHNOLOGYli巧王等值巧交MASTE民乂LDISSERTATION’?'Il汉语简单名词短语的识別及应用学科专业___进算租应思技龙____作者姓名困__雪_指导教师_____复整报__教援2〇l66答辩日期__^_j_硕±学位论文汉语简单名词短语的识别及应用民econitionandAHcationofChineseSimleNounPhrasegppp:作者姓名因雪学科、专业:计算机应用技
2、术170:21309学号指导教师;黄德根教授完成日期:2016年6月7日乂么巧义乂緣DalianUniversitofTlyechnoogy大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中己经注明引用巧容和致谢的地方外,本论文不包含其他个人或集体己鐘发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处.,本人愿意承担相关法
3、律责任。'^^:么、切A巧1学位论文题目义?Ik-爲巧麥(可每表-r乃日【《名作者签名:I期:年月文日专大连理工大学硕-上学位论文摘要名词短语在句子中常常担任主语、宾语或定语等重要句法成分,其识别是自然语言一处理领域的基础任务,。汉语简单名词短语作为种特殊类型的名词短语兼具结构简单性和语义准确性,可W在完整保留句子结构信息的同时兼顾后续句法分析的需要。本文一将汉语简单名词短语的识别作为主要任务,并将其应用于项具体的深层句法分析任务。本文主要X作有:一(1)分析简单名词短语与其他类型名词短语的异同,进步明确
4、其定义及识别任务。选择中文宾州树库作为原始语料,对其进行解析,得到用于简单名词短语自动识别实验的数据集。(2)利用词、词性和语义资源信息,分别使用兰种主流的统计机器学习方法,即最大滴一、条件随机场和支持向量机模型对简单名词短语进行识别。在单模型识别基础一,,.1%的F值上进步使用叠加方法构建组合分类器提高识别结果最终达到了909。(3)在统计方法识别的基础上,针对内含并列结构型简单名词短语的特殊性,利用汉语并列成分的结构平行和语义相似特点构建识别算法。实验证明,使用该算法作为简单名词短语识别的后处理规则,可在提高识别效果的同时
5、分析简单名词短语内部的并一列成分,在定程度上解决了目前多名词并列结构难LJ识别的问题。(4)分析汉语最长名词短语自动识别精度过低的原因,应用简单名词短语作为底层信息,将最长名词短语的识别过程分解为两阶段。在当前最长名词短语识别效果最好一的单模型上进行实验,F,底层使用自动识别的简单名词短语时值提高了1个百分点;,F4个百分点W上当简单名词短语被完全正确识别时值可提高。关键词:简单名词短语;机器学习组合分类器;并列结构;--I大连理工大学硕止学位论文民ecognitionandApplicationofChine
6、seSimpleNounPhraseAbs化actThe打ou打phraseoftenactsasimporta打tsy打tactici打gredientsi打asen化neesuchas,subectobectandattributive?艮econitionofnoimhraseisthefoundationofmannaturalj,jgpylanerocessin打eldsilmguagpg.Asaspecateof打oimphraseChinesesile打
7、ounhraseyp,pp,whichhasacombinatio打ofstructuresimplicityandsemanticaccuracy,cannotonlykeepntaxana.Tistructurecomlexlbutalsomeet化eneedsofslsishsaertakesl:hepy,yyppreconitionof仁hinesesimle打ounhraseasmai打taskandaliesttoasecificsntacticgpp,
8、ppipya打alysistask.
此文档下载收益归作者所有