基于自扩展的本体学习方法

基于自扩展的本体学习方法

ID:37665829

大小:1.73 MB

页数:55页

时间:2019-05-28

基于自扩展的本体学习方法_第1页
基于自扩展的本体学习方法_第2页
基于自扩展的本体学习方法_第3页
基于自扩展的本体学习方法_第4页
基于自扩展的本体学习方法_第5页
资源描述:

《基于自扩展的本体学习方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、东南大学硕士学位论文基于自扩展的本体学习方法姓名:蔡施彦申请学位级别:硕士专业:计算机软件与理论指导教师:高志强20070628东南大学硕士学位论文摘要语义Web是下一代Web发展的重要方向,本体(Ontology)是语义Web的核心.然而手工构建本体却非常繁琐而耗时。因此,本体学习(OntologyLearning),或自动与半自动的本体构建,成为研究的重点。按照Smab等人的定义,本体学习共分为六层,分别为术语、同义词、概念、概念层次、关系和规则。作为本体学习的第一层,术语获取(TermExtraction)是概

2、念、关系和规则学习的基础,在本体学习方法中扮演着重要角色。术语获取需要解决的主要问题是:减少人工标注训练样例的工作量,以及发现新术语。针对这两个问题,本文利用海量的Web页面,提出了两种针对不同种类页面的术语获取方法。对结构性较强的网页,本文提出了一种基丁序列覆盖算法的模板标签参数学习算法。该算法以列表页面作为输入进行规则的学习.每轮迭代都选择一个朱覆盖样例为学习对象,通过对页面标签结构的学习,在规则集中加入一条新规则.直到所有训练样例都被覆盖.返回己完成规则学习的分装器。然后使用学得的分装器,结合基于模式的术语获取

3、算法进行术语获取。对结构特征不明显的网页,本文提出了一种基于自扩展(Boot.sWapping)的术语获取方法———基于多模式评分的白扩展算法。该方法以导师提供的种子术语集合作为输入,在每一轮迭代中。算法首先采用ANNIE进行浅层自然语言处理,解析句子的主、谓、宾等句法成分以发现新的模式,然后使用新发现的模式进行候选术语获取,并使用模式的可信度评价函数对模式进行评分,选出最优模式.最后对最优模式获取的术语使用基于多模式的评价函数计算术语的领域相关度,选择lO个最佳术语放入语义词典中。这一过程不断迭代。实现术语的获取。

4、本文将模板标签参数学习算法及基于多模式评分的自扩展算法运用到语义Web的应用——DynamicView系统中.实验结果表明这两种方法可以显著减少领域专家的工作量,成功的发现新术语,同时具有较高的精度和召回率。是可行的术语获取方法.关键词,语义Web,本体学习.术语获取,白扩展东南大学硕士学位论文AbstractSemanticWebis佃eofthepromisedⅢmofWeb.ItreliesheavilyOntheformalontologicsthatstructureunderlyingdataforthe

5、purpo∞ofcomprehensiveandtransportablemachineunderstanding.ButhundlyconstructingOntologyisatediouspI_oc髂s.OntologyLearning,whichisfocued011automaticlyorsemi-automaticlyconstructingontology,boTA,mesthesignificantresearchareaofpoople.Staabproposeda6-layermodelofOn

6、tologyLearning.Frombottomtotop,the6layersareTerms,Synonym,ConceptFormation,ConceptHierarchies,RelationandRules.Asthefirstlayerofthemodel。TermExtnlctionpIa帕∞importantrolebyprovidingafoundationforthe啊laycn.TermExtractiontaskneedstoresolvetwomainproblems:reducingt

7、hehRman'slaboroflableingtraiuningsazaplesanddiscoveringIreWterms.仙thesisproposestwotermextractionmethordswhichworkondifferentkindsofwebpages.Todealwiththewellstructuredwebpages.thisthesispropose8anapproachbased011sequencecoveringalgorithmforlearninglabelpm'amet

8、ersofthetemplate.他approachtakesthelistpagesetastheinpoLIneachiteration,itchoosesauncoveredsampletoIearnitslabelstlx;ctore.thenaddsan脚ruletotheruleset.Theiterationkeepsonwork

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。