基于本体的web产品指标抽取技术研究

基于本体的web产品指标抽取技术研究

ID:35066279

大小:4.70 MB

页数:58页

时间:2019-03-17

基于本体的web产品指标抽取技术研究_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《基于本体的web产品指标抽取技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:TP39分类号1单位代码:10220密级:beastPetroleumUniversity/硕i研究生学位论文f旅方额目:基于本細Web郎撕馳技术研■;时么泽硕±生指导教师:王撰畅教授蠢ZZZI立二:研究方向数嫌掘k"■X2016年5月3日礁■学位论文独创性声明本人所巧交的学位论义站巧化指诗教师的巧哥下进行的研究作及取得的研究成果,,本论文小包含其他个人d经发表。据巧所知除义中^巧注明引Hj的内軒外或撰与过的硏究成巧。对本义的研巧做出弔嬰妇献的个人和集体,均d在支中化了明确说

2、明并巧W谢岛。2W'rx:刖月作巧签名:、巧{;譯7学位论文使用授权声明本人克令/解东北不|油大平巧关保巧、使川学位论义的规定。学枝巧权保留学位论文并巧阳家K巧部n或巧巧山机构达交论父的化丫版和紙质版,化许论义被巧阅巧借阅,nLy、_、缩印或,j.采W影巧:n拙巧U制于段化仔汇编巧位论文公化论义的伞部或部‘:7J仪巧木人的巧位论义加入《、分内韓。东北TT油人丫中凹优秀硕+学化论义全义数据障》《中圃博±学化论义个义数侃巧》和编入《||》。|凹知识巧源总你保宵的学位论义在解密后适巧本规巧。巧化论义作者签:日丰。寺论义巧巧巧帅装:f1

3、J珠’、:I如化蘇巧JM巧IThesisfortheMasterdegreeinEngineeringResearchonWebProductIndicatorExtractionBasedonOntologyCandidate:ShiGongZeTutor:WangHaoChangSpecialty:SoftwareEngineeringthDateoforalexamination:20May,2016University:NortheastPetroleumUniversity东北石油大学硕士研究生学位论文基于本体的Web产品指标抽取技术研究摘要由于物质的

4、极大丰富,各类产品的数量迅速增长,而人们对产品指标的关心程度也日益增加。为了能对产品指标进行分析,首先要获得产品指标的数据。目前网络中包含大量的产品数据,但是快速的从中获取所需信息却并不容易;另一方面由于产品种类繁多,也需要一种能够满足所有类型产品信息抽取的标准化方法。而基于本体的信息抽取方法能够有效的解决以上问题,首先本体作为事物的抽象,任何产品指标都可以构建出本体,其次本体的知识结构也方便了人们进一步对产品指标信息进行分析。但是在产品指标信息抽取方面,目前基于本体的信息抽取技术还面临着领域本体构建困难,本体信息利用率低等问题。为了解决以上问题,本文针对产品指标信息抽取提

5、出了一种简化的本体模型并设计了本体概念、概念关系、概念属性的获得方法,从而降低了领域专家参与的必要性;在信息抽取方面提出了一种由本体指导的信息抽取方法,充分利用了简化本体模型中的知识信息。本文的研究工作主要包括以下几方面:1、在领域本体方面,为了减少领域专家的参与,本文结合Web产品指标信息特点,提出了一种针对信息抽取的简化本体模型,这种本体包含了本体的基本概念结构,同时降低了本体的复杂性,减少了领域专家的工作难度,使得对领域一定了解的一般用户构建满足信息抽取需要的本体成为可能。2、在本体知识获取方面,本文提出了一种由多策略决策的领域概念抽取方法,使用一定数量的样本文档和对

6、照文档对其分词、筛选并统计,使用DC、DR、TF-IDF、NC-Value四种策略分别计算其中词语的权值,并使用这些权值综合确定领域概念词。同时采用一种改进的K-means算法从领域文档中自动获取概念之间的层次关系。3、在信息抽取方面,本文提出了一种在简化本体的指导下基于模板的信息抽取方法,这种方法通过本体中的信息定位待抽取信息,并将其基于本体的抽取过程保存为模板,在信息系抽取时通过本体和模板的共同参与获取所需信息。4、最后以智能手机产品为例,对信息抽取系统进行实验测试,实验结果表明经过简化的本体可以支持产品指标的信息抽取,同时设计的抽取方法在抽取的准确率和召回率方面都取得

7、了较好的效果。关键词:信息抽取,本体,概念抽取,抽取规则II东北石油大学硕士研究生学位论文ResearchonWebProductIndicatorExtractionBasedonOntologyABSTRACTPeopleareincreasinglyconcernedwithproductindexalongwithoverwhelmingabundanceofmaterialwealthandrapidgrowthofvariousproducts.Thedataconcerningproductindex

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。