欢迎来到天天文库
浏览记录
ID:33148436
大小:2.51 MB
页数:96页
时间:2019-02-21
《基于数据集成中本体自动构建的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中南大学硕士学位论文基于数据集成中本体自动构建的研究姓名:李志申请学位级别:硕士专业:计算机应用技术指导教师:黄烟波;李建华20050401摘要随着Intemet的飞速发展,信息技术在各行各业的广泛应用,人们迫切需要将大量异构的数据集成为一个整体以进行分析处理。数据集成的目的正是用于解决数据源异构这一问题。。当前,制约数据集成的一个主要问题是数据源的语义异构问题。ontology是共享概念模型的形式化规范说明,对解决数据集成中的语义异构问题具有重要的作用。目前本体的构建都是由领域专家手工编辑而成,其存在工程复杂、过分依赖专家、构建速度慢、术语表达不精确等缺点。如
2、何进行自动或半自动的本体构建,减少对专家的依赖性,加快本体构建速度,成为当前本体研究的热点。本文首先介绍了数据集成中存在的问题和本体的相关知识,总结了现有的基于本体的数据集成方法。然后,作者分析了现实中本体构建过程中的难点问题。在对本体自动构建的三种方法进行分析比较之后,作者提出了一种基于词典的本体自动构建方案,其包括基于词典的概念发现、基于词典的关系发现和基于词典的术语描述三个过程。针对中南大学信息港数据集成项目背景,作者设计并开发了一个本体半自动构建的系统原型,其以知识挖掘为手段,通过本体引用、本体抽取、本体净化、本体提炼四个步骤,不断循环,螺旋上升,逐步实
3、现领域本体的自动完善。实验结果表明,基于词典的本体自动构建模型对概念发现、关系发现、术语描述方面具有较好的功能效果,自动构建出的本体与经专家修正后构建的本体误差比较小。论文最后对原型系统实现过程中的研究与开发工作进行了总结,并阐述了将来进一步对该系统进行扩充与完善的一些工作.关键词本体,本体构建,数据集成,知识挖掘,概念相关度AbstractAsthedevelopmentofIntemetandwidelyusingofinformatintechnologyinallthefields,peopleareanxioustointegrateallthehet
4、erogeneousdataintooneunionformswhichcanbeusedconveniently.Theaimsofdataintegrationisjustforit.Inthecurrent,semanticheterogeneousiSabigtroublefordataintergration.Ontologyisallexplicitformalspecificationofhowtorepresenttheobjects,conceptsandotherentitiesthatareassumedtoexistinsomeareao
5、finterest.Itisimportantforresolvingthesemanticheterogeneous.Inthecurrent,mostoftheontologiesarebuiltbythehandsoftheexpeas.Therearesomeproblemsinit,suchascomplexityoftheprojeet,stronglydependingontheexperts,tooslowforbuildingontology,theunclearterms.Howtobuildontologiesautomaticallyor
6、semi—automatically,reducingtheworkoftheexpertsandspeedingupthisprocesisahot-pointforpeople.Inthispaper,weintroducedtheproblemsofdataintergrationandtherelativeknowledgeaboutontologyatfirst.Alsowesumupallthewaysindataintegrationwhichbasedonontology.Thenweanalyzethecurrentproblemsinthep
7、rocessofontologybuilding.Afterthecomparationamongthethreewaysofautomaticallybuildingontologies,webringoutanewmethodtobuildontologysemi—automaticallybasedondictionary,whichincludesthreestepps,conceptsfindingbasedondictionary,relationsfindingbasedondictionaryandtermsdescribing.Fortheda
8、taintegratio
此文档下载收益归作者所有