一种快速的xml语义检索算法

一种快速的xml语义检索算法

ID:4215099

大小:534.08 KB

页数:8页

时间:2017-11-29

一种快速的xml语义检索算法_第1页
一种快速的xml语义检索算法_第2页
一种快速的xml语义检索算法_第3页
一种快速的xml语义检索算法_第4页
一种快速的xml语义检索算法_第5页
资源描述:

《一种快速的xml语义检索算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第ll期2007年11月电子学报ACTAEI.Dcl田ONICASINICAV01.35No.11Nov.2007一种快速的XML语义检索算法李新叶,苑津莎(华北电力大学电子与通信工程系。河北保定071003)摘要:传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算

2、法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性.关键词:XML文档;语义检索;索引结构;信息检索中图分类号:TP391文献标识码:A文章编号:0372.2112(2007)11-2220-06AFastSemanticSearchAlgorithmforXMLDataLIXin-ye,YUANJin-sha(啦阿咖Ⅻ‘ofElectronicandC.ommani删ionEngineering,NorthChinaEle吐ricPowerUniversity,Baoding,Hebei071003,

3、China)Abstract:Traditionalkcyword-baseAsearchenginedoesnotconsidertheadditionalinfonmtionprovidedbythestnlctu陀ofXMLdocmnents.itrettLrrlSimpreciseresultsoften;searchingaccordingtokeywordsandslructureinformationofXMLdocIⅡnelltsinputtedisnotsuitableforcommoD_users.Semanticsearc

4、hforXMLdatabasedontag---keywordsOVL"I"㈣thelimitationsabove,butitsefficiencyneedstobeimproved.ThispaperanalyzessemanticiafonmtionprovidedbythestructureofXMLdocumentsdeeply.Itputsforwardanewii3degstructureforXMLdataandsemanticrelateddecisionfunctionbetweentwonodes.BasedOilthis

5、,itproposesafastsemanticsearchalgorithmforXMLdata.Thesearchalgorithmreducesthetimestodecidesemanticcorrela-tiongreatly.Theexperimentalresetswithrealdatasetsillustratetheeffectivenessoftheproposedalgorithm.Keywords:XMLdocument;semanticsearch;indexstn.1ctu陀;infonmfionretrieval

6、1引言XML由于具有自描述、灵活的数据结构及丰富的数据表示能力等特点,现已被广泛应用到电子商务中数据的表示、数据集成,信息检索等领域,并逐步成为111.temet/intranet上数据交换的标准.针对web上出现的越来越多的XML文档,传统的基于关键词的搜索引擎由于未考虑到XML文档结构隐藏的语义,搜索结果往往不精确.近年来,已有许多针对XML文档的搜索及索引的研究[卜7

7、,需要用户输入XML文档结构信息以获得精确的检索结果,而普通用户往往不知道XML文档的结构(路径)信息,因此这些方法不适用于普通用户的检索要求.XML文档查询语言XQUEm

8、'也不适用于XML搜索引擎,主要原因有[8]:(1)语法复杂;(2)需要知道文档的结构来构造一个查询语句;(3)没有查询结果的排序;(4)查询速度慢.文献[8]提出了一种基于关键词的适用收稿日期:20074)3.12;修回Et期:2007-06-20于普通用户检索要求的XML语义搜索技术.为检索出符合用户查询请求的语义相关的XML文档片段,文献[8]定义了两个XML结点相连关系及多个结点间语义相关的概念,搜索引擎首先在索引文件中查找与各关键词匹配的XML结点,然后判断这些结点之问是否满足语义相关的条件,如果满足则为检索结果.与传统的基于关键词的

9、检索相比,XML语义检索提高了检索精度,但由于要对匹配结点进行语义相关的判断,XML语义检索的效率至关重要.本文研究了XML文档结构隐藏的语义,提出了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。