主流dbms提供的xml数据索引对比研究

主流dbms提供的xml数据索引对比研究

ID:11211879

大小:980.50 KB

页数:32页

时间:2018-07-10

主流dbms提供的xml数据索引对比研究_第1页
主流dbms提供的xml数据索引对比研究_第2页
主流dbms提供的xml数据索引对比研究_第3页
主流dbms提供的xml数据索引对比研究_第4页
主流dbms提供的xml数据索引对比研究_第5页
资源描述:

《主流dbms提供的xml数据索引对比研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、目录1引言12索引技术概论12.1XML索引及其分类22.2XML数据及XPath查询处理32.3XML索引分类53基于SQLSERVER2005的XML索引73.1XML索引在SqlServer2005中的支持73.2建立XML索引数据73.2.1主索引83.2.2次索引83.2.3内容索引104基于ORACLE10GDB的XML索引114.1什么是ORACLEXML数据库114.2索引XML内容125基于DB29PUREXML的XML索引135.1XML索引在DB29pureXML中的支持135.1.1XML索引的SQL函数类型145.1.2理解DB2中XPath表达式[7]1

2、45.1.3节点类型155.2DB29pureXML中的XML索引技术165.2.1在路径中使用text()节点165.2.2使用theUNIQUE关键词175.2.3使用XML命名空间186实验对比研究196.1SqlServer2005中的实验对比研究196.1.1实验方法196.1.2实验结果216.2Oracle10gDB中的实验对比研究216.2.1实验方法216.2.2实验结果246.3DB29pureXML中的实验对比研究246.3.1实验方法246.3.2实验结果277总结29致谢30参考文献3131主流DBMS提供的XML数据索引对比研究1引言XML(Extens

3、ibleMarkupLanguage),意为可扩展的标记语言,它是SGML的子集,是一套定义语义标记的规则,它也是一种元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。随着XML数据量的不断增长,要求更有效的数据管理能力和更快、更精确的查询。为了提高XML数据的查询效率,特别是结构查询的效率,要求有一种很有效的方法——XML索引技术。XML(最新的规范为2004年的XML1.1)(extensiblemarkuplanguage),即可扩展的标记语言,是一套定义语义标记的规范,其目标是能够定义计算机和人都能方便识别的数据类型.随着网络应用的快速发

4、展,尤其是电子商务、Web服务等应用理念的进一步发展,使得XML类型的数据成为当前主流的数据形式.对XML据的管理也成为研究的热点.同时,随着互联网上XML文档的不断增多,对这些数据的使用越来越依赖于互联网搜索引擎强大的检索能力,对检索XML文档的搜索引擎的研究也就越迫切。如何将XML索引技术与现代主流关系数据库(ORACLE10G,MICROSOFTSQLSERVER2005和IBMDB29)技术结合起来,使得检索结果更为准确,也使得传输的数据量大大减小。2索引技术概论在讨论索引技术时,主要考虑两方面的问题:一是索引的对象,既在什么数据上面建索引;二是索引的组织结构。下面分别讨论

5、这两方面的问题。在关系世界中,索引的对象很简单,就是元组的某一属性。这是因为在关系数据库里面,只有一种结构—关系表,查询的时间直接查询表中的数据项。这种索引就是值索引。然而在XML31数据库中,查询是多种多样的。有时是对XML文档中关键字的搜索,这类搜索可以用值索引来辅助;但是更多的是类似于XPath或XQuery那样的查询,这时搜索不仅涉及到值,还涉及到结构(如一个结点在文档树中的路径),因此,仅在某些值上建索引是不够的。在XML-enabled数据库里面,由于结构信息(如一个边的路径)往往分裂在几个表里面,因此无法对路径建索引,查找特定路径的结点往往是通过几个表间的连接(称为s

6、tructuraljoin或containmentquery)来实现的,这也是XML—enabled数据库效率低下的原因之一。考虑到这些因素,一般的纯XML数据库都对多个对象建索引,主要有:值索引,即在属性值或结点内容上面建索引;结点名索引,即在结点标记上面建立索引;边或路径索引,即在XML文档树的边上面建立索引。再看索引的组织形式。在关系数据库中,索引的组织形式主要是B+树及其变体。B+树结构的优点是:它是平衡的,因而对数据项的访问代价是基本确定的;它是扁平的,因而搜索的时候深度不是太深,访问的磁盘I/O不会太多;它是插入,删除和查询时的效率都是较高的,因而综合性能是很好的。用B

7、+树建立值索引毫无疑问是可行的,但是用它来管理XML文档的路径信息可能就不那么如意了。因为当XML文档的模式改变时,索引结构以及索引项可能都做较大调整,很明显这时维护B+树的代价是很高的。并且B+树对索引项的长度和索引项的数目是比较敏感的,如果要在大量长的而且重复较少的数据项上建立索引,B+树就会快速膨胀,从而导致访问时磁盘I/O的增加和更新时的繁琐,因而也不适合直接管理大量的路径信息。另外一种常用的索引结构是哈希表。哈希表根据一个哈希函数快速将搜索键定位到某个桶(b

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。