压缩的列存储数据的查询优化研究与实现

压缩的列存储数据的查询优化研究与实现

ID:78089521

大小:6.06 MB

页数:77页

时间:2022-01-30

压缩的列存储数据的查询优化研究与实现_第1页
压缩的列存储数据的查询优化研究与实现_第2页
压缩的列存储数据的查询优化研究与实现_第3页
压缩的列存储数据的查询优化研究与实现_第4页
压缩的列存储数据的查询优化研究与实现_第5页
压缩的列存储数据的查询优化研究与实现_第6页
压缩的列存储数据的查询优化研究与实现_第7页
压缩的列存储数据的查询优化研究与实现_第8页
压缩的列存储数据的查询优化研究与实现_第9页
压缩的列存储数据的查询优化研究与实现_第10页
资源描述:

《压缩的列存储数据的查询优化研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、DOrJG!万声、封花只丫学校代码学号压缩的列存储数据的查询优化研究与实现,一学科专业计算机应用技术作者李海燕指导教师夏小玲答辩日期年月日年月东华大学学位论文原创性声明本人郑重声明我烙守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名查赫日期加以年月东华大学学位论文版权使用授权书学位论文作者完全了解

2、学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本版权书。本学位论文属于不保密了学位论文作者签名扬粼,旨导教师签名了洒日期汤、年月日日期伽年月,旧东华大学硕士研究生学位论文压缩的列存储数据的查询优化研究与实现摘要传统的写优化数据库管理系统多数采用按行存储的方式,而对读优化的数据仓库管理系统而言,列存储表现出比行存储更加显

3、著的性能。这是由于列存储技术是将数据表以列为单位进行存储,在查询中能有效避免读取无关的列,从而获得较高的查询效率。由于数据仓库中存储的信息量非常庞大,如何对这些庞大的数据进行有效的管理对数据仓库管理系统来说是一个巨大的挑战。解决这个问题的一个有效的方式就是采用数据压缩技术。因此,如何对压缩的列存储数据进行查询及优化的研究变得十分有意义。本文以东华一达梦数据库技术联合实验室“原型系统设计与实现”项目为背景,主要工作包括对目前存在的一个基于字典的保留顺序的字符串压缩方法进行研究,在继续延用原方法中共用叶子的索引结构的同时,对原压缩方法进行

4、了改进,提出了一个新的基于概率的字符串压缩方法,能快速的将字符串属性进行压缩和解压,降低了系统对压缩数据的查询时间。在列存储的数据经过压缩之后,对压缩数据上的查询策略进行了研究。首先将传统的代价模型进行修改,为了使其是基于压东华大学硕士研究生学位论文摘要缩的,新增了数据压缩和解压的代价。然后针对必须要求解压的数据,研究如何合理的选择解压时机来进一步降低消耗。最后给出了在压缩的数据上进行查询操作的一些具体算法,包括压缩数据的选择、连接和聚集操作。根据压缩的列存储数据的特点,并结合现有的数据库查询优化方法,提出了对压缩的数据进行查询的一些

5、优化策略。为了便于对数据的快速检索和提高查询的速度,研究了索引结构和临时表的合理选择。然后对查询中经常存在的谓词和子查询进行了优化重写策略,最后给出了压缩数据上的选择和聚集操作的优化算法。采用本文提出的基于概率的保留顺序的字符串压缩方法对中的字符串属性进行压缩,对字符串的压缩效率进行了实验比较。然后将本文提出的一些查询优化策略应用于中经过压缩的数据,并对经过各种优化策略优化后的查询的执行时间进行了一系列实验测试。本文提出的基于概率的字符串压缩方法能快速的对字符串属性进解压,从整体上降低了系统的查询时间,达到了查询优化的目的。同时本文提

6、出的一些优化策略使得查询可以直接在压缩数据上进行,无需解压,实现了压缩数据的查询优化。关键词列存储,数据压缩,数据解压,查询优化东华大学硕士研究生学位论文一一,一一,,,,一,,,,,一””,一了东华大学硕士研究生学位论文,一,,一,,,,,,·一,,夕东华大学硕士研究生学位论文一,,一,,,,,一一一,,,汾东华大学硕士研究生学位论文目录目录摘要…………引言……课题的研究目的和意义……国内外研究现状……本文的主要研究工作……本文的组织结构……基于概率的保序字符串压缩算法……基于概率的叶子……基于概率的索引结构……在列存储数据仓库中应

7、用的例子……数值型数据的压缩……本章小结……压缩的列存储数据上的查询策略……代价模型的修改……解压时机的选择……压缩数据上查询操作实现……本章小结……压缩的列存储数据上的查询优化……合理使用索引结构……合理使用临时表……优化谓词……,……子查询优化……,……聚集操作优化……连接操作的优化……,……本章小结……东华大学硕士研究生学位论文原型系统实现及实验……系统……基于概率的压缩算法的实验结果及分析……对压缩数据进行查询优化的实验结果及分析……本章小结……总结与展望……总结……展望……参考文献……攻读学位期间的研究成果目录……东华大学硕

8、士研究生学位论文引言己全刁课题的研究目的和意义在计算机日益发达的今天,计算机的存储容量不断扩大,处理能力不断增加,数据大都集中存放于计算机或计算机网络中并以数据库的形式出现。数据库是数据的集合,通过数据库技术人们可以方便

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。