分布式数据库的查询优化算法

分布式数据库的查询优化算法

ID:23310208

大小:57.50 KB

页数:9页

时间:2018-11-07

分布式数据库的查询优化算法_第1页
分布式数据库的查询优化算法_第2页
分布式数据库的查询优化算法_第3页
分布式数据库的查询优化算法_第4页
分布式数据库的查询优化算法_第5页
资源描述:

《分布式数据库的查询优化算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、分布式数据库的查询优化算法近年来,随着计算机X络和数据库技术的发展,对分布式数据库的应用越来越广泛;随着应用不断扩大,数据的查询也越来越复杂,对查询的效率要求也越来越高。本文主要论述分布式数据库查询的概念特点,分布式数据库查询优化技术,并从它的优化技术进行深入探讨,就其改进,系统实现做了一定的论述,并进行了部分的程序实现。关键词:分布式;数据库;查询;优化分布式数据库是一个逻辑上完整而在物理上分散在若干台互相连接着的计算机上的数据库系统,各组件分布在X络的各个节点上,依靠特定的更新和检索机制进行数据库分布,数据库的所有性能都会显著增强。分布式数据库系统使用计算机X络将地理位

2、置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。因此,分布式数据库系统可以看成是计算机X络与数据库系统的有机结合。1.分布式数据库查询的定义  分布式数据库系统(DistributedDataBaseSystem,DDBS)是物理上分布而逻辑上集中的数据库系统。物理上分布是指分布式数据库系统中的数据分布在由X络连接起来的、地理位置分散的不同站点上;逻辑上集中是指各数据库站点之间在逻辑上是一个整体,并由统一的数据库管理系统进行管理,同时各站点又具有管理本地数据的能力。分布式数据库系统可看成是计算机X络与数据库系统的有机结合。  分布式

3、数据库系统有两个重要的组成部分:分布式数据库(DistributedDataBase,DDB)和分布式数据库管理系统(DistributedDataBaseManagementSystem,DDBMS)。分布式数据库是计算机X络中各站点上数据库的逻辑集合。也就是分布式数据库是一组结构化的数据集合,在逻辑上属于同一个系统,在物理上分布在计算机X络的不同站点上,是集中与分布的统一。这个定义强调了分布式数据库的两种特性;  (1)数据分布性。即这些数据库是分布在不同站点上的。这把分布式数据库与单一的集中式数据库别开来。  (2)逻辑关联性。即这些数据库具有某些把它们联系在一起的性

4、质。这把分布式数据库与驻留在计算机X络不同站点上的一组本地数据库区别开来。  分布式数据库管理系统是分布式数据库中的一组软件,负责管理分布环境下逻辑集成数据的存取、一致性和完整性。同时,由于数据的分布性,在管理机制上还必须具有计算机X络通信协议的分布管理特性。2.分布式数据库查询优化的目标与方案2.1优化的目标  分布式查询系统的优化目标一般有两种:一是使X络数据传输量最小,一是使响应时间最短。与集中式的数据库系统相比,X络的传输速度与计算机内部的数据传输速度一般相差几个数量级,因此查询的局部处理时间与节点之间数据传输的时间相比,几乎可以忽略不计。而过多的X络传输可能会给X

5、络造成比较大的负担。因此,减少X络数据传输量成为分布式查询处理的主要问题。因此,分布式查询处理常常以减少X络间传递的数据量作为优化目标。另一方面,不同节点之间的X络传输速率可能是不同的,相同节点之间的传输速率在不同的时间可能也有所不同。同时,局部查询的处理时间有时也会影响整个查询的响应速度。在上述情况下,X络数据传输量已经不能完全代表查询的质量,而要更多地去注意查询的响应时间。在有些情况下,查询处理需要同时考虑X络数据传输量和响应时间。这时,算法需要在这两者之间做出权衡。需要指出的是,设计查询优化算法并不一定要寻求“最优算法”,而是要寻找到“满意算法”就可以了。这首先是因为

6、所谓“最优”的概念本身就是十分模糊的。“最优”的模糊不清首先是由目标的不清引起的,因为分布式查询的优化目标往往是多种因素权衡的结果,是一个半结构化问题。其次是因为寻找“最优”往往要付出比所得到的更多的代价,是不划算的。我们应该全面衡量X络流量、响应时间、服务器负载、算法复杂性等等因素,设计出“满意算法”。2.2优化方案的内容  我们这里提出查询优化方案的概念,而不仅仅是查询优化算法。优化方案包含优化算法,同时还包括其它的和优化相关的系统设计方案。我们认为一个完整的查询优化方案应该包括:分布式查询系统的体系结构:我们在前面曾经提出三种分布式查询系统的体系结构,在我们设计的松散

7、藕合的分布式信息系统中,主要采用的是第一种体系结构,我们将体系结构默认为当前讨论的分布式查询系统的体系结构。优化的位置:分布式查询系统可以在各种位置进行优化。分布式查询算法优化是指GQP的优化。LQP也应该进行优化以提高局部查询的速度,只是因为LQP现在一般都应用比较成熟的商业数据库软件系统,其本身己经优化得非常好了,因此在实际应用中一般不再考虑LQP的优化问题。此外,可以在许多位置增加缓存以提高频繁查询的速度。可以增加缓存的位置有:用户客户端、GQP,LQP等等。软、硬件组成及其结构:用什么样的方式组成一个分布式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。