分布式数据库查询优化技术
摘 要在分布式数据库中,由于高可靠性和高速度性是其重要特点,所以对查询执行的要求也就更高。而
查询执行中查询优化是执行的关键环节,查询优化在很大程度上决定查询的效率或快慢。本文讨论的重点
是对分布式查询执行的全局处理策略进行优化,尽可能避免通信代价的开销,并着眼于查询执行的实际代
价,从分布式系统中选出一个最优的执行节点。从查询执行的效果出发,通过统计的方式,不断从最近的
查询执行代价学习纠正最近查询执行的统计代价,为查询的全局处理提供参考,以达到优化执行、提高执
行效率和速度的目的。
1
分布式数据库概述
1.1
分布式数据库的定义
所谓分布式数据库系统就是由分布于多个计
算机结点上的若干个数据库组成
,
每个子数据库系
统都是一个独立的数据库系统,它们都拥有各自
的数据库、中央处理机、终端,以及各自的局部
数据库管理系统,分布式数据库在使用上可视为
一个完整的数据库
,
而实际上它是分布在地理分散
的各个结点上。当然
,
分布在各个结点上的子数据
库在逻辑上是相关的。简单的说,分布式数据库
系统是一系列集中式数据库系统的联合。它们在
逻辑上属于同一系统,但在物理结构上是分布式
的
[1]
。
1.2
分布式数据库系统的组成
如图
1-1
所示,分布式数据库系统由以下述
成分组成
:
(1)
多台计算机设备,并由计算机网络连接。
(2)
计算机网络设备,网络通讯的一组软件。
(3)
分 布 式 数 据 库 管 理 系 统 , 它 包 括
GDBMS
、
LDBMS
、
CM,
除了具有全局用户接口
由
GDBMS
连接外,还可以具有自治场地用户接
口,由场地
DBMS
链接,并持有独立的场地目录。
(4)
分布式数据库管理者(
DDB
),包括全局
数据库
(GDB)
和局部数据库
(LDB)
以及自制场地的
自治场地数据库。
(5)
分布式数据库管理者
(DDBA)
,它可分为
二级,一级为全局数据库管理者
(GDBA),
另一级
问局部或自治场地数据库管理者,统称为局部数
据库管理者
(LDBA)
。
(6)
分布式数据库系统软件文档,这是一组与
软件相匹配的软件文档及系统各种使用说明和文
件。
图
1-1
分布式数据库系统的结构
1.3
分布式数据库系统的功能
通常的集中式数据库管理系统应具备以下几
个基本的功能
[2]:
(1)
数据库定义功能
;
(2)
数据存取功能
;
(3)
数据库运行管理
;
(4)
数据库的建立和维护功能。
分布式数据库除了须具备以上集中式数据库
的功能外,一般还须具有以下几个方面的功能
:
(1)
分布在网络中的各节点的数据库,其物理
位置对用户透明
;
Communicatio
n
Network
S4
S1
S2
S3
评论