在关系型数据库调优中,查询语句涉及到的索引类型是不得不考虑的一个问题。不同的类型的索引可能会适用不同类型的业务场景。这里我们所说的索引类型指的是访问方法(Access Method),至于从其他维度区分索引(Index)这里暂不作考虑。
PostGreSQL数据库默认的索引访问方法是btree,其他的数据库如Oracle默认也是btree。那么btree到底是何方神圣呢?如果想要深入理解btree的运行原理,需要了解一下数据结构相关的知识,特别是树形数据结构。btree运用了b+ 树数据结构,其可以有效节省IO操作,在查询时可以提供查询效率。
我们沿用之前文章用过的查询语句来做测试,其中sort_test表有500万行数据。表创建SQL和查询语句如下:
CREATE TABLE public.sort_test
(
id bigint NOT NULL,
salary numeric NOT NULL,
CONSTRAINT sort_test_pkey PRIMARY KEY (id)
)
TABLESPACE pg_default;
explain analyze select * from public."sort_test" where salary = 101;
那么执行计划的细节如下图所示:
下面将在同样的表字段上,删除原来的索引,添加相应的hash索引。添加语句为:
CREATE INDEX index_sort_test_salary_hash
ON public.sort_test USING hash
(salary)
TABLESPACE pg_default;
添加完之后,如下图所示:
同样的查询语句的执行计划是怎样的呢?如下图:
可以发现0.757 ms vs. 0.022 ms还是有数量级的差别,在这种情况下,hash索引的效率比btree的效率要高很多。由于hash索引结构的特殊性,其检索效率非常高,可以一步到位。而一般使用的B-tree索引需要从根节点->枝节点->页节点。所以从工作模式上看,hash索引的效率要比btree索引要高。
但是我们大家都懂的,事务都有两面性,hash索引有一定的限制和弊端,要不然这些常用的数据库如Oracle, MySQL,PostGreSQL等也不会将btree access method设置为默认选项了。具体有如下2点限制:
Hash索引只能满足"=","IN"等,等值查询,不能使用范围查询。
在使用部分索引键查询的时候,hash索引将不起作用。
文章转载自TimTest,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。