F.18. intarray
intarray
模块提供了一些有用的函数和操作符来操纵不含空值的整数数组。也提供了对使用某些操作符的索引搜索的支持。
如果一个提供的数组中包含任何 NULL 元素,所有这些操作都将抛出一个错误。
很多这些操作只对一维数组有意义。尽管它们将接受更多维数的数组输入,数据将被当作一个按照存储顺序排列的线性数组对待。
该模块被认为是“trusted”,也就是说,它可以由对当前数据库具有CREATE
权限的非超级用户安装。
F.18.1. intarray
函数和操作符
intarray
模块提供的函数被列在表 F.9中,操作符被列在表 F.10中。
表 F.9. intarray
函数
表 F.10. intarray
操作符
操作符 描述 |
---|
数组是否重叠(至少有一个共同元素)? |
左数组是否包含右数组? |
左数组是否包含在右数组中? |
返回数组中元素的数目 |
返回与正确参数匹配的第一个数组元素的索引,如果不匹配则返回 0。
(与 |
将元素添加到数组末尾。 |
连接数组。 |
从数组中移除匹配右参数的项 |
从左数组中移除右数组的元素 |
计算参数的并集 |
计算参数的并集 |
计算参数的交集。 |
数组是否满足查询?(见下文) |
数组是否满足查询?( |
(在 PostgreSQL 8.2 之前,包含操作符@>
和<@
分别被称为@
和~
。这些名称仍然有效,但是已被弃用并且将最终被移除。注意旧名称与核心几何数据类型之前所遵循的习惯相反!)
操作符&&
、@>
和<@
等效于PostgreSQL的内建同名操作符,不过它们只能在不含空值的整数数组上工作,而内建的操作符可以对任何数组类型工作。这种限制使它们在很多情况下比内建操作符更快。
@@
和~~
操作符测试一个数组是否满足一个query,它被表示成一种特殊数据类型query_int
的一个值。一个由整数值组成的查询会被针对数组的元素检查,可能会组合使用操作符&
(AND)、|
(OR)以及!
(NOT)。根据需要可以使用圆括号。例如,查询1&(2|3)
匹配包含 1 并且还包括 2 或 3 的数组。
F.18.2. 索引支持
intarray
提供对于&&
、@>
、<@
和@@
操作符以及常规数组相等的索引支持。
提供了两种参数化的 GiST 索引操作符类:gist__int_ops
(被默认使用)适合于中小尺寸的数据集,而gist__intbig_ops
使用一种更大的签名并且更适合于索引大型数据集(即,包含大量可区分数组值的列)。该实现使用了一种带有内建有损压缩的 RD 树结构。
gist__int_ops
将整数集近似为整数范围数组。
它的可选整数参数numranges
决定了一个索引键中的最大范围数。
numranges
的默认值是 100。有效值在 1 到 253 之间。
使用更大的数组作为 GiST 索引键会导致更精确的搜索(扫描更小的索引部分和更少的堆页面),
以更大的索引为代价。
gist__intbig_ops
将整数集近似为位图签名。
它的可选整数参数siglen
确定签名长度(以字节为单位)。
默认签名长度为 16 字节。签名长度的有效值介于 1 到 2024 字节之间。
更长的签名导致更精确的搜索(扫描索引的一小部分和更少的堆页面),但代价是更大的索引。
也有一种非默认的 GIN 操作符类gin__int_ops
支持相同的操作符。
在 GiST 和 GIN 索引之间的选择取决于 GiST 和 GIN 的相对性能特点, 这将在其他地方讨论。
F.18.3. 例子
-- 一个消息可以在一个或多个“小节”中
CREATE TABLE message (mid INT PRIMARY KEY, sections INT[], ...);
-- 创建签名长度为 32 字节的专用索引
CREATE INDEX message_rdtree_idx ON message USING GIST (sections gist__int_ops(siglen=32));
-- 选择小节 1 或 2 中的消息 - OVERLAP 操作符
SELECT message.mid FROM message WHERE message.sections && '{1,2}';
-- 选择小节 1 和 2 中的消息 - CONTAINS 操作符
SELECT message.mid FROM message WHERE message.sections @> '{1,2}';
-- 相同,使用 QUERY 操作符
SELECT message.mid FROM message WHERE message.sections @@ '1&2'::query_int;
F.18.4. 测试基准
源代码目录contrib/intarray/bench
包含有一个基准测试套件,可以针对
一个安装好的PostgreSQL服务器运行这个套件(还要求安装
DBD::Pg
)。要运行测试基准:
cd .../contrib/intarray/bench createdb TEST psql -c "CREATE EXTENSION intarray" TEST ./create_test.pl | psql TEST ./bench.pl
bench.pl
脚本有多个选项,当它不使用任何参数运行时会显示这些选项。
F.18.5. 作者
所有工作由 Teodor Sigaev(<teodor@sigaev.ru>
)和 Oleg Bartunov(<oleg@sai.msu.su>
)完成。更多信息请见http://www.sai.msu.su/~megera/postgres/gist/。Andrey Oktyabrski 完成了一项伟大的工作,他增加了新的函数和操作。