暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

openGauss每日一练第20天|学习学习openGauss全文检索

原创 赵敬星 2021-12-20
652

坚持学习openGauss数据库,坚持每天打卡。第二十天学习openGauss全文检索。

连接openGauss

root@modb:~# su - omm omm@modb:~$ gsql -r gsql ((opengauss 2.0.0 build 78689da9) compiled at 2021-03-31 21:03:52 commit 0 last mr ) non-ssl connection (ssl connection is recommended when requiring high-security) type "help" for help. omm=#

1.用tsvector @@ tsquery和tsquery @@ tsvector完成两个基本文本匹配

omm=# select 'China is a great country'::tsvector @@ 'China & great'::tsquery as result; result -------- t (1 row) omm=# select 'country & great'::tsquery @@ 'Japan is a small place'::tsvector as result; result -------- f (1 row)

2.创建表且至少有两个字段的类型为 text类型,在创建索引前进行全文检索

omm=# create schema schema1; CREATE SCHEMA omm=# create table schema1.tab(id int, body text, title text, last_mod_date date); CREATE TABLE omm=# insert into schema1.tab values(1, 'China, officially the People''s Republic of China(PRC), located in Asia, is the world''s most populous state.', 'China', '2021-12-20'),(2, 'America is a rock band, formed in England in 1970 by multi-instrumentalists Dewey Bunnell, Dan Peek, and Gerry Beckley.', 'America', '2021-12-20'),(3, 'England is a country that is part of the United Kingdom. It shares land borders with Scotland to the north and Wales to the west.', 'England','2021-12-20'); INSERT 0 3 --检索出在title或者body字段中包含china和asia的行 omm=# select title from schema1.tab where to_tsvector(title || ' ' || body) @@ to_tsquery('china & asia'); title ------- China (1 row)

3.创建GIN索引

--为了加速文本搜索,可以创建GIN索引(指定China配置来解析和规范化字符串) omm=# create index tab_idx_1 on schema1.tab using gin(to_tsvector('english', body)); CREATE INDEX --连接列的索引 omm=# create index tab_idx_3 on schema1.tab using gin(to_tsvector('english', title || ' ' || body)); CREATE INDEX

4.清理数据

omm=# drop schema schema1 cascade; NOTICE: drop cascades to table schema1.tab DROP SCHEMA

通过学习openGauss全文检索,了解到openGauss提供了两种数据类型用于支持全文检索。tsvector类型表示为文本搜索优化的文件格式,tsquery类型表示文本查询。全文检索基于匹配算子@@,当一个tsvector匹配到一个tsquery时,则返回true, tsvector和tsquery两种数据类型可以任意排序。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论