暂无图片
暂无图片
2
暂无图片
暂无图片
2
暂无图片

GBase 8c排序查询结果(二)

李雨晴 2022-09-16
282

由于较长的文档有更多的机会包含查询词,因此有必要考虑文档的大小。例如,包含有5个搜索词的一百字文档比包含有5个搜索词的一千字文档相关性更高。两个预置的排序函数都采用了一个整型的标准化选项来定义文档长度是否影响排序及如何影响。这个整型选项控制多个行为,所以它是一个屏蔽字:可以使用|指定一个或多个行为(例如,2|4)。

  • 0(缺省)表示:跟长度大小没有关系
  • 1 表示:排名(rank)除以(文档长度的对数+1)
  • 2表示:排名除以文档的长度
  • 4表示:排名除以两个扩展词间的调和平均距离。只能使用ts_rank_cd实现
  • 8表示:排名除以文档中单独词的数量
  • 16表示:排名除以单独词数量的对数+1
  • 32表示:排名除以排名本身+1

当指定多个标志位时,会按照所列的顺序依次进行转换。

需要特别注意的是,排序函数不使用任何全局信息,所以不可能产生一个某些情况下需要的1%或100%的理想标准值。标准化选项32   (rank/(rank+1))可用于所有规模的从零到一之间的排序,当然,这只是一个表面变化;它不会影响搜索结果的排序。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

11 0
暂无图片
1年前
评论
暂无图片 0
👍
1年前
暂无图片 点赞
评论
筱悦星辰
暂无图片
1年前
评论
暂无图片 0
只做力所能及的事,是本能;勇于尝试新事物,才是本事。前行路上,勇敢挑战更高目标,既是一个人的智慧,也是一个人的胆略。
1年前
暂无图片 点赞
评论