由于较长的文档有更多的机会包含查询词,因此有必要考虑文档的大小。例如,包含有5个搜索词的一百字文档比包含有5个搜索词的一千字文档相关性更高。两个预置的排序函数都采用了一个整型的标准化选项来定义文档长度是否影响排序及如何影响。这个整型选项控制多个行为,所以它是一个屏蔽字:可以使用|指定一个或多个行为(例如,2|4)。
- 0(缺省)表示:跟长度大小没有关系
- 1 表示:排名(rank)除以(文档长度的对数+1)
- 2表示:排名除以文档的长度
- 4表示:排名除以两个扩展词间的调和平均距离。只能使用ts_rank_cd实现
- 8表示:排名除以文档中单独词的数量
- 16表示:排名除以单独词数量的对数+1
- 32表示:排名除以排名本身+1
当指定多个标志位时,会按照所列的顺序依次进行转换。
需要特别注意的是,排序函数不使用任何全局信息,所以不可能产生一个某些情况下需要的1%或100%的理想标准值。标准化选项32 (rank/(rank+1))可用于所有规模的从零到一之间的排序,当然,这只是一个表面变化;它不会影响搜索结果的排序。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
👍
1年前

评论
只做力所能及的事,是本能;勇于尝试新事物,才是本事。前行路上,勇敢挑战更高目标,既是一个人的智慧,也是一个人的胆略。
1年前

评论
相关阅读
新疆维吾尔自治区行政事业单位数据库2025年框架协议采购(二次)入围结果公布
通讯员
143次阅读
2025-04-14 12:21:01
某头部信托公司携手GBase数据库书写普惠金融大文章
GBASE数据库
107次阅读
2025-04-24 09:53:11
GBASE南大通用中标南海农商银行监管报表一表通数据报送项目
GBASE数据库
82次阅读
2025-03-31 10:00:25
“无感”通行 GBase数据库助力四川高速打造智慧交通新标杆
GBASE数据库
60次阅读
2025-04-18 10:01:17
信创产业最佳服务商!GBASE南大通用荣登2024年度科技行业高成长企业榜
GBASE数据库
58次阅读
2025-04-02 09:34:15
“G”术时刻:资深工程师揭秘GBase数据库Hint核心技巧 实现SQL性能跃升
GBASE数据库
50次阅读
2025-04-25 10:10:28
“G”术时刻 | 详解GBase 8s数据库物化视图 提升查询性能
GBASE数据库
38次阅读
2025-04-01 12:26:56
GBase数据库的逻辑复制槽功能是什么?怎么使用?
GBASE数据库
37次阅读
2025-04-11 16:26:08
日常运维怎么破?GBase 8a这些命令用得到!
GBASE数据库
36次阅读
2025-04-11 16:29:49
“G”术时刻 | GBase数据库逻辑复制槽功能应用实践
GBASE数据库
34次阅读
2025-04-11 15:35:08