暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GBase 8a MPP使用时 性能异常问题2

Joe 2022-04-01
334

问题:两表 like 条件关联使用 limit 和 limit offset 性能差 异大

问题现象:两表 like 条件关联使用 limit 和 limit offset 性能差异大,如下示例,该 SQL 执行 时跑了几万秒没有结果,但把最后的 limit 0,500 换成 limit 500,20 秒左右就可以 执行完毕。

SELECT a.*

,b.addr_full_name

,b.gridcode

FROM gd_eda.temp_wyj_obd_01 a

,gd_lx.address_grid b

WHERE b.addr_full_name LIKE a.address || ‘%’

AND a.address IS NOT NULL

AND b.gridcode IS NOT NULL limit 0,500

解决方法 : Limit 0,500 时,在默认 set _t_gcluster_limit_optimize=1;的情况下,执行器会 先去各个节点评估本节点结果集行数,该语句 2 表关联条件为 b.addr_full_nam e like a.address||’%’,左表(小表,数据量为 140 多万)拉复制表后,与右表 的分片按 nest-loop 方式 join,2 表数据量都很大,join 执行的时间长,导致长 时间评估不完;  limit 500 时,不按照上述优化执行,直接下发到第一个节点执行,虽然也是 n est-loop join,但是当结果集行数到 500 时就退出了,对外表现性能更好;  性能差异的根本原因是在 sql 的 join 上面,建议请用户核查下 sql 的逻辑是否 有问题;或 session 级设置上述参数值为 0。 改造业务逻辑或者执行该 sql 时设置 set _t_gcluster_limit_optimize=0。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论