driving_site的使用学习

原创张伟垚云和恩墨交付战队 2021-11-23

1965

业务方找到我们咨询,有一个sql要跑10分钟左右,有点不能接受，经查看使用了dblink进行了跨库查询，并且执行计划确实没有走相应的索引，后使用driving_site的hint解决问题

由于业务SQL需要保密，这里自己创建的相应的表和索引进行场景的模拟


12c 12201 环境 创建连接到11g环境的dblink

SQL> CREATE public DATABASE LINK zwy11g    CONNECT TO zwy11g IDENTIFIED by  "123"    USING '11g';

Database link created.

11g 环境 创建表 以及索引

SQL> create table zwy11g.zwy_test1 as select * from dba_objects;


Table created.

SQL> SQL> create index zwy11g.id_1 on zwy11g.zwy_test1(object_id);

Index created.


12c 环境 创建表 索引

create table zwy.zwy12c_test1 as select * from dba_objects;


create index zwy.zwy12c_id on zwy.zwy12c_test1(object_id);复制

将业务SQL的逻辑转换为测试表对应的SQL

select a.object_id,a.object_name from zwy.zwy12c_test1 a,zwy_test1@zwy11g b where a.object_id=b.object_id and a.owner=b.owner and b.object_id=10000;复制

业务场景为连接列有索引，并且A表是小表只有几百MB,B表是dblink连接的远端的大表有20G的大小，但是经由索引过滤，应该返回的结果集很小，乃至整个SQL运行的很快才对。

但是经由查看，远端的SQL执行计划走的是全表扫描，执行逻辑是先将20g大小的B表全表扫描后拿到本端进行过滤，再加上查看当时的网络流量确实很大，感觉确实不太合理，遂想将执行步骤调整为先在B表上过滤后得到的结果集再和A表进行连接，然后就使用了本案例的hint的driving_site

可以看到源SQL的执行计划中 id=4走的是该表的FULL全表扫。并且总体的cost为85.

加上driving_site hint后的执行计划

select /*+  driving_site(b)*/ a.object_id,a.object_name from zwy.zwy12c_test1 a,zwy_test1@zwy11g b where a.object_id=b.object_id and a.owner=b.owner and b.object_id=10000;复制