SQL之美第六篇：一次优雅的数据切割-下

SQL之美 2021-04-20

1280

回接上一篇，日常的报表需求，等于我们自己写自己优化，像这种时候一定要有思路,不能胡碰乱撞，有了思路技术才能发散开来，

上次最终结果如下：

一家之言，针对这种情形大体有三种思路：

整体思路如上，下面开始一一实验。

第一个，我们直接查数据结构：

第一个直接GG了。就俩字段800W数据，没有冗余列，无法垂直切割，不可能为了这个报表新建一个表存储他切分后大约1500W的数据，代价太大了！

让我们来尝试第二种思路：

直接切割800W数据切成1500W效率较低，那么尝试下根据字段长度散列切割：

=1 值过多，数据倾斜较大，也无法做散列切割。

到这里，只剩最后一招了，没有条件让我们创造条件，强行切割达到减少切割目标数据量的目的。

让我们先看下目标表实际数据情况：

居然有这么多重复！

果然。去重以后 800W变成 20W! 不知道这些数据干啥的。调整后，让我们查看切割效率：

3.8S 切割完毕！

代入到源SQL中：

由于这里有个所属机构数据跟账户用途存储方式相左，一个横向多条一个纵向多条，不得不采用 wh_concat_lhr函数合并（通wm_concat函数效果），118S完成，成功切割完毕。

总结：在面对数据切割需求场景时，减少计算量才是最终极的杀手锏思想。

文章转载自SQL之美，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

关注

获得了28次点赞

内容获得11次评论

获得了47次收藏