暂无图片
TBase的数据分布策略是啥?怎么检测数据是否倾斜?
我来答
分享
周晏门
2020-09-18
TBase的数据分布策略是啥?怎么检测数据是否倾斜?
TBase的数据分布策略是啥?怎么检测数据是否倾斜?
我来答
添加附件
收藏
分享
问题补充
1条回答
默认
最新
陈昊

这位同学问题问的非常好。
TBASE分布式数据的数据分布策略支持以下几种:
1、普通分布式表,需要指定默认的分片列,推荐使用有主键的列。当然也可使用分区表来做,这个也是支持的。
2、普通分布表如果没有指定分片列,那么我们会默认的采用建表的第一列作为分片列,默认为not null设置。
3、复制表或称之为广播表,就是在分布式的每个数据节点都存放一份完整的表数据,但这种一般针对小表,无特殊需求,不建议做复制表。
分片计算公式如下:
shardID= hash(pk列 或 普通列)/ shardmap

另外在数据分布策略上,tbase还是支持数据节点的分组管理,来做数据的分部管理的。

另外数据倾斜检测,我们可以直观的去数据节点,统计表的信息,比如生成统计的执行计划,数据量,计划时间消耗等。当然也可以根据我们的数据管理平台去查看各节点的数据存储量。

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交