HBase预分区的作用是什么?如何预分区?
预分区的作用
1、提前规划分区,避免HBase自动split,带来性能消耗
2、预分区是一种避免region热点的方法
3、方便下游任务均匀处理数据,如:spark每个executor可处理一个region的数据
如何预分区
以下三种方式都将预先创建4个region,每个region 负责的rowkey范围分别为:
(-∞,‘100’),['100','200'),['200','300'),['300',+∞)
1、命令行参数
create 'table', 'cf', SPLITS => ['100', '200', '300']
2、命令+文件
(2.1)创建一个文件splits.txt文件,内容如下:
(2.2)执行命令
create 'table', 'cf', SPLITS_FILE =>''splits.txt
3、程序
推荐阅读
加小编微信(备注:大数据)
拉你入“大数据学习交流群”