1.Greenplum分区表简介
在数据库中,分区表,有时候我们也叫分库分表,底层的逻辑基本都是一样的,就是将一个大表在物理上分布在不同数据库上,数据也拆分开,方便查询时进行分区裁剪以减少查询数据量。GPDB中的分区表功能在开发时,参考了Oracle的分区表语法,在GPDB中,可以直接向父表插入数据,也可以直接向子表插入数据,当直接向父表插入数据时,GPDB会自动检测并将数据定位到子表中。
2.如何创建分区表
GPDB中,支持两种分区表,范围分区(range)和列表分区(list),下面展开介绍一下具体的创建语法。
2.1 范围分区(range)
根据分区字段的值范围区间来分区,每一个分区就是一个子表
create table t_partition_range
(
id int,
name varchar(64),
fdate varchar(64)
) distributed by (id)
partition by range(fdate)
(
partition p1 start ('2022-01-01') inclusive end ('2022-02-01') exclusive,
partition p2 start ('2022-02-01') inclusive end ('2022-03-01') exclusive,
default partition default_p
);
注意上面分区表我定义的日期,前后是有衔接关系的,如果不衔接起来,可能发生缺少分区的情况:
inclusive :指定包含,例如上面的 start ('2022-01-01') inclusive 则是包含'2022-01-01'
exclusive : 指定不包含, 例如上面的 end ('2022-02-01') exclusive 则是不包含'2022-02-01'
2.2 快速范围分区(every)
根据选定的范围,跨越基数,快速分区每一个子表
create table t_partition_every_1
(
id int,
name varchar(64),
fdate date
)
distributed by (id)
partition by range (fdate)
(
partition pn_ start ('2022-01-01'::date) end ('2022-12-31'::date) every ('1 day'::interval),
default partition default_p
);
every:指定跨越基数
2.3 列表分区(list)
根据值的分组,相同的数据归类到一组,也就一个分区中
create table t_partition_list
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by list (fdate)
(
partition p1 values ('2022-01-01', '2017-01-02'),
partition p2 values ('2022-01-03'),
default partition default_p
);
3.分区相关操作
3.1 分区拆分
拆分普通分区:
将分区p2在 '2022-02-20' 左右切分成两块
alter table t_partition_range split partition p2 at ('2022-02-20') into (partition p2, partition p3);
切割默认分区:
alter table t_partition_range split default partition start ('2022-03-01') end ('2022-03-31') into (partition p4, default partition);
3.2 新增分区
如果存在默认分区(default partition),则不能新增(add)分区,只能拆分默认分区(split default partition)
alter table t_partition_range_1 add partition p2 start ('2022-02-01') end ('2022-02-31');
3.3 删除分区
alter table t_partition_range_1 DROP partition p2;
3.4 清空分区数据
清空分区表数据,相当于删除分区,然后再新建一个
alter table t_partition_range_1 truncate partition p1;
或根据rank号去删除对应分区,如下:
alter table sales truncate partition for(rank(1));
4.子分区创建与操作
4.1 子分区创建
在GPDB中,分区是可以嵌套增加的,分区下面可以有子分区,如下:
create table t_partition_range_2
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by range(fdate)
subpartition by list(name)
subpartition template
(
subpartition c1 values ('abcd'),
subpartition c2 values ('efgh')
)
(
partition p1 start ('2022-01-01') end ('2022-01-31')
)
上面的分区中,p1会再分两个c1/c2子分区
4.2 truncate 子分区
alter table t_partition_range_2 alter partition p1 truncate partition c2;
4.3 drop 子分区
alter table t_partition_range_2 alter partition p1 drop partition c2;
本文来源:https://blog.csdn.net/chrisy521/article/details/122272524