行存储是指将表按行存储到硬盘分区上,列存储是指将表按列存储到硬盘分区上。默认情况下,创建的表为行存储。
行、列存储模型各有优劣,通常用于TP场景的数据库,默认使用行存储,仅对执行复杂查询且数据量大的AP场景时,才使用列存储;
作业打卡:
1.创建行存表和列存表,并批量插入10万条数据(行存表和列存表数据相同)
create schema pysql
CREATE TABLE pysql.table_H1
(
col1 CHAR(2),
col2 VARCHAR2(40),
col3 NUMBER
);
CREATE TABLE pysql.table_L1
(
col1 CHAR(2),
col2 VARCHAR2(40),
col3 NUMBER
)
WITH (ORIENTATION = COLUMN);
2.对比行存表和列存表空间大小
omm=# select pg_relation_size('pysql.table_H1');
pg_relation_size
------------------
6889472
(1 row)
omm=# select pg_relation_size('pysql.table_L1');
pg_relation_size
------------------
1138688
(1 row)
行存储占用的空间大一点:
3.对比查询一列和插入一行的速度
analyze VERBOSE pysql.table_H1;
analyze VERBOSE pysql.table_L1;
查询--列存表时间少于行存表
explain analyze select distinct col3 from pysql.table_H1;
explain analyze select distinct col3 from pysql.table_L1;
插入--行存表时间少于列存表
explain analyze insert into pysql.table_H1 values('aa', 'Hellopp', '1000');
explain analyze insert into pysql.table_L1 values('aa', 'Hellopp', '1000');

4.清理数据




