生成列(Generated Columns)是由其他列计算得到的特殊的列,分为存储生成列(Stored Generated Columns)和虚拟生成列(Virtual Generated Columns)。从Hologres V3.1版本开始,支持存储生成列,即在数据写入或更新时自动进行计算,并实际占用存储空间。目前暂不支持虚拟生成列。本文为您介绍Hologres中存储生成列的使用方法。
使用场景
实现对所需字段的自动计算:消除手动处理计算逻辑的业务需求。
保障数据的一致性:避免人为操作或代码逻辑的错误,而导致数据不一致。
优化查询性能:对于高频查询的场景,存储生成列的读取等同于普通列。
简化业务逻辑:对于固定常用数据转换操作,能够降低SQL复杂度。
根据您的业务需要,合理使用生成列能显著提升开发效率并保障数据的可靠性。
语法
通过GENERATED ALWAYS AS子句声明生成列,并通过STORED关键字来指定存储生成列。
创建包含生成列的表。
CREATE TABLE generated_col_t ( [...,] col1 INT, col2 INT GENERATED ALWAYS AS (col1 + 1) STORED );
创建包含生成列的逻辑分区表,并将生成列作为分区键。
CREATE TABLE generated_col_logical_part ( a TEXT, b INT, ts TIMESTAMP NOT NULL, d TIMESTAMP GENERATED ALWAYS AS (date_trunc('day', ts)) STORED NOT NULL ) LOGICAL PARTITION BY LIST(d);
注意事项
CREATE TABLE时
ALTER TABLE时
不支持ADD的Column为生成列。
支持DROP生成列。但在生成列未被DROP之前,不支持DROP该生成列的引用列。
不支持修改生成列的数据类型,不支持修改生成列引用列的数据类型。建议您通过REBUILD功能实现,详情请参见REBUILD(Beta)。
支持RENAME生成列列名。
DML/DQL时
数据写入或更新含生成列的表时,允许不指定生成列或使用
default
关键字,但不支持指定生成列直接写入。数据更新时,如果生成列或其引用的列是分布键(distribution_key),则不支持更新该列。
通过Fixed Plan进行数据更新时,如果主键为生成列,则不支持更新生成列的引用列。
通过Fixed Plan进行部分列更新时,如果生成的列引用多个普通列,则不支持只更新其中的部分列。
其他方式的操作均支持包含生成列的表,包括通过HQE引擎执行的读写、通过Fixed Plan执行的读写以及Copy等方式。
其他操作
CREATE TABLE LIKE创建时,支持原表有生成列,需开启
hg_experimental_enable_create_table_like_properties
参数,以保留生成列属性。CREATE TABLE AS创建时,不支持原表有生成列。
如需修改包含生成列的表的参数,支持通过REBUILD语法(含迁移表的Table Group),请参见REBUILD(Beta)。不支持使用HG_MOVE_TABLE_TO_TABLE_GROUP语法迁移表的Table Group。
如需对包含生成列的表执行INSERT OVERWRITE操作,Hologres V3.1版本支持原生INSERT OVERWRITE语法。不支持原
hg_insert_overwrite
语法,详情请参见该语法的INSERT OVERWRITE。
使用示例
新建带有生成列的表。
CREATE TABLE generated_col_t ( id INT PRIMARY KEY, col1 INT, col2 INT GENERATED ALWAYS AS (col1 + 1) STORED );
数据导入。
支持数据导入全部非生成列。示例如下:
INSERT INTO generated_col_t VALUES (1, 1); INSERT INTO generated_col_t(id, col1) VALUES (2, 2);
通过查询命令
SELECT * FROM generated_col_t;
显示结果如下。id col1 col2 1 1 2 2 2 3
支持数据导入时对生成列使用
default
关键字。示例如下:INSERT INTO generated_col_t VALUES (3, 3, default); INSERT INTO generated_col_t(id, col1, col2) VALUES (4, 4, default);
通过查询命令
SELECT * FROM generated_col_t;
显示结果如下。id col1 col2 4 4 5 2 2 3 3 3 4 1 1 2
不支持对指定生成列进行导入。示例如下:
INSERT INTO generated_col_t VALUES (5, 5, 6); INSERT INTO generated_col_t(id, col1, col2) VALUES (6, 6, 7);
返回结果如下。
数据更新。
支持更新非生成列数据。示例如下:
UPDATE generated_col_t SET col1 = 2 WHERE id = 1;
通过查询命令
SELECT * FROM generated_col_t;
显示结果如下。id col1 col2 2 2 3 3 3 4 4 4 5 1 2 3 -- 该列数据已发生变化
支持更新数据时对生成列使用
default
关键字。示例如下:UPDATE generated_col_t SET col1 = 3, col2 = default WHERE id = 2;
通过查询命令
SELECT * FROM generated_col_t;
显示结果如下。id col1 col2 3 3 4 2 3 4 -- 该列数据已发生变化 4 4 5 1 2 3
不支持对指定生成列进行更新。示例如下:
UPDATE generated_col_t SET col2 = 4 WHERE id = 3;
返回结果如下。
可通过以下SQL查询函数在特定参数类型下是否为IMMUTABLE
。例如:TO_CHAR
函数仅在输入为TIMESTAMP WITH TIME ZONE
类型时为IMMUTABLE
,因此在生成列中使用该函数时,必须确保参数类型匹配。
SELECT n.nspname AS "Schema",
p.proname AS "Name",
pg_catalog.pg_get_function_result(p.oid) AS "Result data type",
pg_catalog.pg_get_function_arguments(p.oid) AS "Argument data types",
CASE p.prokind
WHEN 'a' THEN 'agg'
WHEN 'w' THEN 'window'
WHEN 'p' THEN 'proc'
ELSE 'func'
END AS "Type",
CASE
WHEN p.provolatile = 'i' THEN 'immutable'
WHEN p.provolatile = 's' THEN 'stable'
WHEN p.provolatile = 'v' THEN 'volatile'
END AS "Volatility",
CASE
WHEN p.proparallel = 'r' THEN 'restricted'
WHEN p.proparallel = 's' THEN 'safe'
WHEN p.proparallel = 'u' THEN 'unsafe'
END AS "Parallel",
pg_catalog.pg_get_userbyid(p.proowner) AS "Owner",
CASE WHEN prosecdef THEN 'definer' ELSE 'invoker' END AS "Security",
pg_catalog.array_to_string(p.proacl, E'\n') AS "Access privileges",
l.lanname AS "Language",
p.prosrc AS "Source code",
pg_catalog.obj_description(p.oid, 'pg_proc') AS "Description"
FROM pg_catalog.pg_proc p
LEFT JOIN pg_catalog.pg_namespace n ON n.oid = p.pronamespace
LEFT JOIN pg_catalog.pg_language l ON l.oid = p.prolang
-- 目标函数
WHERE p.proname OPERATOR(pg_catalog.~) '^(TO_CHAR)$' COLLATE pg_catalog.default
AND pg_catalog.pg_function_is_visible(p.oid)
ORDER BY 1, 2, 4;