Table

名称类型描述示例值
object

数据表对象。

Idstring

ID,可参考元数据实体相关概念说明

格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称}:${模式名称}:${数据表名称},对于不存在的层级使用空字符占位

说明 对于 maxcompute 和 dlf 类型,实例 ID 使用空字符占位。对于 maxcompute 类型,数据库名称即为 maxcompute 项目名称,开启三层模型的项目需要提供模式名称,未开启的项目模式名称处使用空字符占位。
说明 starrocks 类型的数据目录标识为目录名称,dlf 类型的数据目录标识为目录 ID, 其他类型不支持目录层级,可用空字符占位。

几种常用类型的 ID 格式如下

maxcompute-table:::project_name:[schema_name]:table_name

dlf-table::catalog_id:database_name::table_name

hms-table:instance_id::database_name::table_name

holo-table:instance_id::database_name:schema_name:table_name

mysql-table:(instance_id|encoded_jdbc_url)::database_name::table_name

说明 其中
instance_id: 实例 ID,对应数据源以实例模式注册时需要提供
encoded_jdbc_url: JDBC 连接串的 URLEncode 编码,对应数据源以连接串方式注册时需要提供
catalog_id: dlf 目录 ID
project_name: maxcompute 项目名称
database_name: 数据库名称
schema_name: schema 名称,对于 maxcompute 类型,仅所属项目开启三层模型后需要提供。若未开启则使用空字符占位
table_name: 表名称
dlf-table::catalog_id:database_name::table_name
Namestring

名称。

table_name
Commentstring

注释。

测试表
TableTypestring

表类型,取值与元数据采集器类型相关。

TABLE
PartitionKeysarray

分区键列表,非分区表时为空。

string

分区键。

ds
ParentMetaEntityIdstring

父层级元数据实体 ID,可参考元数据实体相关概念说明

  • 对于支持 schema 的类型(maxcompute/holo/postgresql/sqlserver/hybriddb_for_postgresql/oracle, 其中 maxcompute 类型需要所属项目开启三层模型), ParentMetaEntityId为表所属数据库模式,格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称}:${模式名称},对于不存在的层级空字符占位

  • 其他类型时,ParentMetaEntityId为表所属数据库,格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称},对于不存在的层级空字符占位。

说明 对于 maxcompute 和 dlf 类型,实例 ID 使用空字符占位。对于 maxcompute 类型,数据库名称即为 maxcompute 项目名称。
说明 starrocks 类型的数据目录标识为目录名称,dlf 类型的数据目录标识为目录 ID, 其他类型不支持目录层级,可用空字符占位。

几种常用类型的 ParentMetaEntityId 格式参考如下

maxcompute-project:::project_name

maxcompute-schema:::project_name:schema_name (仅项目开启三层模型时)

dlf-database::catalog_id:database_name

hms-database:instance_id::database_name

holo-schema:instance_id::database_name:schema_name

mysql-database:(instance_id|encoded_jdbc_url)::database_name

说明 其中
instance_id: 实例 ID,对应数据源以实例模式注册时需要提供
encoded_jdbc_url: JDBC 连接串的 URLEncode 编码,对应数据源以连接串方式注册时需要提供
catalog_id: dlf 目录 ID
project_name: maxcompute 项目名称
database_name: 数据库名称
schema_name: schema 名称
dlf-database::catalog_id:database_name
CreateTimelong

创建时间(毫秒级时间戳)。

1736852168000
ModifyTimelong

修改时间(毫秒级时间戳)。

1736852168000
TechnicalMetadataobject

技术元数据。

Ownerstring

负责人。

test_user
Locationstring

存储位置。

oss://test-bucket/test_tbl
Compressedboolean

是否为压缩表。

false
InputFormatstring

输入格式。

org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormatstring

输出格式。

org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
SerializationLibrarystring

SerDe 使用的类。

org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
Parametersobject

参数信息。

string

参数信息。

value
BusinessMetadataobject

业务元数据,DataWorks 相关,包含使用说明,标签,类目,上游产出任务以及扩展信息。

Readmestring

使用说明。

## 使用说明
Tagsarray<object>

标签列表。

object

标签信息。

Keystring

标签键,非空。

tag_key
Valuestring

标签值,可为空。

tag_value
Categoriesarray

所属类目列表。

Categoryarray<object>

单一类目的层级列表(多级类目)。

object

类目信息。

Idstring

类目 ID。

CATEGORY.456
Namestring

名称。

测试类目
ParentIdstring

父类目 ID,可为空。

CATEGORY.123
UpstreamTasksarray<object>

上游产出任务列表。

object

上游产出任务。

Idlong

任务 ID。

123456
Namestring

任务名称。

test_task
Extensionobject

扩展信息,目前仅 MaxCompute 类型支持。

ProjectIdlong

工作空间 ID。

234
EnvTypestring

环境类型,枚举值,取值范围

  • Prod:生产环境。
  • Dev:开发环境。
Dev
ViewCountlong

浏览次数。

0
ReadCountlong

读取次数。

0
FavorCountlong

收藏次数。

0