Table

更新时间:
复制 MD 格式

名称

类型

描述

示例值

object

数据表对象。

Id

string

ID,可参考元数据实体相关概念说明

格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称}:${模式名称}:${数据表名称},对于不存在的层级使用空字符占位

说明

对于 maxcompute 和 dlf 类型,实例 ID 使用空字符占位。对于 maxcompute 类型,数据库名称即为 maxcompute 项目名称,开启三层模型的项目需要提供模式名称,未开启的项目模式名称处使用空字符占位。

说明

starrocks 类型的数据目录标识为目录名称,dlf 类型的数据目录标识为目录 ID, 其他类型不支持目录层级,可用空字符占位。

几种常用类型的 ID 格式如下

maxcompute-table:::project_name:[schema_name]:table_name

dlf-table::catalog_id:database_name::table_name

hms-table:instance_id::database_name::table_name

holo-table:instance_id::database_name:schema_name:table_name

mysql-table:(instance_id|encoded_jdbc_url)::database_name::table_name

说明

其中
instance_id: 实例 ID,对应数据源以实例模式注册时需要提供
encoded_jdbc_url: JDBC 连接串的 URLEncode 编码,对应数据源以连接串方式注册时需要提供
catalog_id: dlf 目录 ID
project_name: maxcompute 项目名称
database_name: 数据库名称
schema_name: schema 名称,对于 maxcompute 类型,仅所属项目开启三层模型后需要提供。若未开启则使用空字符占位
table_name: 表名称

dlf-table::catalog_id:database_name::table_name

Name

string

名称。

table_name

Comment

string

注释。

测试表

TableType

string

表类型,取值与元数据采集器类型相关。

TABLE

PartitionKeys

array

分区键列表,非分区表时为空。

string

分区键。

ds

ParentMetaEntityId

string

父层级元数据实体 ID,可参考元数据实体相关概念说明

  • 对于支持 schema 的类型(maxcompute/holo/postgresql/sqlserver/hybriddb_for_postgresql/oracle, 其中 maxcompute 类型需要所属项目开启三层模型), ParentMetaEntityId为表所属数据库模式,格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称}:${模式名称},对于不存在的层级空字符占位

  • 其他类型时,ParentMetaEntityId为表所属数据库,格式为${EntityType}:${实例 ID 或转义后的 URL}:${数据目录标识}:${数据库名称},对于不存在的层级空字符占位。

说明

对于 maxcompute 和 dlf 类型,实例 ID 使用空字符占位。对于 maxcompute 类型,数据库名称即为 maxcompute 项目名称。

说明

starrocks 类型的数据目录标识为目录名称,dlf 类型的数据目录标识为目录 ID, 其他类型不支持目录层级,可用空字符占位。

几种常用类型的 ParentMetaEntityId 格式参考如下

maxcompute-project:::project_name

maxcompute-schema:::project_name:schema_name (仅项目开启三层模型时)

dlf-database::catalog_id:database_name

hms-database:instance_id::database_name

holo-schema:instance_id::database_name:schema_name

mysql-database:(instance_id|encoded_jdbc_url)::database_name

说明

其中
instance_id: 实例 ID,对应数据源以实例模式注册时需要提供
encoded_jdbc_url: JDBC 连接串的 URLEncode 编码,对应数据源以连接串方式注册时需要提供
catalog_id: dlf 目录 ID
project_name: maxcompute 项目名称
database_name: 数据库名称
schema_name: schema 名称

dlf-database::catalog_id:database_name

CreateTime

integer

创建时间(毫秒级时间戳)。

1736852168000

ModifyTime

integer

修改时间(毫秒级时间戳)。

1736852168000

TechnicalMetadata

object

技术元数据。

Owner

string

负责人。

test_user

Location

string

存储位置。

oss://test-bucket/test_tbl

Compressed

boolean

是否为压缩表。

false

InputFormat

string

输入格式。

org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat

OutputFormat

string

输出格式。

org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat

SerializationLibrary

string

SerDe 使用的类。

org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe

Parameters

object

参数信息。

string

参数信息。

value

BusinessMetadata

object

业务元数据,DataWorks 相关,包含使用说明,标签,类目,上游产出任务以及扩展信息。

Readme

string

使用说明。

## 使用说明

CustomAttributes

object

自定义属性值,key 为自定义属性标识,value 为属性值列表

array

属性值列表

string

属性值

张三

Tags

array

标签列表。

object

标签信息。

Key

string

标签键,非空。

tag_key

Value

string

标签值,可为空。

tag_value

Categories

array

所属类目列表。

array

单一类目的层级列表(多级类目)。

object

类目信息。

Id

string

类目 ID。

CATEGORY.456

Name

string

名称。

测试类目

ParentId

string

父类目 ID,可为空。

CATEGORY.123

UpstreamTasks

array

上游产出任务列表。

object

上游产出任务。

Id

integer

任务 ID。

123456

Name

string

任务名称。

test_task

Extension

object

扩展信息,目前仅 MaxCompute 类型支持。

ProjectId

integer

工作空间 ID。

234

EnvType

string

环境类型,枚举值,取值范围

  • Prod:生产环境。

  • Dev:开发环境。

Dev

ViewCount

integer

浏览次数。

0

ReadCount

integer

读取次数。

0

FavorCount

integer

收藏次数。

0

StatisticsInfos

object

string