项目是Dataphin的基本组织单元,是进行多用户隔离和访问控制的主要边界。您开通Dataphin服务后,需要通过项目使用Dataphin。本文为您介绍如何创建项目。

背景信息

Dataphin支持两种开发模式的项目,详细说明见下表。
项目的模式 描述
Dev-Prod模式
完成项目的创建后,系统默认生成了开发环境(Dev项目)和生产环境(Prod项目)。Prod项目保障了生产环境项目中的数据安全。如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。 fagag
Basic模式 完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发效率,研发人员职能边界模糊,计算存储预算有限制,推荐此模式。vaga
注意
  • Basic模式不支持升级为Dev-Prod模式,且Basic模式存在直接变更生产风险,请您谨慎选择。
  • 如果选择了Basic模式,请您谨慎管理项目成员,以控制数据生产的稳定性。

前提条件

在开始执行操作前,请确认您以满足以下条件:
  • 如果您需要研发流批一体任务,您需要根据业务需求选择新建Ververcia Flink计算源、创建Blink计算源或开源Flink计算引擎。具体操作,请参见新建Ververica Flink计算源
  • 如果您选择的Dataphin的计算引擎为AnalyticDB for PostgreSQL,且数据研发过程中需要使用数据集成、即席查询、AnalyticDB for PostgreSQL的SQL计算任务等功能,则在创建项目空间前需要完成AnalyticDB for PostgreSQL计算源的创建,请参见新建AnalyticDB For PostgreSQL计算源
  • 如果您选择的Dataphin的计算引擎为MaxCompute,且数据研发过程中需要使用规范建模、即席查询、MaxCompute计算任务等功能,则在创建项目空间前需要完成MaxCompute计算源的创建,请参见新建MaxCompute计算源
  • Dataphin支持添加Hologres加速计算源至已绑定MaxCompute计算源的项目,加速数据服务的查询速度。如果您需要加速业务数据的查询速度,则在创建项目空间前需要创建加速计算源, 详情请参见创建加速计算源

使用限制

  • 系统支持超级管理员、系统管理员、板块架构师角色的账号创建项目。
  • 系统仅支持项目超级管理员、系统管理员、板块架构师角色的账号,具备关闭和开启数据表读写的权限申请。

步骤一:选择项目类型

  1. 请参见入口介绍,进入数仓规划页面。
  2. 数仓规划页面,按照下图操作指引,进入新建项目对话框。
    gagaga
  3. 新建项目对话框,选择创建项目的模式为Dev-Prod模式Basic模式
    gagaga
  4. 单击下一步

步骤二:配置项目的归属板块和基本信息

新建项目对话框的归属板块基本信息区域,配置参数。Dev-Prod模式Basic模式需要配置的参数相同,下图以Dev-Prod模式为例为您介绍。gagaga
区域 参数名称 描述
归属板块 数据板块 选择项目所属的数据板块。
基本信息 公用英文名 填写项目的公用英文名。命名规则如下:
  • 包含字母、数字、下划线(_)
  • 不支持以LD_开头。
  • 不能超过64个字符。

开发环境项目英文名默认以_dev作为后缀。

计算引擎为MaxCompute时,建议项目的公用英文名与对应的MaxCompute项目名一致。

公用名称 填写项目的公用名称。命名规则如下:
  • 包含汉字、数字、字母、下划线(_)或短划线(-)。
  • 不支持以LD_开头。
  • 不能超过64字符。
计算源类型 选择计算源类型后选择对应的计算源。
注意
  • 已绑定项目的计算源,无法被其他项目再次绑定。
  • Dev项目和Prod项目的计算源需保持一致。
根据Dataphin初始化的计算引擎不同,支持选择的计算源类型也不同,详细说明如下:
  • Dataphin初始化为MaxCompute,则需要选择计算源类型,支持选择的离线引擎包括MaxCompute、Hologres;支持的实时引擎Alibaba Blink、Ververica Flink、Flink。
  • Dataphin初始化为AnalyticDB for PostgreSQL,则支持选择的离线引擎包括AnalyticDB for PostgreSQL;支持的实时引擎Alibaba Blink、Ververica Flink、Flink。
描述信息 填写对项目的简单描述。

步骤三:配置项目的业务信息及安全信息

Dev-Prod模式Basic模式需要配置的参数相同,下图以Dev-Prod模式为例为您介绍。gagaga
区域 参数 描述
业务信息 空间类型 区分项目开发任务及产出数据特征,默认为应用层。空间类型包括3种:
  • 中间层
  • 贴源层
  • 基础层:来自各个业务数据库的原始数据存储,是后续所有数据建设的来源与基础,也称为垂直数据中心。
  • 公共层:基于各业务数据,抽象公共的主题,沉淀标准、规范、可共用的数据,是连接基础层与应用层的中间桥梁,也称为公共数据中心。
  • 应用层:面向业务需求,定义生成可应用于不同场景的个性化、多样化的数据指标。
  • 通用层
安全设置 数据读权限申请
开启或关闭数据读权限申请:
  • 关闭数据读权限申请后,当前项目下物理表及元表不支持申请查询权限,同时系统不收回已申请过的查询权限。
  • 开启数据读权限申请后,当前项目下的物理表及元表支持申请查询权限。申请查询权限的更多信息,请参见申请权限
数据写权限申请
开启或关闭数据写权限申请:
  • 关闭数据写权限申请后,当前项目下的物理表及元表不支持申请写入权限,同时系统不收回已申请过的写入权限。
  • 开启数据写权限申请后,当前项目下的物理表及元表支持申请写入权限。申请写入权限的更多信息,请参见申请权限
更多设置 默认功能菜单。

后续步骤

创建完项目后,即可进入工作区开始数据的研发。faga