开通Dataphin服务后,即可以使用Dataphin的功能。本文为您介绍如何开通Dataphin。
购买说明
注意事项
开通Dataphin前,请您了解以下几点:
购买Dataphin实例
使用主账号登录阿里云官网。
在阿里云官网,鼠标悬停至产品后,再将鼠标悬停至左侧导航栏的大数据计算上,单击数据开发与服务列下的智能数据建设与治理Dataphin。
在Dataphin产品详情页单击管理控制台/立即开通(半托管版),进入Dataphin购买页面。
在购买页面,配置实例的名称、选择购买地域、购买方式、购买时长等,同时,您可以根据业务需求选择增值功能包。
参数
描述
服务实例名称
输入Dataphin实例的名称,将作为展示名称展示在Dataphin控制台上,创建后无法修改,请谨慎填写。
需包含数字、英文字母、短划线(-)和下划线(_),不超过64个字符。
名称需符合服务中定义的资源的名称规范。
地域
选择购买Dataphin实例的地域。系统支持的地域包括:
中国:华北1(青岛)、华北2(北京)、华北5(呼和浩特)、华北6(乌兰察布)、 华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华中1(武汉-本地地域)、西南1(成都)、中国(香港)。
亚太:日本(东京)、韩国(首尔)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、泰国(曼谷)。
欧洲与美洲:美国(弗吉尼亚)、英国(伦敦)、德国(法兰克福)。
中东与印度:阿联酋(迪拜)。
软件付费配置
付费方式
系统仅支持包年包月付费方式。
付费时长
系统默认选中1个月。支持选择的付费时长包括:1月、1年、2年、3年。
自动续费
开启后仅支持对Dataphin软件进行续费,暂不支持对底层资源进行续费。
Dataphin版本
系统默认填充最新版本号。
Dataphin功能选择
数据处理单元
系统默认开通500,按需选择您所需要的规格,可选择:500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000。
实时研发(选购)
提供一站式、高性能实时大数据处理方案,提供低门槛、专业化的实时计算开发环境,广泛应用于流式数据处理等场景。
支持选购的规格为标准版,如果您暂时不需要开通该功能,可选暂不选择。
智能运维(选购)
包含基线监控及限流配置功能,为业务数据产出时效性及系统稳定性提供保障,同时能降低人工运维成本,提升运维效率。
系统默认赠送3条基线+1条限流(免费),如果您希望开通更高规格,可选择标准版。
数据标准(选购)
为您提供标准的统一创建与管理、参考数据管理以及标准与资产元数据关联的功能,同时可结合质量监控能力,帮助企业进一步提升贯穿事前-事中-事后的全链路资产治理能力。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
资产质量(选购)
支持从物理视角和逻辑视角对数据资产进行质量监控,帮助您高效配置质量规则并执行校验任务,同时为您提供清晰全面的数据质量报告和质量概况,帮助您快速了解质量规则覆盖程度并识别数据质量风险。
支持选购的规格为域内版、域内版+全域版,如果您暂时不需要开通该功能,可选暂不选择。
资产安全(选购)
支持定义数据的业务分类和安全等级并构建数据识别规则,同时支持针对敏感数据设置脱敏规则,以保障您的数据资产安全性。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
资源治理(选购)
提供从元数据的采集、元数据统一模型建立、治理项为核心的驱动闭环等功能,以支撑数据资产管理应用层能力,服务于资产管理者与开发者,构建可管可控的数据资产健康体系。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
OpenAPI
是Dataphin对外提供的操作入口,允许开发者在多个不同应用程序之间共享数据、功能和服务,帮助开发者更高效地开发和扩展应用程序。Dataphin提供了包含研发、运维、资产和平台管理等多个功能模块的OpenAPI接口。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
数据服务(选购)
可以通过标准化、配置化方式,帮助您统一数据主题单元,并进一步支持面向主题的自助API配置、调试、预发、上线及调用监控管理,做到数据使用权限字段粒度控制,有效降低业务的数据消费门槛,同时为您保障数据开放的安全性。
支持选购的规格包括api.base(最大500 QPS/50并发);如果您暂时不需要开通该功能,可选暂不选择。
说明QPS:在一定时间内,平均每秒可处理完成的请求数据量,即每秒能处理的API请求数。
并发(Currency):在同一时间点能够处理的API请求数据量。
QPS、并发与响应时间(RT)息息相关,在并发一定的情况下,API的响应时间越长,QPS越低。可以使用以下公式来表达它们之间的关系:
QPS = Currency / RT(以秒为单位)。实时集成(选购)
支持从MySQL、Oracle、PostgreSQL等数据源增量集成到Hive、Kafka、DataHub、MaxCompute,以及从Microsoft SQL Sever、IBM DB2等数据源同步到Kafka多种场景。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
网关类型
系统目前仅支持Dataphin自研网关。
标签工厂(选购)
通过可视化标签加工方式为标签构建方(提供离线、实时标签开发功能,提高标签开发效率,降低开发门槛)。
支持选购的规格包括离线版、实时版、离线版+群组圈选、离线版+实时版或离线版+群组圈选+群组权限;如果您暂时不需要开通该功能,可选暂不选择。
行级权限(选购)
支持对计算源和数据源中的表进行行级权限管控,灵活控制个人账号、用户组、生产账号可以查看的范围。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
租户数量
支持在单个Dataphin实例中创建多个租户,且不同租户可依赖不同的计算引擎。支持选择创建的租户数量包括:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个。
注册调度集群(选购)
通过注册的调度集群连接另一网络中的数据库,避免数据跨网络传输,常用于云上云下都存在集群的场景中。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
元数据采集(选购)
支持自动采集大数据存储引擎的元数据信息,例如:Hive、StarRocks、Hologress等。
支持选购的规格为默认版本和大数据引擎。
元数据管理(选购)
支持丰富和管理对象的属性、构建不同对象的元模型。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
资产运营(选购)
支持资产上架管理和目录管理,以专题方式对资产进行分组管理并配置可见范围,实现全域资产的统一管理,简化资产查找与消费。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
资产消费(选购)
数据权限统一托管到Dataphin,可在资产目录申请权限后一键跳转BI平台直接分析,免去数据源/数据集的创建流程,打通消费最后一公里。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
说明需购买资产运营功能才能使用资产消费功能。
X-运维助手(选购)
移动运维助手,可一键查询实例运行状态、智能诊断异常根因并提供修复建议。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-编码助手(选购)
代码智能补全与纠错,结合上下文语义自动生成代码。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-分析(选购)
配合智能分析专辑使用,自然语言提问获得查询 SQL,可一键执行获得取数结果。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-数据工程(选购)
自动化数据集成、主题域建模、概念建模、逻辑建模、数据处理及指标生成。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-数据标准(选购)
通过大模型能力,从数据表提取码表、标准定义;利用LLM,智能推荐”字段-标准“映射关系。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-数据安全(选购)
利用大语言模型识别敏感数据,推荐“字段-分类分级”识别结果。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-资产问答(选购)
基于知识库,使用自然语言检索数据资产。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-目录管理(选购)
基于大模型能力对表、指标资产进行属性的丰富。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-数据质量(选购)
结合采样数据、血缘分析溯源质量问题根因,智能生成整改建议及影响评估,实现治理闭环。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
X-应用创作(选购)
基于Dataphin提供的数据服务API,结合用户需求描述,快速构建微应用,加速数据价值释放。
支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择。
Dataphin域名设置
产品访问域名
访问Dataphin产品实例的域名,不可与OpenAPI访问域名和数据服务访问域名重复。例如:dataphin.yourcompany.com。
支持小写英文字母、阿拉伯数字、短划线(-)和半角句号(.),短划线不支持单独或连续出现,也不支持放在开头和结尾,域名长度不超过63个字符。
OpenAPI访问域名
仅开启OpenAPI功能时支持该配置项。
通过OpenAPI访问Dataphin产品实例的域名,不可与产品访问域名和数据服务访问域名重复。例如:dataphin-openapi.yourcompany.com。
命名规则与产品访问域名相同。
数据服务访问域名
仅开启数据服务功能时支持该配置项。
指向数据服务应用的访问域名,不可与产品访问域名和OpenAPI访问域名重复。例如:dataphin-dataservice.yourcompany.com。
命名规则与产品访问域名相同。
开通公网访问
开启后,系统将为Ingress LB实例自动创建按流量计费EIP,在本地将EIP和域名绑定在Host后,即可在非办公网访问Dataphin实例。
如需限制仅办公网可访问Dataphin实例,请关闭。
密钥配置
密钥对名称
用于登录ECS机器的密钥对。
网络配置
可用区1、可用区2
Dataphin的所有底层资源都采用多可用区实例部署,用于提供容灾解决方案。
VPC ID
请选择用于部署Dataphin实例的VPC,请慎重选择,创建后不可更改。
交换机ID1、交换机ID2
选择所选VPC下的两台交换机。
Kubernetes版本
根据系统默认配置。
Pod网络CIDR、Service CIDR
容器服务Kubernetes版ACK是Dataphin所依赖的底层资源之一,在部署ACK时所采用的网络插件为Flannel,需填写CIDR地址,详情请参见Terway与Flannel的对比。
Pod CIDR和Service CIDR都是虚拟网段,但是网段不可与VPC交换机重叠,两者之间也不可互相重叠。例如:VPC网段用的是172.16.0.0/12,Kubernetes的Pod地址段就不能使用172.16.0.0/16、172.17.0.0/16等,因为这些地址都包含在172.16.0.0/12里。
Pod CIDR和Service CIDR的预留网段数量,将影响Dataphin任务的并发度,推荐预留IP数大于2048(子网掩码长度不大于21),请慎重选择,创建后不可更改,详情请参见Flannel网络模式。
自动配置NAT网关
用于集群节点和应用访问公网。
开启后,若选择的VPC中已有NAT网关,则ACK将默认使用该网关并自动配置SNAT规则;若选择的VPC中无NAT网关,则ACK将自动创建一个NAT网关并自动配置SNAT规则。
关闭后,因Dataphin部署需要公网访问拉取镜像,您需自行保证ACK集群可以正常访问公网,否则可能造成Dataphin部署失败。
高级配置
应用节点池实例规格
根据应用部署模式选择合适的节点规格和数量,避免不同大小规格混用,支持选择规格为16C128G(ecs.r9i.4xlarge)、16C128G(ecs.r8i.4xlarge)、16C128G(ecs.u2i-c1m8.4xlarge)、16C128G(ecs.r7.4xlarge)、16C128G(ecs.u1-c1m8.4xlarge)、16C128G(ecs.hfr7.4xlarge)。
说明应用部署高可用模式最大资源需求为40C320G,非高可用模式最大资源需求为20C160G。
应用节点池初始节点数
根据应用部署模式,合理配置节点池初始节点数,推荐数量为3,最低数量为2。当数据为2时,不保证服务高可用功能。
调度节点池实例规格
根据调度任务数量需求,合理配置节点池实例规格,支持规格为24C96G(ecs.g9i.6xlarge)、24C96G(ecs.g8i.6xlarge)、24C96G(ecs.g7.6xlarge)、24C96G(ecs.hfg7.6xlarge)、24C96G(ecs.hfg6.6xlarge)。
调度节点池初始节点数
根据调度任务数量需求,合理配置节点池初始节点数,推荐数量为2,最低数量为1。当数据为1时,不保证服务高可用功能。
Dataphin应用部署副本数
增加副本前请确保应用节点池资源充足,默认为2。
PostgreSQL规格
选择PostgreSQL数据库的最大连接数,支持的规格为4C16G(最大1600连接)、8C16G(最大1600连接)、16C32G(最大3200连接)。
PostgreSQL数据库初始磁盘大小(GB)
主要用于存储调度实例和业务元数据,默认为400G,支持配置200G~400G之间存储空间,按照5GB一个规格递增。
请您仔细核对购买信息,确认无误后单击下一步:确认订单。
在确认订单页面,请您确认购买的Dataphin实例规格。确认无误后,单击服务协议后的智能数据建设与治理服务协议,请仔细阅读服务协议内容。确认服务协议内容后,选中我已阅读并同意智能数据建设与治理服务协议,单击去支付。

后续步骤
完成Dataphin开通后,您需获取阿里云初始账号、IP地址以及绑定Host,以进行后续的数据开发,详情请参见部署完成后如何冷启动。