开通Dataphin--半托管

更新时间:
复制为 MD 格式

开通Dataphin服务后,即可以使用Dataphin的功能。本文为您介绍如何开通Dataphin。

购买说明

  • 暂不支持金融云账号购买Dataphin实例。

  • Dataphin支持到期自动续费(在软件付费配置区域选中自动续费,仅续费Dataphin软件,底层资源需自行续费),可避免因资源到期停机而影响业务;自动续费周期为每月,可随时取消。更多详情请参见续费--半托管

  • 购买Dataphin成功后,通常需要2小时到3小时开通服务,请您耐心等待。如果开通服务失败,请联系Dataphin运维部署团队。

  • 支持叠加购买不同的增值模块,详情请参见计费说明--半托管

注意事项

开通Dataphin前,请您了解以下几点:

  • 购买前建议您先联系阿里云售前咨询并提供企业数据建设需求及背景信息。待阿里云售前咨询帮您确认Dataphin当前版本及功能是否符合您的需求后,会为您开通购买权限。

  • Dataphin不支持无条件退款,购买前请您仔细确认购买的Dataphin版本。

    购买Dataphin后,如果因特殊情况需要申请退款,请您提交工单并联系对应客户经理进行沟通,确认符合退款条件后(非产品问题不予退款),系统将根据您的使用情况扣除对应费用,后台执行退款操作。

  • Dataphin支持包年包月购买模式。

  • Dataphin实例到期停机且在15天的保留期内时,仅支持续费操作。

购买Dataphin实例

  1. 使用主账号登录阿里云官网

  2. 在阿里云官网,鼠标悬停至产品后,再将鼠标悬停至左侧导航栏的大数据计算上,单击数据开发与服务列下的智能数据建设与治理Dataphin

  3. Dataphin产品详情页单击管理控制台/立即开通(半托管版),进入Dataphin购买页面。

  4. 在购买页面,配置实例的名称、选择购买地域、购买方式、购买时长等,同时,您可以根据业务需求选择增值功能包。

    参数

    描述

    服务实例名称

    输入Dataphin实例的名称,将作为展示名称展示在Dataphin控制台上,创建后无法修改,请谨慎填写。

    需包含数字、英文字母、短划线(-)和下划线(_),不超过64个字符。

    名称需符合服务中定义的资源的名称规范

    地域

    选择购买Dataphin实例的地域。系统支持的地域包括:

    • 中国:华北1(青岛)、华北2(北京)、华北5(呼和浩特)、华北6(乌兰察布)、 华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华中1(武汉-本地地域)、西南1(成都)、中国(香港)。

    • 亚太:日本(东京)、韩国(首尔)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、泰国(曼谷)。

    • 欧洲与美洲美国(弗吉尼亚)、英国(伦敦)、德国(法兰克福)

    • 中东与印度:阿联酋(迪拜)。

    软件付费配置

    付费方式

    系统仅支持包年包月付费方式。

    付费时长

    系统默认选中1个月。支持选择的付费时长包括:1123

    自动续费

    开启后仅支持对Dataphin软件进行续费,暂不支持对底层资源进行续费。

    Dataphin版本

    系统默认填充最新版本号。

    Dataphin功能选择

    数据处理单元

    系统默认开通500,按需选择您所需要的规格,可选择:50010001500200025003000350040004500500055006000650070007500800085009000950010000

    实时研发(选购)

    提供一站式、高性能实时大数据处理方案,提供低门槛、专业化的实时计算开发环境,广泛应用于流式数据处理等场景。

    支持选购的规格为标准版,如果您暂时不需要开通该功能,可选暂不选择

    智能运维(选购)

    包含基线监控限流配置功能,为业务数据产出时效性及系统稳定性提供保障,同时能降低人工运维成本,提升运维效率。

    系统默认赠送3条基线+1条限流(免费),如果您希望开通更高规格,可选择标准版

    数据标准(选购)

    为您提供标准的统一创建与管理、参考数据管理以及标准与资产元数据关联的功能,同时可结合质量监控能力,帮助企业进一步提升贯穿事前-事中-事后的全链路资产治理能力。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    资产质量(选购)

    支持从物理视角和逻辑视角对数据资产进行质量监控,帮助您高效配置质量规则并执行校验任务,同时为您提供清晰全面的数据质量报告和质量概况,帮助您快速了解质量规则覆盖程度并识别数据质量风险。

    支持选购的规格为域内版域内版+全域版,如果您暂时不需要开通该功能,可选暂不选择

    资产安全(选购)

    支持定义数据的业务分类和安全等级并构建数据识别规则,同时支持针对敏感数据设置脱敏规则,以保障您的数据资产安全性。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    资源治理(选购)

    提供从元数据的采集、元数据统一模型建立、治理项为核心的驱动闭环等功能,以支撑数据资产管理应用层能力,服务于资产管理者与开发者,构建可管可控的数据资产健康体系。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    OpenAPI

    Dataphin对外提供的操作入口,允许开发者在多个不同应用程序之间共享数据、功能和服务,帮助开发者更高效地开发和扩展应用程序。Dataphin提供了包含研发、运维、资产和平台管理等多个功能模块的OpenAPI接口。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    数据服务(选购)

    可以通过标准化、配置化方式,帮助您统一数据主题单元,并进一步支持面向主题的自助API配置、调试、预发、上线及调用监控管理,做到数据使用权限字段粒度控制,有效降低业务的数据消费门槛,同时为您保障数据开放的安全性。

    支持选购的规格包括api.base(最大500 QPS/50并发);如果您暂时不需要开通该功能,可选暂不选择

    说明
    • QPS:在一定时间内,平均每秒可处理完成的请求数据量,即每秒能处理的API请求数。

    • 并发(Currency):在同一时间点能够处理的API请求数据量。

    QPS、并发与响应时间(RT)息息相关,在并发一定的情况下,API的响应时间越长,QPS越低。可以使用以下公式来表达它们之间的关系:

    QPS = Currency / RT(以秒为单位)

    实时集成(选购

    支持从MySQL、Oracle、PostgreSQL等数据源增量集成到Hive、Kafka、DataHub、MaxCompute,以及从Microsoft SQL Sever、IBM DB2等数据源同步到Kafka多种场景。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    网关类型

    系统目前仅支持Dataphin自研网关

    标签工厂(选购)

    通过可视化标签加工方式为标签构建方(提供离线、实时标签开发功能,提高标签开发效率,降低开发门槛)。

    支持选购的规格包括离线版实时版离线版+群组圈选离线版+实时版离线版+群组圈选+群组权限;如果您暂时不需要开通该功能,可选暂不选择

    行级权限(选购)

    支持对计算源和数据源中的表进行行级权限管控,灵活控制个人账号、用户组、生产账号可以查看的范围。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    租户数量

    支持在单个Dataphin实例中创建多个租户,且不同租户可依赖不同的计算引擎。支持选择创建的租户数量包括:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个。

    注册调度集群(选购)

    通过注册的调度集群连接另一网络中的数据库,避免数据跨网络传输,常用于云上云下都存在集群的场景中。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    元数据采集(选购)

    支持自动采集大数据存储引擎的元数据信息,例如:Hive、StarRocks、Hologress等。

    支持选购的规格为默认版本大数据引擎

    元数据管理(选购)

    支持丰富和管理对象的属性、构建不同对象的元模型。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    资产运营(选购)

    支持资产上架管理和目录管理,以专题方式对资产进行分组管理并配置可见范围,实现全域资产的统一管理,简化资产查找与消费。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    资产消费(选购)

    数据权限统一托管到Dataphin,可在资产目录申请权限后一键跳转BI平台直接分析,免去数据源/数据集的创建流程,打通消费最后一公里。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    说明

    需购买资产运营功能才能使用资产消费功能。

    X-运维助手(选购)

    移动运维助手,可一键查询实例运行状态、智能诊断异常根因并提供修复建议。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-编码助手(选购)

    代码智能补全与纠错,结合上下文语义自动生成代码。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-分析(选购)

    配合智能分析专辑使用,自然语言提问获得查询 SQL,可一键执行获得取数结果。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-数据工程(选购)

    自动化数据集成、主题域建模、概念建模、逻辑建模、数据处理及指标生成。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-数据标准(选购)

    通过大模型能力,从数据表提取码表、标准定义;利用LLM,智能推荐”字段-标准“映射关系。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-数据安全(选购)

    利用大语言模型识别敏感数据,推荐“字段-分类分级”识别结果。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-资产问答(选购)

    基于知识库,使用自然语言检索数据资产。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-目录管理(选购)

    基于大模型能力对表、指标资产进行属性的丰富。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-数据质量(选购)

    结合采样数据、血缘分析溯源质量问题根因,智能生成整改建议及影响评估,实现治理闭环。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    X-应用创作(选购)

    基于Dataphin提供的数据服务API,结合用户需求描述,快速构建微应用,加速数据价值释放。

    支持选购的规格为标准版;如果您暂时不需要开通该功能,可选暂不选择

    Dataphin域名设置

    产品访问域名

    访问Dataphin产品实例的域名,不可与OpenAPI访问域名和数据服务访问域名重复。例如:dataphin.yourcompany.com。

    支持小写英文字母、阿拉伯数字、短划线(-)和半角句号(.),短划线不支持单独或连续出现,也不支持放在开头和结尾,域名长度不超过63个字符。

    OpenAPI访问域名

    仅开启OpenAPI功能时支持该配置项。

    通过OpenAPI访问Dataphin产品实例的域名,不可与产品访问域名和数据服务访问域名重复。例如:dataphin-openapi.yourcompany.com。

    命名规则与产品访问域名相同。

    数据服务访问域名

    仅开启数据服务功能时支持该配置项。

    指向数据服务应用的访问域名,不可与产品访问域名和OpenAPI访问域名重复。例如:dataphin-dataservice.yourcompany.com。

    命名规则与产品访问域名相同。

    开通公网访问

    • 开启后,系统将为Ingress LB实例自动创建按流量计费EIP,在本地将EIP和域名绑定在Host后,即可在非办公网访问Dataphin实例。

    • 如需限制仅办公网可访问Dataphin实例,请关闭。

    密钥配置

    密钥对名称

    用于登录ECS机器的密钥对。

    网络配置

    可用区1可用区2

    Dataphin的所有底层资源都采用多可用区实例部署,用于提供容灾解决方案。

    VPC ID

    请选择用于部署Dataphin实例的VPC,请慎重选择,创建后不可更改

    交换机ID1交换机ID2

    选择所选VPC下的两台交换机。

    Kubernetes版本

    根据系统默认配置。

    Pod网络CIDRService CIDR

    • 容器服务KubernetesACKDataphin所依赖的底层资源之一,在部署ACK时所采用的网络插件为Flannel,需填写CIDR地址,详情请参见TerwayFlannel的对比

    • Pod CIDRService CIDR都是虚拟网段,但是网段不可与VPC交换机重叠,两者之间也不可互相重叠。例如:VPC网段用的是172.16.0.0/12,KubernetesPod地址段就不能使用172.16.0.0/16、172.17.0.0/16等,因为这些地址都包含在172.16.0.0/12里。

    • Pod CIDRService CIDR的预留网段数量,将影响Dataphin任务的并发度,推荐预留IP数大于2048(子网掩码长度不大于21),请慎重选择,创建后不可更改,详情请参见Flannel网络模式

    自动配置NAT网关

    用于集群节点和应用访问公网。

    • 开启后,若选择的VPC中已有NAT网关,则ACK将默认使用该网关并自动配置SNAT规则;若选择的VPC中无NAT网关,则ACK将自动创建一个NAT网关并自动配置SNAT规则。

    • 关闭后,因Dataphin部署需要公网访问拉取镜像,您需自行保证ACK集群可以正常访问公网,否则可能造成Dataphin部署失败

    高级配置

    应用节点池实例规格

    根据应用部署模式选择合适的节点规格和数量,避免不同大小规格混用,支持选择规格为16C128G(ecs.r9i.4xlarge)16C128G(ecs.r8i.4xlarge)16C128G(ecs.u2i-c1m8.4xlarge)16C128G(ecs.r7.4xlarge)、16C128G(ecs.u1-c1m8.4xlarge)16C128G(ecs.hfr7.4xlarge)

    说明

    应用部署高可用模式最大资源需求为40C320G,非高可用模式最大资源需求为20C160G。

    应用节点池初始节点数

    根据应用部署模式,合理配置节点池初始节点数,推荐数量为3,最低数量为2。当数据为2时,不保证服务高可用功能。

    调度节点池实例规格

    根据调度任务数量需求,合理配置节点池实例规格,支持规格为24C96G(ecs.g9i.6xlarge)24C96G(ecs.g8i.6xlarge)24C96G(ecs.g7.6xlarge)24C96G(ecs.hfg7.6xlarge)24C96G(ecs.hfg6.6xlarge)

    调度节点池初始节点数

    根据调度任务数量需求,合理配置节点池初始节点数,推荐数量为2,最低数量为1。当数据为1时,不保证服务高可用功能。

    Dataphin应用部署副本数

    增加副本前请确保应用节点池资源充足,默认为2。

    PostgreSQL规格

    选择PostgreSQL数据库的最大连接数,支持的规格为4C16G(最大1600连接)8C16G(最大1600连接)16C32G(最大3200连接)

    PostgreSQL数据库初始磁盘大小(GB)

    主要用于存储调度实例和业务元数据,默认为400G,支持配置200G~400G之间存储空间,按照5GB一个规格递增。

  5. 请您仔细核对购买信息,确认无误后单击下一步:确认订单

  6. 确认订单页面,请您确认购买的Dataphin实例规格。确认无误后,单击服务协议后的智能数据建设与治理服务协议,请仔细阅读服务协议内容。确认服务协议内容后,选中我已阅读并同意智能数据建设与治理服务协议,单击去支付

    image.png

后续步骤

完成Dataphin开通后,您需获取阿里云初始账号、IP地址以及绑定Host,以进行后续的数据开发,详情请参见部署完成后如何冷启动