新增数据表
数据表是项目中的原始数据,可通过数据校验和数据授权后,被项目的控制台作为离线样本使用。当您新建表结构模板后,可基于新建的表结构模板新增数据表。本文介绍通过管理控制台新增数据表的方法。
前置准备
在添加数据表前,需确保您已完成以下操作:
已安装、部署节点并完成节点间的授权。具体操作,请参见 隐私计算节点。
该节点用于存储目标数据表,即待新增的数据表。节点使用引擎种类的选择,可参考以下两个条件:
节点使用引擎的种类依赖于当前节点参与的项目类型,关于项目类型和节点引擎种类的关系,请参见 引擎。
目标数据表所属节点使用的引擎种类为联邦学习、训练或分析引擎,不能为预测引擎。
已在管理控制台中新建表结构模板。具体操作,请参见 新建表结构模板。
已将目标数据表上传到目标节点的服务器中,目标节点为步骤 1 安装、部署和授权的节点。
说明如果上传的是 CSV 文件,则 CSV 文件的首行需要有表头,即列名称。您可以将类似以下两个 CSV 文件上传到训练节点服务器的
~/nueva/agent/data/dataset/sample/data
目录中,以便后续添加数据表文件。
操作步骤
登录 蚂蚁隐私计算服务平台。
在左侧导航栏,选择 我的资源 > 数据资产。
在 数据表 页签下,单击目标表结构模板右侧的 新增数据表。
在 新建数据表 面板,选择目标数据表的文件类型。
数据表文件类型依赖于目标数据表参与的项目类型,以下是不同项目中所需的数据表文件类型:
CSV 文件数据表:适用于联邦建模、多方安全建模和隐私求交项目。
MySQL 数据表:适用于多方安全分析项目。
根据您选择的数据表文件类型,填写相关信息。
数据表类型为 CSV 文件数据表
填写以下关于 CSV 文件数据表的信息。
参数
说明
所属节点
选择目标数据表所属的节点,节点为 前置准备 的步骤 1 中安装、部署和授权的节点。
数据地址
数据表文件的存储地址。填写的路径为节点中
~/nueva/agent/data/dataset
目录的相对路径,并以./
开头,例如./data/example.csv
。数据表名称
自定义数据表名称。要求如下:
以英文字母开头,可包含英文字母、数字、下划线(_)和短划线(-)。
总长度不超过 64 个字符。
描述
选填,数据表的描述信息。
单击 校验数据结构,对数据结构进行校验。
校验通过需满足以下条件:
数据地址存在对应的数据文件。
对应的数据文件表结构符合当前表结构模板。
校验通过后单击 确定。
在 数据表 页签,单击目标表结构模板左侧的,在下拉列表中,确认新增的数据表状态为 可用。
说明如果新增的数据表状态为 不可用,表示数据连接失效,请执行以下操作:
单击目标数据表名称,在 数据表详情 页面单击 编辑,进入 编辑数据表 页面。
单击 校验数据结构,获取系统返回的报错信息,并对比 所属节点、数据地址 和 数据表名称,在节点本地检查并修改数据信息。
确认节点本地数据无误后,在 编辑数据表 页面单击 校验数据结构,确认系统返回 校验成功 字段。
数据表类型为 MySQL 数据表
填写以下关于 MySQL 数据表的信息。
参数
说明
所属节点
选择目标数据表所属的节点,节点为 前置准备 的步骤 1 中安装、部署和授权的节点。
物理数据库名称
目标节点中存放 MySQL 数据表的 Database 数据库的名称。
物理数据表名称
MySQL 数据表在 MySQL 数据库的真实名称。
描述
选填,数据表的描述信息。
配置完成后单击 确定。