创建安全联邦学习任务(任务模式)
场景描述
A有一张数据表demo_fl_alice_train_original用于记录人群属性(学历、工作经历等),标签是income;B有一张数据表demo_fl_bob_train_original用于记录人群属性(关系、民族等)。
需求是A想联合B数据,使用XGB,进行联合建模。可通过创建TrustML/Training任务实现。
步骤一:新建TrustML/Training任务
在DataTrust首页,单击顶部菜单栏的通用计算。进入任务研发页面。
在通用方案中,选择创建安全联邦学习(任务模式)任务。
在创建任务页面中,任务类型选择TrustML/Training任务。
步骤二:配置任务参数信息
在创建任务页面,配置基础信息参数。
参数 | 描述 |
任务名称 | 请填写任务的名称。 |
运行方式 | 指使用哪一种技术方式实现,目前支持安全多方、联邦学习两种。 |
调度规则 | 支持日常不调度、按日调度、按周调度、按月调度四种,配置后会按配置的周期定时跑该任务。
|
训练类型 | 仅支持特征切分。
|
特征分布 | 支持使用方【X1+Y】+加持方【X2】和使用方【Y】+加持方【X2】。
|
数据格式 | 支持普通格式和KV格式。
|
数据集设置 | 配置使用方和加持方的数据信息,用于后续的数据处理。
|
单击下一步,配置数据处理参数。
参数 | 描述 |
算法分类 | 支持的算法分类为FL决策树、FL线性回归、FL逻辑回归、FL深度学习。
|
默认参数 | 根据所选的算法分类及算法为您展示模型参数。 |
高级参数 | 您可点击配置参数,添加高级参数。 |
单击下一步,配置特征分析。任务基础设置中配置的数据集或勾选的字段变更后,列表中不存在的表或字段在提交时会自动删除。点击使用默认配置可实现一键配置。
参数 | 描述 |
参与方/数据表名 | 请输入参与方的数据表。 |
字段类型 | 对齐字段和Label字段不支持数据处理。 |
处理类型 | 支持数据归一化、数据分箱、数据编码三种方式。
|
单击提交,完成任务的创建。
步骤三:新建TrustML/Prediction任务
在DataTrust首页,单击顶部菜单栏的工作台。进入任务研发页面。
在通用方案中,选择创建安全联邦学习(任务模式)任务。
在创建任务页面中,任务类型选择TrustML/Prediction任务。
步骤四:配置任务参数信息
在创建任务页面,配置基础信息参数。如果运行方式为可行执行环境,则必须在当前合作空间中创建好表;如果是联邦学习、安全多方,则在LSCC侧创建好表。表字段为:id,predict_result,均为字符串类型。
参数 | 描述 |
任务名称 | 请填写任务的名称。 |
运行方式 | 指使用哪一种技术方式实现,目前支持安全多方、联邦学习两种。 |
任务类型 | 任务类型默认是TrustML/Prediction,不支持修改。 |
调度规则 | 支持日常不调度、按日调度、按周调度、按月调度四种,配置后会按配置的周期定时跑该任务。
|
依赖模型 | 指训练任务生成的模型。 |
模型版本 | 指在训练任务中会生成多个模型版本,需要选定一个模型版本进行模型效果评估。 |
训练模型 | 仅支持特征切分。特征切分(纵向切分):指两边数据特征不一样,特征分在了两边。数据切分(横向切分):指两边数据结构一致,只是拥有的数据。 |
特征分布 | 支持使用方【X1+Y】+加持方【X2】和使用方【Y】+加持方【X2】。
|
数据格式 | 支持普通格式和KV格式。
|
预测数据集 | 配置使用方和加持方的数据信息,用于后续的数据处理。
|
结果输出给 | 可选择输出给使用方或加持方任何一方。 |
预测结果表 | 选择已创建好的输出结果表。预测任务结果,在预测结果输出表中查看。 |
预测值模型 | 仅对二分类有效。
|
单击下一步,配置数据处理参数。
参数 | 描述 |
算法分类 | 支持的算法分类为FL决策树、FL线性回归、FL逻辑回归、FL深度学习。
|
默认参数 | 根据所选的算法分类及算法为您展示模型参数。 |
高级参数 | 您可以点击配置参数,添加高级参数。 |
单击提交,完成任务的创建。
后续步骤
任务创建完成后,您可在任务列表页面对任务执行查看、编辑、运行等操作。详情请参见任务管理。
任务创建完成后,您可在模型管理中查看特征分析结果。详情请参见模型管理。