上传数据

更新时间:
复制 MD 格式

数据管理页面支持多种方式上传和连接数据源,用于批量任务。支持的方式包括直接文件上传、数据管理数据集、OSS 连接和 ODPS 表连接。

上传文件

从本地直接上传文件,作为批量任务的数据源。上传通过数据管理页内的弹窗完成。

  1. 在侧边栏管理分组下,点击数据管理

  2. 在页面右上角点击主按钮 + 上传数据,弹出上传数据对话框。

  3. (可选)点击弹窗右上角的下载模版链接,获取符合预期格式的 .xlsx 模板。

  4. 在弹窗中:

    • 输入 数据集名称 标识上传的数据。

    • 选择 数据类型

数据类型 说明 典型用途
文本翻译 包含文本字段的表格数据(如标题、描述等)。需符合文本翻译模版的列结构。 批量文本翻译。
图片翻译 图片 URL 列表(公网可访问)。需符合图片翻译模版的列结构。 批量图片翻译(标准版 / Pro 版)。
文档翻译 文档 URL 列表(PDF / Word 公网可访问链接)。需符合文档翻译模版的列结构。 批量文档翻译。
  • 将文件拖入弹窗中的上传区域(提示文字"点击/拖拽上传文件"),或直接点击该区域弹出本地文件选择器。

  • 支持的文件格式:.xlsx / .xls / .csv,单文件最大 50 MB,单次最多 10 个文件。

  1. 点击弹窗底部主按钮确认导入。上传进度实时显示。完成后弹窗关闭,新数据集出现在列表顶部,状态为处理中,解析完成后转为可用

  2. 点击取消放弃本次上传。

连接 OSS

将阿里云 OSS 存储桶连接为批量任务的数据源。此方式适用于已存储在 OSS 中的大型数据集。

  1. 创建任务时,选择 OSS 数据 作为数据源方式。

  2. 输入 OSS 存储桶路径,格式为:oss:////

  3. 系统从指定的 OSS 路径读取文件,将其作为批量任务的输入。

OSS 连接前提条件

  • OSS 存储桶必须与 Aidge 服务在同一地域。

  • 授予 Aidge 对 OSS 存储桶的读取权限。相应配置存储桶策略或 RAM 角色。

连接 ODPS

将 MaxCompute (ODPS) 表连接为批量任务的结构化数据源。

  1. 创建任务时,选择 ODPS 数据 作为数据源方式。

  2. 输入 ODPS 项目名称和表名。

  3. 系统从指定的 ODPS 表读取数据。

ODPS 连接前提条件

  • ODPS 项目必须可从 Aidge 服务访问。

  • 为 ODPS 表配置相应的访问权限。

下载导入模板

确保上传文件符合预期格式:

  1. 在任务创建页面,点击 下载导入模板

  2. 模板文件(.xlsx)包含所选 API 类型对应的列标题和示例数据。

  3. 按照模板结构填入数据后上传文件。

使用须知

  • 上传的文件安全存储,仅在您的账号范围内可访问。

  • 直接上传的文件大小上限取决于文件格式。对于超出上传限制的数据集,使用 OSS 或 ODPS 连接。

  • 数据类型必须与批量任务使用的 API 类型匹配。例如,图片增强任务需要图片数据源,而非文本数据源。

  • 上传后,数据集状态显示为 可用 时即可在任务中使用。如果状态显示 处理中,等待系统完成文件解析。