文档

导入非结构化数据和结构化数据

更新时间:
一键部署

本文介绍数据导入操作说明,包括非结构化数据和结构化数据的导入。

前提条件

对于非结构化数据,需要完成以下操作:

操作步骤

非结构化数据

  1. 登录阿里云百炼大模型服务平台

  2. 在左侧导航栏中,选择数据管理

  3. 选择非结构化数据页签。

  4. 选择需要导入数据的类目。

    image

  5. 单击导入数据,进入导入数据页面

  6. 选择导入方式。

    image

  7. 导入方式包括本地上传、OSS导入模式。

    • 本地上传模式:从本地上传文件进行导入,点击本地上传,选择本地文件,开始上传,文件格式需符合要求,支持PDF/Doc/Docx格式,单文档最大限制100MB或1000页,上传后的文件将显示在下方,最大支持上传200个文件,确认后将开始导入。image

    • OSS导入模式:从OSS对象存储Bucket导入文件,选择OSS导入,在完成授权的前提下,选择OSS的存储区域和Bucket,导入文件夹或文件。

      • 导入文件夹:选择Bucket下的文件夹,一次性导入当前文件夹下的所有文件,注意,导入文件夹不包括子文件夹中的文件,如需导入,请选中子文件夹。image

      • 导入文件:选择文件夹中的文档进行导入,单次最多选择5000文档,选择后可在右侧已选文档中查看。image

  8. 单击确认,提交导入任务,系统将自动导入文档,文档导入数据显示存在延迟,需要等待一段时间后,导入的文档方可在类目中呈现。image

  9. 数据导入完成后,可单击操作列的详情预览解析后的文档数据。

结构化数据

  1. 登录阿里云百炼大模型服务平台

  2. 在左侧导航栏中,选择数据管理

  3. 选择结构化数据页签。

  4. 自定义数据表结构。

    1. 单击新增数据表,进入新增数据表页面。

    2. 自定义数据表名称。

    3. 配置表结构。

      其中,列名为必填参数,描述为选填参数。

      重要

      这里定义的数据表结构,必须和待导入的数据表的结构完全相同,否则会导入失败。例如,待导入的数据表有2列,这里的表结构必须配置2个字段,且列名一一对应。您可以通过单击新增字段操作列的删除,来增加或删减字段。

      image

    4. 单击确定,完成配置。

      您可以在数据表管理的导航树中查看新增的数据表。

      image

  5. 导入表数据。

    1. 在数据表管理的导航树中,单击新增的数据表。

    2. 单击导入数据

    3. 将Excel或CSV格式的文档拖拽至虚线框内,或单击image选择并上传文档。

    4. 上传成功后,单击预览查看导入的数据。

    5. 确认无误后,单击确认,完成导入。

      image

后续步骤

数据导入后,您可将数据应用于知识索引。具体操作请参见知识索引