文档

配置企业知识库

更新时间:
重要
  • 我们于2024年5月3日0点调整升级原版本RAG应用创建链路,届时原RAG历史上传存储的数据将保留在菜单栏【企业知识库-V1】中。原企业知识库支持历史RAG应用的数据编辑、调用暂不受影响。但原版本企业知识库数据与新版本应用不互通。如未来企业知识库数据需要迁移,我们将提前给予您通知说明。您可以通过数据中心来构建新版RAG应用,详细操作请参考低代码快速构建RAG应用

  • 2024年5月3日0点之后开通阿里云百炼的用户,默认使用新版本企业知识库。新版本企业知识库的相关配置,请参见知识索引

说明

企业知识导入,原文件不在平台存储,只会储存文档识别-切片-向量化之后的向量数据,用作向量检索。其中用来储存向量数据的数据库,可以使用内置的ES实例,除了默认的文件和向量存储,还可以关联OSS文件存储Bucket(OSS对象存储产品说明:快速开通OSS说明)和ADB-PG向量存储实例(向量数据库产品说明:访问向量数据库)。

OSS授权及跨域访问

说明

如您需要使用OSS文件存储上传文件,请先按照本章节内容进行授权后,再进行上传。若您需要向量数据库存储的话,可跳过这段内容。

OSS跨域访问

重要

完成该步骤需要云账号是主账号或者AliyunOSSFullAccess权限的子账号。

  1. 登录OSS控制台:https://oss.console.aliyun.com/bucket/oss-cn-shanghai/实际购买的bucket/bucket

image.png

  1. 创建跨域规则,可参考以下内容进行填写。

来源: 配置 * 代表支持所有域名和IP的访问,或者指定对应POC前端web的IP或者域名.

允许Methods: 需要支持 GET,POS,PUT,DELETE,HEAD。

允许Headers: *

image.png

OSS授权百炼访问权限

重要

前提: 完成该步骤需要云账号是主账号或者RAMFullAccess权限的子账号。

  1. 登录ram控制台 :https://ram.console.aliyun.com/,点击角色选择创建角色。

image

  1. 按照顺序创建。

image

  1. 角色名称请填写:sfmaccessoss 选择信任的云账号,选择其他云账号,输入:1647387832666701该账号为百炼服务账号。

image

  1. 角色创建完成,点击权限管理创建对应权限策略,选择脚本编辑。imageimage

  2. 输入如下授权策略替换您授权给百炼可访问的bucket名称为您真正的bucket名称。

{
  "Version": "1",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "oss:GetObject",
        "oss:PutObject"
      ],
      "Resource": [
        "acs:oss:*:*:bucket名称",
        "acs:oss:*:*:bucket名称/*"
      ]
    }
  ]
}
  1. 填写名称后,点击确定。创建权限策略成功。

image

  1. 返回角色页面,给创建好的角色授权该权限策略。找到上述添加好的权限策略,点击确定完成授权。

image

使用说明

  1. 点击应用中心--企业知识库,点击高级功能下的配置企业知识库这里展示所有的知识库列表。

image

  1. 点击添加存储数据库,开始添加。若使用的子账号,需要先授权对应产品权限后才可以继续使用。

image

说明
  • 向量数据库实例创建请点击查看按钮进行了解。

  • OSS文件存储创建请点击查看按钮进行了解。需要先完成上述的授权后,再绑定bucket。

  1. 支持文件存储配置向量存储配置,按照提示填写对应信息后,点击确定添加,即可完成绑定。(需先完成授权才能绑定文件存储配置

image

说明

其它字段说明

向量维度:包含通用文本向量(1536)和算法自定义向量(1024),推荐使用算法自定义向量(1024)

中文分词器:选择默认

区域:北京

仓储名称:自定义名称,方便管理和后续选择

切分方法:层级结构切分是根据自然语言识别结果,按照文档标题、正文层级进行切分;段落结构切分是按照固定字符长度进行切分。在层级结构简单时,推荐使用层级结构切分;层级复杂推荐使用段落结构切分

  1. 添加完成后,当前页面展示所有知识库实例。

image

操作步骤

完成向量数据库配置后,在数据导入时,按需选择向量存储/文件存储,点击确认上传,等待状态显示导入完成。测试模型效果点击如何测试应用

image

image