配置企业知识库

重要

202453日阿里云百炼产品全新升级迭代,具体升级内容请参见官方预置应用升级调整公告。此次升级后,所有历史上传的RAG数据将保留在菜单栏中的企业知识库-V1(已停止维护),旧版RAG检索增强应用不再支持新建(调用暂不受影响)。您只能使用新版知识库构建RAG应用(新),详见低代码快速构建RAG应用

  • 了解如何将您的企业知识库迁移至新版知识库,详见下方迁移方案

  • 2024530点之后开通阿里云百炼的用户,默认使用新版知识库。

迁移方案

企业知识库目前已停止维护,我们建议您尽快将您的私有知识迁移至新版知识库(阿里云暂无提供官方的迁移工具或服务)。新版知识库的功能更加丰富,并支持更多文档格式。

企业知识类型

迁移方案

文档

建议您创建非结构化知识库来管理文档类知识。文档导入方式可选择本地上传或从对象存储OSS导入。

若选择本地上传,后续您需要手动更新知识库;若选择从对象存储OSS导入,后续您可以通过整合对象存储OSS、函数计算FC与百炼的知识库API,实现知识库的自动更新。

本地上传支持通过控制台和API操作;从对象存储OSS导入目前仅支持通过控制台操作。

更多说明,请参见知识库:步骤一导入数据

FAQ

建议您创建结构化知识库来管理FAQ类知识。您可以通过本地上传文档或基于云数据库RDS构建结构化知识库。

若选择本地上传,后续您需要手动更新知识库;若选择基于云数据库RDS构建,RDS数据表中的数据更新将自动同步至知识库。

目前这两种方式都只能通过控制台进行操作。

更多说明,请参见知识库:步骤一导入数据

配置企业知识库

  1. 单击左侧菜单中企业知识库-V1,然后单击高级功能,选择下拉菜单中的配置企业知识库,进入知识库列表页。

  2. 单击添加存储数据库

  3. 文件存储配置选择默认自定义文件存储

    您上传的企业知识会先被转换为企业知识库支持的格式,然后存入平台的内置存储(默认)或对象存储OSS自定义文件存储)中。
    如果您选择自定义文件存储,且您使用的是子账号,请确保此账号已开通OSS服务。
    如果您选择自定义文件存储,请先参考下方设置Bucket跨域访问并授予百炼访问权限完成必要授权,以确保企业知识库能够访问您的OSS Bucket;如果您选择默认,则可以跳过这部分内容。

    设置Bucket跨域访问并授予百炼访问权限

    第一步:设置Bucket跨域访问

    重要

    完成本步骤的操作需要云账号是主账号或具有AliyunOSSFullAccess权限的子账号。

    1. 访问OSS控制台,左侧菜单中单击Bucket列表,然后单击需要设置跨域访问的Bucket。在左侧导航栏,选择跨域设置,再单击创建规则

    2. 创建跨域规则面板,请参考以下内容设置跨域规则。

      来源:配置 * 代表支持所有域名和IP的访问,或者指定对应POC前端WebIP或者域名。
      允许Methods:勾选全部(需要支持 GET、POST、PUT、DELETE、HEAD)。
      允许Headers:填入* 。

      image

    第二步:授予百炼访问OSS权限

    重要

    完成本步骤的操作需要云账号是主账号或具有RAMFullAccess权限的子账号。

    1. 访问RAM控制台,左侧菜单中单击角色,然后单击创建角色

    2. 创建角色页面,选择可信实体类型为阿里云账号,然后单击下一步

    3. 配置角色页面,按照下述方式设置角色信息(其中账号1647387832666701为百炼服务账号),然后单击完成。

      角色名称:sfmaccessoss
      选择信任的云账号:选择其他云账号,并输入1647387832666701
    4. 创建角色完成后,单击左侧菜单中权限策略,再单击创建权限策略,然后选择脚本编辑image

    5. 按照下述方式设置授权策略。

      注意:务必将下方策略中的Bucket名称替换为您授权给百炼访问的实际Bucket名称。
      {
        "Version": "1",
        "Statement": [
          {
            "Effect": "Allow",
            "Action": [
              "oss:GetObject",
              "oss:PutObject"
            ],
            "Resource": [
              "acs:oss:*:*:Bucket名称",
              "acs:oss:*:*:Bucket名称/*"
            ]
          }
        ]
      }
    6. 填写名称后,单击确定,权限策略创建成功。

      image

    7. 返回角色页面,找到刚创建的角色。单击其右侧操作列的添加权限,选择刚创建的权限策略,然后单击确定,完成授权。

      image

  4. 向量存储配置选择默认自定义向量存储

    企业知识库会将您上传的企业知识切分成文本切片,并将这些文本切片转换为向量。随后文本切片和向量将以键值对的形式存入平台的内置向量数据库(默认)或云原生数据仓库AnalyticDB PostgreSQL自定义向量存储)中。
    选择默认的向量数据库足以满足企业知识库的基本功能需求;如需高级功能,如管理、审计和监控数据库,推荐选择自定义向量存储
    如果您选择自定义向量存储,且您使用的是子账号,请确保此账号已开通AnalyticDB PostgreSQL服务。

    向量存储配置参数

    region:选择AnalyticDB PostgreSQL实例所在地域。

    向量存储选择:选择用于存储文本切片和向量的AnalyticDB PostgreSQL实例。

    切分方法:层级结构切分是根据自然语言识别结果,按照文档标题、正文层级进行切分;段落结构切分是按照固定字符长度进行切分。

    层级结构简单时,推荐使用层级结构切分;层级复杂时,推荐使用段落结构切分。

    向量维度:选择百炼官方文本向量开源(FlagEmbedding)文本向量,推荐使用百炼官方文本向量

    中文分词器:选择默认,暂不支持选择其它中文分词器。

  5. 单击确定添加,完成企业知识库的配置。

下一步

请参见上传企业知识