创建知识库

更新时间:
复制为 MD 格式

您可以将阿里云ElasticsearchOpenSearch中的数据快速接入到AI搜索开放平台,构建企业专属知识库。在AI搜索开放平台-Agentic Search中,基于该知识库,您可以通过自然语言指令构建智能体,实现企业专属的智能问答与知识检索等应用,提升企业检索效率。

操作步骤

  1. 登录AI搜索开放平台控制台

  2. 选择上海地域,切换到AI搜索开放平台,切换到目标空间。

  3. 单击左侧导航栏知识库,单击创建知识库,根据实际业务配置以下参数。

    • 基础信息

      参数

      描述

      知识库名称

      同一空间下,知识库名称不能重名。

      通过左侧导航栏切换空间:

      image

      知识库来源

      知识库可来源于以下产品:

      • 阿里云Elasticsearch

      • 阿里云 OpenSearch向量检索版

      • 阿里云 OpenSearch智能问答版

      描述

      添加知识库备注信息,方便后续识别知识库。

    • 知识库连接参数

      参数

      描述

      网络类型

      默认通过公网连接知识库。

      域名

      根据知识库来源配置域名信息:

      • 阿里云Elasticsearch:登录阿里云Elasticsearch控制台,单击目标实例,单击左侧导航栏配置与管理 > 安全配置获取公网地址,并添加到域名输入框中。示例:http:es-xx-xxxxxxxxxxxxxxxxx.public.elasticsearch.aliyuncs.com:9200,9200为公网端口号。

        同时,AI搜索开放平台使用固定IP 47.100.254.67Elasticsearch读取知识库数据,为读取成功,需要将其添加到Elasticsearch公网白名单中,允许AI搜索开放平台通过Elasticsearch公网地址读取数据。

        image

      • 阿里云 OpenSearch向量检索版:登录阿里云OpenSearch向量检索版控制台,单击目标实例,获取公网地址,并添加到域名输入框中。

        image

        为读取成功,需要将IP 47.100.254.67添加到向量检索版公网白名单中,允许AI搜索开放平台通过向量检索版公网地址读取数据。

      实例名称

      知识库来源于阿里云OpenSearch智能问答版时,选择智能问答版实例ID。

      鉴权信息

      根据知识库来源配置鉴权信息,格式为username:password

      • 阿里云Elasticsearch:username固定为elastic,如遗忘password,可通过控制台重置。

        image

      • 阿里云 OpenSearch向量检索版:通过实例详情页查看用户名、密码。

        image

      索引名称

      索引表的名称。

      image

    • 知识库搜索query:只有当知识库来源为阿里云Elasticsearch或者阿里云 OpenSearch向量检索版时,您才需要填写该参数。

      参数

      描述

      检索类型

      • 混合检索:知识库来源为阿里云Elasticsearch或者阿里云 OpenSearch向量检索版时,支持混合检索。

        适用于结合传统文本搜索、语义向量搜索、稠密向量搜索和稀疏向量搜索实现混合检索的场景。

        • filter语句

        • 数据条数

      • 自定义检索,知识库来源为阿里云Elasticsearch支持自定义检索。

        • query_string:最简单的搜索方式,允许用户直接输入自然语言检索。

          q=title:${parameters.query}&size=10&from=0,q为查询参数标识;指定在title字段搜索;parameters.query是占位符,会被替换为用户实际输入;size是结果返回的数量;from为分页起点。您可以根据实际业务修改参数值。

        • search_template:预定义查询结构,查询过程中动态填充安全参数。需要提前在Elasticsearch中创建search_template。

        • dsl:精细化控制搜索逻辑,实现复杂查询。

          如查询近30天销售额>1万且客户评级=A的订单:

          {
            "query": {
              "bool": {
                "must": [
                  { "range": { "date": { "gte": "now-30d" } } },
                  { "range": { "amount": { "gte": 10000 } } },
                  { "term": { "rating": "A" } }
                ]
              }
            }
          }

      image

    • 向量化配置:只有当知识库来源为阿里云Elasticsearch或者阿里云 OpenSearch向量检索版时,您才需要填写该参数。

      参数

      描述

      稠密向量化模型

      选择合适的稠密向量化模型对知识库数据进行向量化,模型详细介绍请参见模型概览

      稀疏向量化模型

      选择合适的稀疏向量化模型对知识库数据进行向量化,模型详细介绍请参见模型概览

      模型访问地址

      AI搜索开放平台当前空间下的模型调用地址

      image

      API Key

      调用模型时通过API Key对调用者身份进行认证

      image

    • 参数配置:只有当知识库来源为阿里云Elasticsearch或者阿里云 OpenSearch向量检索版时,您才需要填写该参数,为索引表中的字段指定参数类型以及描述信息。

      image

  4. 完成参数配置后,单击连通性测试,在右侧弹窗中输入测试query连通性状态测试通过时表示知识库数据读取成功,单击确定保存知识库配置。

    image

    接下来您可以在Agentic Search中,基于该知识库,通过自然语言指令构建智能体,实现企业专属的智能问答与知识检索等应用,提升企业检索效率。