知识库

更新时间:
复制为 MD 格式

知识库用于为大模型补充私有数据和最新信息。基于 RAG(检索增强生成)技术,大模型在生成回答前会先从知识库中检索相关内容,从而提升回答的准确性。

无专属知识库的应用

无专属知识库时,大模型无法准确回答特定领域的问题。

无

有专属知识库的应用

引入专属知识库后,大模型可准确回答特定领域的问题。

有

支持的模型

以下模型支持使用知识库。配置千问使用知识库教程

预置模型(阿里云百炼支持的标准模型)

自定义模型(在阿里云百炼调优后的模型)

  • 千问-QwQ/Long/Max/Plus/Turbo/Coder/Deep-Research

  • 千问VL-Max/Plus/Flash/OCR

  • 千问-开源版(Qwen3、Qwen2.5、Qwen2等)

  • 第三方文本生成模型(DeepSeek-R1、DeepSeek-V3.1、abab6.5s、Llama3.1、Yi-Large等)

指基于以下模型调优后的自定义模型。
  • 千问-Plus/Turbo

  • 千问VL-Max/Plus

  • 千问-开源版(Qwen3、Qwen2.5、Qwen2等)

上述列表随时可能更新。请以在 应用管理 页面创建应用时实际可选的模型为准。

工作原理

知识库支持对私有数据或文件进行语义检索,可找出语义相同或相近的内容,即使关键词匹配度极低甚至为零。

更多详细信息,请参见阿里云大模型ACA课程的检索增强生成

快速开始

本节介绍如何无需编写代码,快速构建一个能够回答特定领域问题(以"阿里云百炼手机"为例)的大模型问答应用。

1. 构建知识库

  1. 进入知识库,选择标准版旗舰版点击创建知识库

  2. 填写知识库名称知识库描述,其余设置保持默认,点击下一步

  3. 选择默认类目,上传阿里云百炼系列手机产品介绍.docx文件。点击下一步,然后点击完成

2. 集成到业务应用

知识库创建后,可将其关联至同一业务空间下的阿里云百炼应用或外部应用,以处理检索请求。

集成到智能体应用

  1. 进入应用管理页面,找到目标智能体应用,点击卡片上的配置,并为应用选择模型。

  2. 点击页面上文档知识库右侧的 + 按钮,添加上一步创建的知识库。相似度阈值和权重可保持默认。

    (可选)相似度阈值:筛选检索结果

    知识库采用语义检索,可在私有数据或文件中找出与查询意图相关、但关键词可能完全不同的文本。

    例如,用户查询:哪款阿里云手机适合拍照?

    实际答案(千问Vivid 7...)中并不包含查询中的任何关键词。

    下表中的关键词相似度基于 Jaccard 计算,语义相似度基于 text-embedding-v4 模型计算的 Cosine相似度

    召回文本

    关键词相似度

    语义相似度

    千问Vivid 7:智能摄影新体验

    0

    0.43

    阿里云百炼Ace Ultra:游戏玩家之选

    0.17

    0.32

    阿里云百炼Flex Fold+:折叠屏新纪元

    0.25

    0.24

    相似度阈值:仅语义相似度高于此阈值的文本才会被召回。阈值设置过高会导致相关文本被过滤丢弃。

    (可选)权重:干预多知识库召回顺序

    当智能体应用同时关联多个知识库时,可按信息源的重要程度为各知识库分配权重。多路召回时,若多个知识库召回的文本切片相似度相同,系统将优先返回权重更高的知识库中的文本切片

    • 关键限制:权重仅在同类型知识库之间生效。例如,文档搜索类知识库的权重不影响数据查询类知识库的召回顺序,反之亦然。

    • 工作原理:系统先计算用户问题与各知识库内容的相关度,筛选出最相关的文本切片,再将相似度分数与对应知识库的权重相乘,经加权重排后输出给大模型参考(加权得分越高,被采纳的可能性越大)。

  3. 在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。

    例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"

集成到工作流应用

  1. 进入应用管理页面,找到目标工作流应用,点击卡片上的配置。将知识库节点拖入画布,连接在开始节点之后。

  2. 配置知识库节点:

    1. 输入:在变量名content右侧的下拉列表中,选择内置变量。下拉列表为树形结构,需展开"内置变量"分组后选择 query。

    2. 选择知识库:知识库节点支持以下两种选择方式。

      • 选择固定知识库:从下拉菜单中选择上一步创建的知识库。适用于每次调用同一知识库的场景。

      • 动态引入:配置CodeList变量,根据上游节点的输出动态指定知识库。适用于需根据不同输入检索不同知识库的场景。

    3. 设置 TopK(可选):决定返回给下游节点(通常为大模型节点)的知识片段数量。

      增大该值通常能提升大模型回答的准确性,但会相应增加大模型的输入 Token 消耗。
  3. 大模型节点拖入画布,连接在知识库节点之后、结束节点之前。

  4. 配置大模型节点:

    1. 模型配置列表中,为节点选择模型。

    2. 提示词中,输入指示大模型使用知识库的提示词。输入"/"可插入result变量(表示知识库检索返回的结果)。

      image

  5. 配置结束节点:输入/,选择,输出大模型返回的结果。

  6. 点击页面右上角的测试,在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。

    例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"

集成到外部应用

除在阿里云百炼内构建应用外,也可通过阿里云百炼SDK调用知识库的检索能力,为外部 AI 应用提供检索服务。

具体集成步骤,请参见知识库API指南

3. 优化知识库效果(可选)

若问答过程中出现知识召回不完整或内容不准确的情况,请参见知识库效果优化

操作指南

知识库页面,可查看和管理当前业务空间下的所有知识库。

知识库ID: 即每个知识库卡片上 ID 字段的值,用于API调用等场景。

创建知识库

点击创建知识库后,首先选择知识库规格(标准版:0.03 元/小时,旗舰版:0.2 元/小时),然后按三步完成创建:填写基础信息并选择知识库类型、配置数据来源、设置索引参数。

  1. 知识库页面,点击创建知识库

  2. 填写基础信息

    根据应用场景选择合适的知识库类型(单一知识库不支持同时选择多个类型)。选择文档搜索类型后,还需选择使用场景(基础文档问答、图文并茂回复、视觉理解(富文本文档)或极速问答):

    • 基础文档问答:适用于纯文本文档的语义检索。

    • 图文并茂回复:适用于需要返回图文混排内容的场景。

    • 视觉理解(富文本文档):使用多模态向量模型对 PDF、图片等富文本文档进行视觉级理解和索引,保留原始版面信息。适合含有复杂排版、图表、公式的文档,支持文字、图片和图文组合三种命中测试模式。

    • 极速问答:针对检索速度进行优化,适合高度结构化或简单文档类型(如 FAQ、产品参数表等),提供极速低延时的问答体验。索引配置与基础文档问答一致,差异在于后端检索策略针对低延迟场景进行了专项优化。仅支持文本查询,不支持图片输入。

    选择视觉理解后,向量模型将自动切换为 qwen3 多模态向量(qwen3-vl-embedding),不可更改。

    创建后,知识库类型不可更改。
    • 文档搜索(检索场景)

      • 适用场景:

      • 选择连接器:选择指定数据连接器。如未创建数据连接器,请参阅数据连接

      • 数据来源:支持本地上传文件或从阿里云对象存储OSS导入。

        创建说明(文档搜索)

        1. 选择数据:为知识库指定数据来源(文件或内容)。数据源内容将导入知识库,用于后续检索。支持本地上传云端导入(选择现有类目或文件)两种方式。

          • 本地上传:直接从本地电脑上传文件。展开下方折叠面板了解如何选择解析方式

            解析方式(自定义设置)说明

            请根据实际需求配置解析策略,如不确定建议保持默认设置。有关文档智能解析大模型文档解析电子文档解析的详细说明,请参见文档理解

            • 电子文档解析:不支持解析文件中的插图与图表。

            • 文档智能解析:对文件中的插图进行文本识别与提取,生成文本摘要。摘要将与其他非图片内容一同切分并向量化,参与知识库检索。

            • 大模型文档解析:使用千问VL模型的智能体应用支持对文件中插图和图表内容进行提问。如需识别和理解文件中的插图与图表,请选择大模型文档解析

            • Qwen VL解析:专用于图片文件。可指定千问VL模型并传入 Prompt,以指导对图片版面及元素的识别与提取。

            • 音视频解析:对文件进行语音识别、视频帧提取(仅限视频)和剧情解析(仅限视频),将所有声画信息按时间轴结构化对齐。

              • 语音识别:通过录音文件识别将语音转为文本。暂不支持识别音乐或自然环境声(如喇叭声、钟声、雷声等)。

              • 视频帧提取:从视频中抽取有代表性的画面,并生成对应的文本描述。

              • 剧情解析(需手动开启):分析视频内容,定位具体事件并标注时间戳,生成对应的文本描述。

            / 设置表格宽度为屏幕的60% /

            #tb1 {

            width: 60%;

            }

          • 云端导入:阿里云百炼数据连接器或对象存储OSS导入已有文件。

        2. 索引配置:定义导入数据的处理和存储方式,直接影响检索效果。

          以下配置项中,仅"向量存储"选用 ADB-PG 时可能产生费用,其余配置均免费。

          Meta信息抽取

          metadata(元数据)是与非结构化数据关联的一组附加属性,以 key-value 键值对的形式集成到文本切片中。

          • 作用:元数据为文本切片提供重要的上下文信息,可显著提升知识库检索的准确性。例如,知识库中包含上千个以产品名称命名的产品介绍文件。检索"A产品的功能概述"时,若所有文件正文都含有"功能概述"但均未提及"A产品",知识库可能召回大量无关文本切片。将产品名称作为元数据附加到所有文本切片后,知识库可精准过滤出与"A产品"相关且包含"功能概述"的切片,从而提高检索准确性,同时降低模型输入Token消耗。

          • 用法:通过API调用应用时,可在请求参数metadata_filter中指定metadata。应用检索知识库时,将先根据metadata筛选相关文件。

          • 注意:知识库一旦创建,无法再配置metadata抽取

          如何配置metadata

          下方示例图中,该文件所有文本切片的元数据包含5个自定义属性:date(文件中出现的所有年份)、reference(文件中出现的所有参考文献)、filename(文件名称)、keywords(文件中出现的关键词)以及author(文件作者信息)。

          image

          开启Meta信息抽取,然后单击设置为该知识库中的所有文件附加统一或个性化的元数据。切分时,每个文件的元数据将集成到各自的文本切片中。下图为上方示例使用的meta信息模板:

          image

          新建Meta信息模板说明

          取值方法说明:

          • 常量:为知识库中的所有文件附加固定属性。

            如上方示例所示,若知识库中所有文件的作者相同,可统一设置字段名为 author 的常量。
          • 变量:为知识库中的每个文件附加可变属性。目前支持file_namecat_name。选择file_name时,阿里云百炼将文件名称附加到其元数据中,如上方示例所示。选择cat_name时,阿里云百炼将文件所在类目的名称附加到文件元数据中。

          • 大模型:系统依据设定的实体描述规则,对知识库中每个文件的文本内容进行匹配,自动识别并提取相关信息,将其作为属性附加到文件元数据中。

            如上方示例的meta信息模板所示,如需提取每个文件中所有出现过的年份信息作为文件属性,可设置名为 date 的大模型字段,实体描述配置如下:

            image

          • 正则:系统依据设置的正则表达式,对知识库中每个文件的文本内容进行匹配,提取符合该表达式的内容,并将其作为属性添加到文件元数据中。

            如上方示例的meta信息模板所示,如需提取每个文件中所有出现过的参考资料(假设规律为:以"《"开头、以"》"结尾),可设置名为 reference 的正则字段,正则表达式配置如下:

            image

          • 关键词搜索:系统在每个文件中查找预设的关键词,并将匹配到的关键词作为属性添加至文件元数据中。

            例如,在上述示例的meta信息模板中,预设的关键词为:

            image

            由于该文件中仅出现了"融资、产业、绿色、资本"这四个关键词,系统只提取了这四个关键词作为该文件 keywords 属性的值。

          是否参与检索:开启后,元数据字段和值将与文本切片内容一同参与知识库检索;关闭时,仅文本切片内容参与检索,元数据字段和值不参与。

          是否参与模型回复:开启后,元数据字段和值将与文本切片内容一同参与大模型的回答生成;关闭时,仅文本切片内容参与大模型回答生成,元数据字段和值不参与。

          Excel文件表头拼装

          开启后,知识库将所有XLSX、XLS格式文件的首行数据视为表头,并自动拼接到每个文本切片(数据行)中,避免大模型将表头误识别为普通数据行。

          若知识库中包含其他格式的文件(如PDF),无需开启该设置。

          切片方式

          选择智能切分(推荐)或自定义切分方式(当智能切分无法正常切割时,可对智能切分的部分策略进行调整)

          作用: 知识库将文件切分为文本切片,并通过向量模型转换为向量。文本切片和向量以键值对的形式存入向量数据库。知识库创建后,可查看或编辑每个文本切片的具体内容(文字和图片)。
          注意: 知识库一旦创建, 无法再更改文档切分chunk 。不合适的切分策略可能会降低检索和召回效果。
          • 智能切分:系统默认的切分策略,经评测对多数文件可获得最佳检索效果。

            原理: 使用 智能切分 时,知识库先依据内置的分句标识符将文件拆分为若干段落,再根据这些段落创建文本切片。拆分和切分过程中,知识库尽量保证每个部分的语义完整,减少不必要的切分,但当文本切片的字符数超过 最大分段长度 时,将被强制截断。
          • 按长度切分适合对Token数量有严格要求的场景,例如使用上下文长度较小的模型时。

            重叠字符数 相邻文本切片的重叠字符数。建议设置为最大分段长度的10%到25%,以保留文本切片间的语义相关性,提高多切片召回质量。注意该参数值必须小于最大分段长度,否则会导致文档切分chunk异常。

            示例

            示例文本:

            百炼知识库提供多种文件处理方式。您可以根据需求选择最合适的方法。

            可能的切分结果(最大分段长度=20):

            • 文本切片1:"百炼知识库提供多种文件处理方式。您可以根"

            • 文本切片2:"据需求选择最合适的方法。"

          • 按页切分适合每页传达独立主题的文件,要求不同页面的内容不会混杂在同一文本切片中。当文本切片的字符数超过最大分段长度时,将被强制截断。

            示例

            示例markdown文本:

            文档的第1

            文档的第2

            # 创建知识库
            百炼知识库提供多种文档处理方式,您可以根据需求选择最合适的方法。
            
            ## 智能切分
            - 采用系统内置切分策略。
            - 经评测对于多数文档可获得最佳的检索效果。
            ## 自定义切分
            - 如果智能切分无法正常切割,您可以对智能切分的部分策略进行调整。
            
            

            可能的切分结果:

            • 文本切片1:"创建知识库 ... 获得最佳的检索效果。"

            • 文本切片2:"自定义切分 ... 的部分策略进行调整。"

          • 按照标题切分:适合以标题划分独立主题的文件,要求同层级标题下的内容不会混杂在同一文本切片中。当文本切片的字符数超过最大分段长度时,将被强制截断。

            示例

            示例markdown文本:

            文档的第1

            文档的第2

            # 创建知识库
            百炼知识库提供多种文档处理方式,您可以根据需求选择最合适的方法。
            
            ## 智能切分
            - 采用系统内置切分策略。
            - 经评测对于多数文档可获得最佳的检索效果。
            ## 自定义切分
            - 如果智能切分无法正常切割,您可以对智能切分的部分策略进行调整。
            
            

            可能的切分结果(按照一级标题切分):

            • 文本切片1:"创建知识库 ... 的部分策略进行调整。

            可能的切分结果(按照二级标题切分):

            • 文本切片1:"创建知识库 ... 选择最合适的方法。"

            • 文本切片2:"智能切分 ... 获得最佳的检索效果。"

            • 文本切片3:"自定义切分 ... 的部分策略进行调整。"

          • 按照正则切分系统依据设置的正则表达式对知识库中的文本进行切分。例如,需要保持句子完整性时,可使用正则表达式(?<=。)按句号切分文件。当文本切片的字符数超过最大分段长度时,将被强制截断。

            示例

            示例文本:

            百炼知识库提供多种文件处理方式。您可以根据需求选择最合适的方法。

            可能的切分结果(正则表达式为(?<=。)):

            • 文本切片1:"百炼知识库提供多种文件处理方式。"

            • 文本切片2:"您可以根据需求选择最合适的方法。"

          • 按照符号切分按照选定的标点符号切分文件。当文本切片的字符数超过最大分段长度时,将被强制截断。

          多轮对话改写

          开启该功能后,系统将调用专用轻量级模型,结合对话历史将用户当前问题改写为独立的、上下文完整的新查询,再用于知识库检索。

          向量模型

          向量模型用于将原始输入Prompt和知识文本转化为数值向量,以便计算语义相似度。默认的官方向量v4(text-embedding-v4)在语种支持、代码片段向量化效果和向量维度自定义等方面,相比官方向量v3(text-embedding-v3)进行了全面升级,适用于大部分场景。详情请参见文本与多模态向量化

          知识库使用不同向量模型时生成的向量维度(无法修改):

          • text-embedding-v4:512

          • text-embedding-v3:512

          • qwen3 多模态向量(qwen3-vl-embedding):使用场景选择「视觉理解」时自动启用,支持对图片和富文本文档进行视觉理解后生成向量

          排序模型

          排序模型位于知识库外部,对向量检索初步召回的候选切片进行二次排序,并返回相似度分数最高的前K个文本切片。qwen3-rerank(hybrid)官方排序(推荐)综合考量语义相关性与文本匹配特征(如BM25得分),能更好地处理需要精确关键词命中的查询;若只需语义排序,请选择qwen3-rerank。

          相似度阈值

          该阈值表示允许召回的文本切片的最低相似度分数,用于筛选排序模型返回的结果,只有分数超过此阈值的文本切片才会被召回。

          说明

          此处设置的是知识库的默认相似度阈值。将知识库关联到具体阿里云百炼应用时,还可为该应用单独设置阈值(将覆盖知识库的默认相似度阈值)。

          降低此阈值预期会召回更多文本切片,但可能召回相关度较低的内容;提高此阈值会减少召回的文本切片数量,若设置过高,将导致知识库丢弃相关切片。

          可通过命中测试对相似度阈值进行调优,以平衡召回率与精确率。

          最大召回数量

          假设阿里云百炼应用关联了A1、A2A3三个知识库,系统从这些库中检索与输入相关的切片,再通过排序模型重排序,选出最相关的前K条加入大模型的输入Token供回答参考。此K值即最大召回数量(上限为20),决定了排序模型提供给大模型参考的文本切片数量。

          增大该值可提高大模型的回答准确性,但会相应增加大模型输入Token消耗。

          向量存储

          选择向量数据库存储文本向量。内置的向量数据库可满足知识库的基本功能需求。如需管理、审计或监控数据库等高级功能,建议选择ADB-PG(AnalyticDB for PostgreSQL)。

          购买ADB-PG实例时请开启 向量引擎优化 ,否则阿里云百炼将无法使用此实例。

        创建说明(视觉理解)

        选择视觉理解(富文本文档)使用场景后,知识库将使用多模态向量模型对文档进行视觉级理解,保留原始版面布局信息,而非采用传统的文本切片方式。

        文件格式限制

        在选择数据页签的文件上传区域,鼠标悬浮查看格式要求查看。

        索引配置差异

        视觉理解场景下的索引配置与基础文档问答不同:

        • 向量模型:自动选择 qwen3 多模态向量(qwen3-vl-embedding),创建后不可更改。

        • 多轮对话改写:可配置开启或关闭。

        • 相似度阈值:默认 0.20。

        • 最终召回最大数量:默认 5。

        • 切片方式:视觉理解不使用传统文本切片(智能切分/自定义切分等),而是基于视觉索引对文档整页进行理解。

        编辑限制

        • Embedding 模型(qwen3 多模态向量)和向量存储类型(内置)创建后不可更改。

        • 知识库规格变更每天仅支持一次。

    • 数据查询(Chatbot 或 NL2SQL 场景)

      • 适用场景:

        • 适合构建基于结构化数据(按预定义表结构组织的数据)的问答系统,例如 FAQ、商品数据、人员信息查询助手等。

        • 若数据为完整的 FAQ 问答对,请选择数据查询。例如,Excel 文件包含两列,分别为问题答案。数据查询类知识库支持将问题列用于知识库检索,答案列用于大模型回答参考。

          文档搜索类知识库无法实现此效果。
        • 支持导入多个Excel文件,但要求各文件的表结构完全一致

      • 选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接

      • 数据源接入:支持本地上传 XLS 或 XLSX 文件,或从阿里云数据库RDS导入数据

        创建说明(数据查询)

        1. 选择数据:为知识库指定数据来源(含文件或内容)。数据源内容将导入知识库,用于后续检索。支持本地上传云端导入(选择数据连接器中已有数据表)和RDS导入三种方式。

          说明

          知识库创建后数据源不可更改,且单个知识库不支持同时使用多个数据源。

          • 本地上传:从本地计算机上传数据表(XLS 或 XLSX 格式,首行必须为表头)。

          • 云端导入(选择数据表):选择阿里云百炼数据连接器中的现有数据表。

          • RDS导入(关联数据库):数据表存储于阿里云RDS中。操作步骤请参见集成MySQL数据至知识库

        2. 索引配置:定义导入数据的处理和存储方式,直接影响检索效果。

          以下配置项中,仅"向量存储"选用 ADB-PG 时可能产生费用,其余配置均免费。

          是否参与检索/参与模型回复

          • 是否参与检索:开启后,知识库将在该列数据中执行检索。

          • 是否参与模型回复:开启后,该列的检索结果将作为大模型生成回答的输入信息。示例配置:对"姓名"、"性别"、"岗位"、"年龄"列开启是否参与检索,仅对"姓名"和"岗位"列开启是否参与模型回复后,知识库将在所有列中执行检索,但仅将"姓名"和"岗位"两列的检索结果提供给大模型作为回答依据。

            如下图所示,由于"年龄"列未开启参与模型回复,关联该知识库的大模型仍无法回答"张三的年龄"。

            image

          多轮对话改写

          开启该功能后,系统将调用专用轻量级模型,结合对话历史将用户当前问题改写为独立的、上下文完整的新查询,再用于知识库检索。

          向量模型

          向量模型用于将原始输入Prompt和知识文本转化为数值向量,以便计算语义相似度。默认的官方向量v4(text-embedding-v4)在语种支持、代码片段向量化效果和向量维度自定义等方面,相比官方向量v3(text-embedding-v3)进行了全面升级,适用于大部分场景。详情请参见文本与多模态向量化

          知识库使用不同向量模型时生成的向量维度(无法修改):

          • text-embedding-v4:512

          • text-embedding-v3:512

          • qwen3 多模态向量(qwen3-vl-embedding):使用场景选择「视觉理解」时自动启用,支持对图片和富文本文档进行视觉理解后生成向量

          排序模型

          排序模型位于知识库外部,对向量检索初步召回的候选切片进行二次排序,并返回相似度分数最高的前K个文本切片。qwen3-rerank(hybrid)官方排序(推荐)综合考量语义相关性与文本匹配特征(如BM25得分),能更好地处理需要精确关键词命中的查询;若只需语义排序,请选择qwen3-rerank。

          相似度阈值

          该阈值表示允许召回的文本切片的最低相似度分数,用于筛选排序模型返回的结果,只有分数超过此阈值的文本切片才会被召回。

          说明

          此处设置的是知识库的默认相似度阈值。将知识库关联到具体阿里云百炼应用时,还可为该应用单独设置阈值(将覆盖知识库的默认相似度阈值)。

          降低此阈值预期会召回更多文本切片,但可能召回相关度较低的内容;提高此阈值会减少召回的文本切片数量,若设置过高,将导致知识库丢弃相关切片。

          可通过命中测试对相似度阈值进行调优,以平衡召回率与精确率。

          最大召回数量

          假设阿里云百炼应用关联了A1、A2A3三个知识库,系统从这些库中检索与输入相关的切片,再通过排序模型重排序,选出最相关的前K条加入大模型的输入Token供回答参考。此K值即最大召回数量(上限为20),决定了排序模型提供给大模型参考的文本切片数量。

          增大该值可提高大模型的回答准确性,但会相应增加大模型输入Token消耗。

          向量存储

          选择向量数据库存储文本向量。内置的向量数据库可满足知识库的基本功能需求。如需管理、审计或监控数据库等高级功能,建议选择ADB-PG(AnalyticDB for PostgreSQL)。

          购买ADB-PG实例时请开启 向量引擎优化 ,否则阿里云百炼将无法使用此实例。
    • 图片问答(图搜场景)

      • 适用场景:

        • 适合构建以图搜图、以图搜"图文"的多模态检索应用,如商品导购助手、视觉问答助手等。

      • 选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接

      • 数据源接入:支持本地上传 XLS 或 XLSX 文件,或从阿里云数据库RDS导入数据

        XLS、XLSX 文件 RDS数据表 中需包含 公开可访问 的图片 URL,以便构建图片索引。详见下方创建说明。

        创建说明(图片问答)

        1. 选择数据:为知识库指定数据来源(含文件或内容)。数据源内容将导入知识库,用于后续检索。支持本地上传云端导入(选择数据连接器中已有数据表)和RDS导入三种方式。

          说明

          知识库创建后数据源不可更改,且单个知识库不支持同时使用多个数据源。

          • 本地上传:从本地计算机上传数据表(XLS 或 XLSX 格式)。

            说明
            • 字段要求:数据表中至少需包含一个类型为image_url的字段,用于生成图片索引。

            • 构建过程:知识库将访问image_url字段中的图片 URL,提取视觉特征并转换为向量存储。

            • 检索过程:知识库将用户上传图片生成的向量与已存储的图片向量进行相似度比对,返回最相关的记录。

          • 云端导入(选择数据表):选择阿里云百炼应用数据中的现有数据表。

          • RDS导入(关联数据库):数据表存储于阿里云RDS中。操作步骤请参见集成MySQL数据至知识库

        2. 索引配置:定义导入数据的处理和存储方式,直接影响检索效果。

          以下配置项中,仅"向量存储"选用 ADB-PG 时可能产生费用,其余配置均免费。

          是否参与检索/参与模型回复

          • 是否参与检索:开启后,知识库将在该列数据中执行检索。

          • 是否参与模型回复:开启后,该列的检索结果将作为大模型生成回答的输入信息。示例配置:对"姓名"、"性别"、"岗位"、"年龄"列开启是否参与检索,仅对"姓名"和"岗位"列开启是否参与模型回复后,知识库将在所有列中执行检索,但仅将"姓名"和"岗位"两列的检索结果提供给大模型作为回答依据。

            如下图所示,由于"年龄"列未开启参与模型回复,关联该知识库的大模型仍无法回答"张三的年龄"。

            image

          多轮对话改写

          开启该功能后,系统将调用专用轻量级模型,结合对话历史将用户当前问题改写为独立的、上下文完整的新查询,再用于知识库检索。

          向量模型

          向量模型用于将原始输入 Prompt、知识文本及图片转化为数值化向量,以便进行相似度比较。详情请参见文本与多模态向量化

          • qwen2.5 多模态向量(qwen2.5-vl-embedding):将单模态或混合模态输入表征为统一向量,适用于跨模态检索、图搜等场景。例如,输入一张衬衫图片并附加文本"找相似风格但更显年轻的款式",模型能将图像与文本指令融合为一个向量进行理解。

          • 多模态向量 v1(multimodal-embedding-v1):为每个输入部分(图片、文字)分别生成独立向量。

          • qwen3 多模态向量(qwen3-vl-embedding):qwen2.5-vl-embedding 的升级版本,在图文融合理解和跨模态检索精度方面进一步提升。

          排序模型

          排序模型位于知识库外部,对向量检索初步召回的候选切片进行二次排序,并返回相似度分数最高的前K个文本切片。qwen3-rerank(hybrid)官方排序(推荐)综合考量语义相关性与文本匹配特征(如BM25得分),能更好地处理需要精确关键词命中的查询;若只需语义排序,请选择qwen3-rerank。

          相似度阈值

          该阈值表示允许召回的文本切片的最低相似度分数,用于筛选排序模型返回的结果,只有分数超过此阈值的文本切片才会被召回。

          说明

          此处设置的是知识库的默认相似度阈值。将知识库关联到具体阿里云百炼应用时,还可为该应用单独设置阈值(将覆盖知识库的默认相似度阈值)。

          降低此阈值预期会召回更多文本切片,但可能召回相关度较低的内容;提高此阈值会减少召回的文本切片数量,若设置过高,将导致知识库丢弃相关切片。

          可通过命中测试对相似度阈值进行调优,以平衡召回率与精确率。

          最大召回数量

          假设阿里云百炼应用关联了A1、A2A3三个知识库,系统从这些库中检索与输入相关的切片,再通过排序模型重排序,选出最相关的前K条加入大模型的输入Token供回答参考。此K值即最大召回数量(上限为20),决定了排序模型提供给大模型参考的文本切片数量。

          增大该值可提高大模型的回答准确性,但会相应增加大模型输入Token消耗。

          向量存储

          选择向量数据库存储文本向量。内置的向量数据库可满足知识库的基本功能需求。如需管理、审计或监控数据库等高级功能,建议选择ADB-PG(AnalyticDB for PostgreSQL)。

          购买ADB-PG实例时请开启 向量引擎优化 ,否则阿里云百炼将无法使用此实例。
    • 音视频搜索(音视频内容检索分析场景)

      • 适用场景:

        • 构建基于音视频内容的智能检索与问答应用,如直播回放问答、课程助教、客服质检等。

        • 基于多模态内容进行二次创作(根据文字需求从知识库检索音视频片段,生成脚本、字幕或剪辑建议)。

      • 选择连接器:选择指定的数据连接器。如尚未创建数据连接器,请参阅数据连接

      • 数据源接入:支持本地上传音视频文件,或从阿里云对象存储OSS导入。支持的音频格式:MP3、WAV、AAC、FLAC、OGG、M4A、WMA;支持的视频格式:MP4、AVI、MOV、MKV、FLV、WMV。

        创建说明(音视频搜索)

        1. 选择数据:为知识库指定数据来源(含音视频文件)。数据源内容将导入知识库,用于后续检索。支持本地上传云端导入(选择现有类目或已解析文件)两种方式。

          • 本地上传:从本地计算机上传音视频文件并进行解析。展开下方折叠面板,了解解析方式的具体选项。

            解析方式(自定义设置)说明

            音视频解析:对文件执行语音识别、视频帧提取(仅限视频)和剧情解析(仅限视频),将全部声画信息按时间轴结构化对齐。

            • 语音识别:字幕内容解析器通过录音文件识别将语音转为文本。暂不支持识别音乐或自然环境声(如喇叭声、钟声、雷声等)。

            • 视频帧提取:从原始视频中抽取代表性画面,并生成对应的文本描述。

            • 剧情解析(需手动开启):分析视频内容,定位具体事件并标注时间戳,同时生成相应的文本描述。

          • 云端导入:从阿里云百炼数据连接器或对象存储OSS导入音视频文件并进行解析。

        2. 索引配置:定义导入音视频文件的处理和存储方式,直接影响检索效果。

          以下配置项中,仅"向量存储"选用 ADB-PG 时可能产生费用,其余配置均免费。

          切片方式

          系统先将音视频文件解析所得的文本切分为语义完整的文本切片,再通过向量模型将每个切片转换为向量,以键值对形式存入向量数据库。知识库创建完成后,可查看或编辑各文本切片的具体内容。

          • 智能切分知识库先依据内置的分句标识符将文本序列拆分为若干段落,再根据段落生成文本切片。拆分和切分过程中,知识库会尽量保持语义完整,减少不必要的截断;但当文本切片的字符数超过最大分段长度时,将强制截断。

          Meta信息抽取

          metadata(元数据)是与音视频文件相关的附加属性,以 key-value 键值对的形式附加到文本切片中。

          • 作用:元数据为文本切片提供重要的上下文信息,可显著提升知识库检索的准确性。例如,某音视频知识库中存有数千个编程培训视频(包含 Python、Java、C++ 等)。检索Python基础语法时,若多个课程中均出现基础语法一词,可能同时召回 Java、C++ 等课程的文本切片(与查询无关)。将编程语言类型作为元数据附加到对应视频的所有文本切片后,知识库即可精准过滤出同时满足编程语言类型=Python且包含基础语法条件的文本切片,从而提高检索准确性,同时降低模型的输入 Token 消耗。

          • 用法:通过API调用应用时,可在请求参数metadata_filter中指定metadata。应用检索知识库时,将先按metadata筛选相关文件。

          • 注意:知识库创建后,不支持再配置 metadata 抽取

          如何配置metadata

          如下图所示,该视频文件(包含其所有文本切片)的元数据含有 3 个自定义属性:teacher(培训视频讲师信息)、filename(文件名)以及keywords(视频中出现的关键词)。

          123

          开启Meta信息抽取,然后单击设置,为该知识库中所有文件附加统一或个性化的元数据。切分时,每个文件的元数据将集成到各自的文本切片中。下图为上述示例所用的 meta 信息模板:

          image

          新建Meta信息模板说明

          取值方法说明:

          • 常量:为知识库中所有音视频文件统一附加一个固定属性。

            如上方示例所示,若知识库中所有课程视频均由同一位讲师授课,可统一设置字段名为 teacher 的常量,为所有视频填入该讲师姓名。
          • 变量:为知识库中每个音视频文件附加一个可变属性。目前支持file_namecat_name两种属性。选择file_name时,阿里云百炼将文件名附加到其元数据中(如上方示例所示);选择cat_name时,将文件所在类目的名称附加到文件元数据中。

          • 关键词搜索:系统在每个音视频中查找预设关键词,并将匹配到的关键词作为属性添加至该文件的元数据中。

            例如,在上述示例的 meta 信息模板中,预设关键词为:

            image

            由于该音视频中仅出现了"Python"这一关键词,因此系统只提取"Python"作为该文件 keywords 属性的值。

          是否参与检索:开启后,元数据字段和值将与文本切片内容一同参与知识库检索;关闭时,仅文本切片内容参与检索。

          是否参与模型回复:开启后,元数据字段和值将与文本切片内容一同作为大模型生成回答的输入;关闭时,仅文本切片内容参与大模型的回答生成。

          多轮对话改写

          开启该功能后,系统将调用专用轻量级模型,结合对话历史将用户当前问题改写为独立的、上下文完整的新查询,再用于知识库检索。

          向量模型

          向量模型用于将原始输入 Prompt 和文本切片转化为数值化向量,以便计算语义相似度。默认的官方向量 v4(text-embedding-v4)模型在语种支持、代码片段向量化效果和向量维度自定义等方面均优于官方向量 v3(text-embedding-v3)模型,适用于大多数场景。详情请参见文本与多模态向量化

          知识库使用不同向量模型时生成的向量维度(不可修改):

          • text-embedding-v4:512 维

          • text-embedding-v3:512 维

          排序模型

          排序模型位于知识库外部,对向量检索初步召回的候选切片进行二次排序,并返回相似度分数最高的前K个文本切片。qwen3-rerank(hybrid)官方排序(推荐)综合考量语义相关性与文本匹配特征(如BM25得分),能更好地处理需要精确关键词命中的查询;若只需语义排序,请选择qwen3-rerank。

          相似度阈值

          该阈值表示允许召回的文本切片的最低相似度分数,用于筛选排序模型返回的结果,只有分数超过此阈值的文本切片才会被召回。

          说明

          此处设置的是知识库的默认相似度阈值。将知识库关联到具体阿里云百炼应用时,还可为该应用单独设置阈值(将覆盖知识库的默认相似度阈值)。

          降低此阈值预期会召回更多文本切片,但可能召回相关度较低的内容;提高此阈值会减少召回的文本切片数量,若设置过高,将导致知识库丢弃相关切片。

          可通过命中测试对相似度阈值进行调优,以平衡召回率与精确率。

          最大召回数量

          假设阿里云百炼应用关联了A1、A2A3三个知识库,系统从这些库中检索与输入相关的切片,再通过排序模型重排序,选出最相关的前K条加入大模型的输入Token供回答参考。此K值即最大召回数量(上限为20),决定了排序模型提供给大模型参考的文本切片数量。

          增大该值可提高大模型的回答准确性,但会相应增加大模型输入Token消耗。

          向量存储

          选择向量数据库存储文本向量。内置的向量数据库可满足知识库的基本功能需求。如需管理、审计或监控数据库等高级功能,建议选择ADB-PG(AnalyticDB for PostgreSQL)。

          购买ADB-PG实例时请开启 向量引擎优化 ,否则阿里云百炼将无法使用此实例。

    使用场景可根据需求选择基础文档问答图文并茂回复视觉理解(富文本文档)极速问答(适用于高度结构化或简单文档类型,任务明确,提供极低延迟的问答体验)

在请求高峰时段,创建过程可能需要数小时(取决于数据量),请耐心等待。

更新知识库

知识库内容的任何变更均会实时同步到所有引用该知识库的应用中。

文档搜索类知识库

  • 自动更新(推荐)

    通过对象存储OSS管理文件,借助函数计算 FC 监听文件变更事件,自动同步更新至知识库,实现知识的实时更新。详见告别手动操作,让AI知识库自动更新

  • 手动更新

    知识库页面,找到目标知识库,单击卡片上的查看详情

    • 如何新增文件:单击上传数据,勾选数据连接器中的已有文件。

    • 如何删除文件:找到目标文件后,单击其右侧的删除

    • 如何修改文件内容:当前不支持文件的原地更新或覆盖上传。需先删除知识库中的旧版本文件,再将修改后的新版本文件重新导入知识库。

      注意:保留旧版本文件可能导致过时内容被检索和召回。

数据查询、图片问答类知识库

说明 :图片问答类知识库的详情页没有直接的 上传数据 按钮,需通过 查看数据源 链接跳转到连接器详情页进行数据更新操作。
  • 自动更新(推荐)

    使用阿里云关系型数据库RDS或自建MySQL管理知识数据,可实现知识库的自动同步更新(延迟通常为分钟级,请求高峰期可能为小时级),详见集成MySQL数据至知识库

  • 手动更新

    当知识库的数据源为应用数据中的数据表时,只能手动更新,分为以下两步。

    1. 步骤一:更新数据表

      进入数据连接页签,在左侧列表中选择目标数据表,单击上传数据

      • 如何插入新数据:导入类型选择增量上传。需上传一个仅包含表头和新增数据行Excel文件。

        文件表头须与当前表结构一致。可使用页面上的 下载模板 功能获取标准表头文件,并在该文件中直接填写新数据。
      • 如何删除数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已移除待删除记录)Excel文件。

        如何获取全量数据:单击页面上的 image 下载XLSX格式数据。
      • 如何修改数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已包含相应修改)Excel文件。

    2. 步骤二:将变更同步至知识库

      返回知识库列表,找到目标知识库,单击卡片上的查看详情。单击数据表左上方的image图标,确认后即可将数据表的最新内容同步至知识库。

      每次更新后仍需手动重复以上步骤 。

音视频搜索类知识库

  • 自动更新

    暂不支持。

  • 手动更新

    知识库页面,找到目标知识库,单击卡片上的查看详情

    • 如何新增文件:单击上传数据,勾选数据连接中的已有文件。

    • 如何删除文件:找到目标文件后,单击其右侧的删除

      此操作仅将文件从知识库中移除,不会删除 数据连接 中的源文件。
    • 如何修改文件内容:当前不支持文件的原地更新或覆盖上传。需先删除知识库中的旧版本文件,再将修改后的新版本文件重新导入知识库。

      注意:保留旧版本文件可能导致过时内容被检索和召回。

编辑知识库

知识库创建后,仅支持修改知识库名称知识库描述相似度阈值,其他配置均无法更改(如需更改,须删除并重新创建知识库)。编辑操作仅支持通过控制台进行,无对应API

操作步骤:知识库页面,找到目标知识库,单击卡片上的更多(...),再单击编辑。注意:同一知识库每个自然日最多允许变配1次,超出后操作将被静默拒绝(无错误提示)。

删除知识库

警告

删除操作不可逆,请谨慎操作。

删除知识库前,建议先解除其与所有已发布的阿里云百炼应用的关联。

已关联的未发布应用不影响删除操作。

删除知识库步骤

  1. 对每个关联了该知识库的已发布应用,依次执行以下操作:

    1. 应用管理页面,找到关联该知识库的应用,单击配置

    2. 在知识库列表中移除该知识库,单击页面右上角的发布,按提示重新发布应用。

  2. 知识库页面,找到目标知识库,单击卡片上的更多(...),再单击删除

变更配置

旗舰版提供RCU以保障高QPS下的检索性能,并支持更大的存储容量;标准版适合开发测试或低并发场景。

说明

标准版与旗舰版支持互转。旗舰版的RCU数量支持修改。

同一知识库每个自然日最多允许变配1次。

RCU: RCU(Retrieval Compute Unit)是知识库检索并发能力的度量单位。1 RCU ≈ 支撑在线检索最高50 QPS。RCU越大,可支撑的并发数越高。
  • 注意:

    • 如果知识库(旗舰版)使用平台存储,降级为标准版前,需将已用存储空间降至80 GB以下。

      可通过删除知识库内的文件或数据来释放存储空间。
  • 操作步骤:

    1. 知识库页面,找到目标知识库,单击卡片上的更多(...),再单击编辑

    2. 根据当前版本,在弹出的窗口中选择相应操作:

      • 标准版:选择升级

      • 旗舰版:选择降级变更RCU数量

    3. 按照界面提示完成操作,单击确定保存后配置即时生效。

命中测试

命中测试用于验证知识库能否为AI应用提供准确的知识输入。通过模拟用户提问,检查知识库的召回结果并调优相似度阈值。

命中测试中的排序模型支持三种模式:问答模式(默认,适合用户提问与文档内容不完全匹配的场景)、相似模式(适合查询与文档内容高度相似的场景)和自定义高级模式。不同模式下,同一查询的排序得分可能存在显著差异(例如,同一切片在问答模式下得分47%,在相似模式下可达69%)。

通过命中测试,可以:

  • 验证知识库能否为AI应用提供有效的知识输入

  • 调优相似度阈值,平衡召回率与准确性

  • 发现知识库中的内容缺失或质量问题

场景示例

  • 场景1:客户咨询产品价格

    测试输入:"你们的阿里云百炼手机多少钱?"
    期望结果:能够召回包含价格信息的相关文本切片。
  • 场景2:技术问题排查

    测试输入:"设备连不上WiFi怎么办?"
    期望结果:能够召回WiFi连接故障排除的相关文本切片。
  • 场景3:视觉理解文档检索(视觉理解知识库)

    视觉理解知识库支持纯文字、纯图片和图文组合三种查询模式:
    模式1(纯文字):输入"Object Storage Service",召回文档和图片中的相关切片。
    模式2(纯图片):上传一张产品截图,系统通过视觉理解匹配语义相近的切片。
    模式3(图+文字):同时上传图片并输入描述文字,组合查询可提升召回相似度。
  • 场景4:极速问答(极速问答知识库)

    极速问答知识库仅支持文本查询(不支持图片输入),适合结构化文档的快速检索:
    测试输入:"千问Pro 8的价格是多少?"
    期望结果:快速召回包含价格信息的 FAQ 切片。

操作步骤

  1. 知识库页面,找到目标知识库,单击卡片上的命中测试

  2. 在测试界面输入问题(建议收集用户常见问题),观察召回结果。

    • 召回结果:即本次测试的命中结果(已按相似度降序排列),单击任一切片即可查看其具体内容。

    • image图标:若为图片问答类知识库,系统会先将输入图片转为向量并检索相关记录,再将这些记录与提问一起交由大模型生成回答;若为文档搜索、数据查询或音视频搜索类知识库,上传的图片不参与检索;若为使用场景选择「视觉理解」的文档搜索类知识库,上传图片同样参与检索,支持纯文字、纯图片和图文组合三种查询模式,图文组合查询可提升召回相似度。

  3. 确认相关文本切片是否被正确召回。如未召回,需调整相似度阈值并重复上一步。

  4. 单击查看历史召回记录,可对比不同阈值设置下的历史召回效果。

image

重排(Rerank)配置

重排(Rerank)功能的开关位置取决于调用知识库的方式,配置错误可能导致排序功能未生效或产生非预期费用。

  • 旧版智能体应用、工作流应用

    在应用页面,找到已挂载的知识库,单击其右侧的调试按钮,进入页面后对重排策略开关进行设置。

    重要

    应用内的配置优先级高于知识库本身的配置。

  • 新版智能体应用

    1. 在知识库卡片上,单击命中测试

    2. 选择排序模型处选择不使用模型

    3. 单击保存使配置生效。

重要

新版智能体将知识库作为标准工具调用,配置以知识库自身设置为准

  • OpenAPI

    • 控制台:即您在知识库的编辑命中测试页面所做的配置。

    • API:相关参数设置,参阅检索知识库

    重要

    优先级:API参数设置优先级高于控制台页面配置。

日志与监控

知识库的检索调用日志、字段说明、SQL示例与监控边界,详见知识库日志与监控

配额与限制

  • 关于知识库支持的数据源与容量等信息,请参见知识库配额与限制

  • 单个阿里云百炼应用可关联的知识库数量:

    • 新版智能体应用(Agent 2.0):

      • 各类型知识库均可无限量关联。

    • 工作流应用 / 旧版智能体应用(Agent 1.0):

      • 文档搜索类:最多5

      • 数据查询类:最多5

      • 图片问答类:最多1

      • 音视频搜索类:最多5个(旧版智能体应用)/ 不支持(工作流应用)

      不同类型知识库可同时关联,总数最多为16个(旧版智能体应用)/11个(工作流应用)

计费说明

知识库采用按量付费(后付费)模式,按小时统计各计费项用量并自动扣费。请保持阿里云账户余额充足(可前往费用与成本充值),避免因欠费导致服务中断。

计费项

说明

规格费用

标准版旗舰版 知识库的实际运行时长费用,价格详见知识库计费说明。变更配置时,按变更时间点分段计费

向量、排序模型调用费用

创建、更新或检索知识库时会调用向量(embedding)和排序(rerank)模型,按输入 Token 用量计费,价格以模型调用计费页为准。

账单查询:账单详情

API参考

常见问题

构建知识库

  • Q: 数据连接器中已导入知识库的文件/数据表能否删除?

    • 文档搜索、音视频搜索类知识库:可以删除。数据连接器与知识库中的文件相互独立,删除数据连接器中的源文件不影响已导入知识库的文件。

    • 数据查询、图片问答类知识库:不可删除,否则会导致数据同步、查看知识库等功能异常。

处理图片及多模态内容

  • Q: 文件含插图(需阿里云百炼应用在回答时返回),应如何处理?

    使用文档搜索类知识库

    方式一(仅适用智能体应用)

    1. 构建知识库时,知识库类型选择文档搜索,使用场景选择图文并茂回复

      选择图文并茂回复后,知识库将从文件插图中提取摘要,大模型根据摘要与问题的相关性自主决定是否插入图片。
      重要

      上传文档时不能选择电子文档解析,否则无法获取图片内容。电子文档解析不识别文档中的图片,会导致图文并茂回复功能无法正常使用。

      image

    2. 创建或编辑智能体应用时,选择千问-Plus千问-Plus-Latest模型(经测试,两款模型效果最佳)。点击文档知识库右侧的+按钮,添加上一步构建的知识库。

      说明

      召回长度须小于文档实际长度。若召回长度超过文档实际长度,系统将直接返回完整文档内容,不执行图文并茂的逻辑判断。

      注意:当前"图文并茂回复"与"展示回答来源"功能暂不支持同时开启。
    3. 实际问答效果:

      image

    方式二(适用智能体应用与工作流应用)

    1. 将图片上传至公网可访问位置并获取完整 URL。推荐使用 OSS,具体操作请参见将图片上传至OSS并使用其文件URL

    2. 在文件中插入完整 URL(不支持相对路径)。不支持直接在文档中嵌入图片文件(如通过复制粘贴或菜单插入本地图片),必须使用公网可访问的URL链接引用图片。

      若已按说明操作但图片仍无法显示,请检查文本切片中的URL是否完整,确认是否存在多余空格或特殊字符(可能被系统误解析),如有问题可直接编辑修正。

      文件正确引用图片示例

      提示词模板示例

      实际问答效果

      image

      # 知识库
      请记住以下材料,他们可能对回答问题有帮助。
      ${documents}
      
      # 要求
      如果有图片,请展示图片。

      image

      文件错误引用图片示例

      提示词模板示例

      实际问答效果

      image

      # 知识库
      请记住以下材料,他们可能对回答问题有帮助。
      ${documents}
      
      # 要求
      如果有图片,请展示图片。

      image

      解释:直接在文件中嵌入图片时,阿里云百炼应用不会在回答中展示该图片。

    使用图片问答类知识库

    1. 将图片上传至公网可访问位置并获取完整 URL。推荐使用 OSS,具体操作请参见将图片上传至OSS并使用其文件URL

    2. 表格页签中新建数据表,并添加 image_url 类型字段用于存储图片的完整 URL。

      说明
      • image_url 字段不支持存储相对路径。

      • 单个 image_url 字段不支持存储多个图片 URL。若单条记录需关联多张图片,须为每张图片分别创建独立的 image_url 字段(如 image_1image_2 等)。

      • 数据表中每个 image_url 指向的图片大小不得超过 3 MB,超出限制将导致知识库创建失败。

      • 数据表创建后无法新增或修改 image_url 类型字段,请在初次设计表结构时预留所有所需的图片字段。

      image

    3. 构建知识库时,知识库类型选择图片问答

    4. 创建或编辑智能体应用时,点击图片(图片问答类知识库)右侧的+按钮,添加上一步构建的知识库,并将提示词模板修改为:

      # 知识库
      请记住以下材料,他们可能对回答问题有帮助。
      ${documents}
      
      # 要求
      如果有图片,请展示图片。
    5. 在页面右侧的输入框中发起提问。

      例如:"简单介绍百炼X1手机。"

      正确引用图片示例

      提示词模板示例

      用户提示词和阿里云百炼应用返回的结果

      image

      # 知识库
      请记住以下材料,他们可能对回答问题有帮助。
      ${documents}
      
      # 要求
      如果有图片,请展示图片。

      image

权限与安全

  • Q: 操作知识库时,遇到报错"缺少该模块的权限",应如何处理?

    RAM 用户默认无法执行创建、更新、删除知识库等写操作,需由阿里云账号(主账号)为其授予管理员权限(或至少同时包含应用数据-操作知识库-操作权限)页面权限

  • Q: 知识库是否私有?其他组织或用户能否访问?

    知识库仅限其所在业务空间内的成员访问和操作,不对外公开。

  • Q: 阿里云是否会使用我账号下的知识库回答其他用户的问题?

    阿里云严格保护数据隐私,不会将您的知识库用于回答其他用户的问题或模型训练。数据安全与隐私承诺详见合规资质与隐私说明

迁移与导出

  • Q: 如何导出知识库到本地?

    当前不支持一键导出。您可调用ListChunks接口,编写脚本批量拉取文档和切片数据作为替代方案。

更多

Q: 长文本大模型(Long-Context LLM)和RAG怎么选?

长文本大模型(如 Qwen-Long)与 RAG 均可通过引入外部信息优化输出,但各有侧重。长文本大模型逐 Token 全量审视输入文本,在深度理解和长文本摘要方面通常更具优势,但计算和推理成本较高;RAG 通过跨源快速检索,只关注最相关的 Token,更适合无需全局理解、仅需整合最新信息片段即可快速作答的事实型问题场景。

场景教程

通过阿里云百炼快速构建在线知识库问答应用,实现全天候(7 × 24)响应用户咨询,提升用户体验与业务竞争力: