文档

Rerank - 精排

更新时间:

通过模型对文档进行打分和重排序

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
gpdb:Reranklist
  • DBInstance
    acs:gpdb:{#regionId}:{#accountId}:dbinstance/{#DBInstanceId}

请求参数

名称类型必填描述示例值
DBInstanceIdstring

实例 ID。

说明 您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。
gp-xxxxxxxxx
RegionIdstring

实例所在 Region ID。

cn-hangzhou
Querystring

Rerank 对应的查询语句。

ADBPG是什么
Documentsarray

要重新排序的文档列表。

string

单条文档内容。

ADBPG是阿里云OLAP数据库。
Modelstring

Rerank 模型,目前支持

  • bge-reranker-v2-m3:(默认值),性能较好,单条推理支持 8192tokens,超出会被切分,效果可能下降。
  • bge-reranker-v2-minicpm-layerwise:效果相比 v2-m3 更优,单条推理支持 2048tokens,超出会被切分,效果可能下降。
bge-reranker-v2-m3
TopKinteger

要返回的最相关文档的数量。

3
ReturnDocumentsboolean

为 false 时,不返回 Documents 文本,仅仅返回文档排序的索引及 rerank 得分。

false
MaxChunksPerDocinteger

超出模型窗口时,允许将文本切分的最大块数:

  • bge-reranker-v2-m3:默认值是 10。
  • bge-reranker-v2-minicpm-layerwise:默认值是 5:
说明 切分举例
  • 如果使用 bge-reranker-v2-minicpm-layerwise 模型,则最大单推理窗口为 2048tokens,此时如果 query 是 48tokens,单个 document 参数内容为 9000tokens,则会被分为:1-2000 为第一个,2001-4000 为第二个,以此类推,并且切分个数超过 MaxChunksPerDoc 后,后面的语句会被丢弃。
  • 10

    返回参数

    名称类型描述示例值
    object
    RequestIdstring

    请求 ID。

    ABB39CC3-4488-4857-905D-2E4A051D0521
    Messagestring

    接口返回详细信息。

    success
    Statusstring

    API 执行状态,取值说明:

    • success:执行成功。
    • fail:执行失败。
    success
    Tokensinteger

    消耗的 tokens 数。

    100
    Resultsarray<object>

    Rerank 结果。

    Resultsobject

    结果详情。

    Documentstring

    重排序的文档信息。

    ADBPG是阿里云OLAP数据库。
    Indexinteger

    此文档在请求参数 Documents 里的序号,从 0 开始。

    1
    RelevanceScorefloat

    Rerank 相似度分数。

    2.31412

    示例

    正常返回示例

    JSON格式

    {
      "RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
      "Message": "success",
      "Status": "success",
      "Tokens": 100,
      "Results": {
        "Results": [
          {
            "Document": "ADBPG是阿里云OLAP数据库。",
            "Index": 1,
            "RelevanceScore": 2.31412
          }
        ]
      }
    }

    错误码

    访问错误中心查看更多错误码。