文本检索系统在“召回”阶段为保证效率,返回的结果可能不够精准。文本排序模型能对召回的文档进行二次精准排序,确保将与用户查询最相关的结果排在最前,有效提升应用准确率。
模型概览
| 模型名称 | 最大Document数量 | 单条最大输入Token | 请求最大输入Token | 语种支持 | 单价(每千输入Token) | 免费额度 | 应用场景 | 
| qwen3-rerank | 500 | 4,000 | 30,000 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种 | 0.0005元 | 100万Token 有效期:百炼开通后90天内 | 
 | 
| gte-rerank-v2 | 中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50余语种 | 0.0008元 | 
- 单条最大输入Token:每个Query或Document的最大Token数量为4,000。输入内容超长将被截断。API仅基于截断后的内容计算,这可能导致排序结果不准确。 
- 最大Document数量:每次请求中Document的最大数量为500。 
- 请求最大输入Token:每次请求中所有Query和Document的Token总数不得超过30,000。 
前提条件
您需要已获取 API Key并配置API Key到环境变量DASHSCOPE_API_KEY。如果通过SDK调用,还需要安装DashScope SDK。
HTTP调用
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank| 请求 | 文本排序 | 
| 请求头(Headers) | |
| Content-Type  请求内容类型。此参数必须设置为 | |
| Authorization  请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 | |
| 请求体(Request Body) | |
| model  模型名称。当前接口必须设置为 | |
| input  输入内容。 | |
| parameters object (可选) 可选参数。 | 
| 响应 | 成功响应失败响应在访问请求出错的情况下,输出的结果中会通过  | 
| request_id  请求唯一标识。可用于请求明细溯源和问题排查。 | |
| output  任务输出信息。 | |
| usage  输出信息统计。 | |
| code  请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息。 | |
| message  请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息。 | 
SDK调用
调用示例
以下示例展示了调用文档排序模型API的代码示例。
SDK 的参数命名与HTTP接口基本一致,参数结构进行了一定封装。比如 HTTP 使用嵌套的input和parameters结构,但SDK 使用扁平参数。请在开发时注意区分。
import dashscope
def text_rerank():
    resp = dashscope.TextReRank.call(
        model="gte-rerank-v2",
        query="什么是文本排序模型",
        documents=[
            "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
            "量子计算是计算科学的一个前沿领域",
            "预训练语言模型的发展给文本排序模型带来了新的进展"
        ],
        top_n=2,
        return_documents=True
    )
    print(resp)
if __name__ == '__main__':
    text_rerank()输出示例
SDK对原始HTTP响应进行了封装,成功时会固定返回code和message字段,值为空字符串。
{
    "status_code": 200,
    "request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
    "code": "",
    "message": "",
    "output": {
        "results": [
            {
                "index": 0,
                "relevance_score": 0.9334521178273196,
                "document": {
                    "text": "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序"
                }
            },
            {
                "index": 2,
                "relevance_score": 0.34100082626411193,
                "document": {
                    "text": "预训练语言模型的发展给文本排序模型带来了新的进展"
                }
            }
        ]
    },
    "usage": {
        "total_tokens": 79
    }
}错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。
限流
模型限流触发条件请参考限流。