文本检索系统在“召回”阶段为保证效率,返回的结果可能不够精准。文本排序模型能对召回的文档进行二次精准排序,确保将与用户查询最相关的结果排在最前,有效提升应用准确率。
模型概览
模型名称 | 最大Document数量 | 单条最大输入Token | 请求最大输入Token | 语种支持 | 单价(每千输入Token) | 免费额度 | 应用场景 |
qwen3-rerank | 500 | 4,000 | 30,000 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种 | 0.0005元 | 100万Token 有效期:百炼开通后90天内 |
|
gte-rerank-v2 | 中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50余语种 | 0.0008元 |
单条最大输入Token:每个Query或Document的最大Token数量为4,000。输入内容超长将被截断。API仅基于截断后的内容计算,这可能导致排序结果不准确。
最大Document数量:每次请求中Document的最大数量为500。
请求最大输入Token:每次请求中所有Query和Document的Token总数不得超过30,000。
前提条件
您需要已获取 API Key并配置API Key到环境变量DASHSCOPE_API_KEY。如果通过SDK调用,还需要安装DashScope SDK。
HTTP调用
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank请求 | 文本排序 |
请求头(Headers) | |
Content-Type 请求内容类型。此参数必须设置为 | |
Authorization 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 | |
请求体(Request Body) | |
model 模型名称。当前接口必须设置为 | |
input 输入内容。 | |
parameters object (可选) 可选参数。 |
响应 | 成功响应失败响应在访问请求出错的情况下,输出的结果中会通过 |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 | |
output 任务输出信息。 | |
usage 输出信息统计。 | |
code 请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息。 | |
message 请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息。 |
SDK调用
调用示例
以下示例展示了调用文档排序模型API的代码示例。
SDK 的参数命名与HTTP接口基本一致,参数结构进行了一定封装。比如 HTTP 使用嵌套的input和parameters结构,但SDK 使用扁平参数。请在开发时注意区分。
import dashscope
def text_rerank():
resp = dashscope.TextReRank.call(
model="gte-rerank-v2",
query="什么是文本排序模型",
documents=[
"文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
"量子计算是计算科学的一个前沿领域",
"预训练语言模型的发展给文本排序模型带来了新的进展"
],
top_n=2,
return_documents=True
)
print(resp)
if __name__ == '__main__':
text_rerank()输出示例
SDK对原始HTTP响应进行了封装,成功时会固定返回code和message字段,值为空字符串。
{
"status_code": 200,
"request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
"code": "",
"message": "",
"output": {
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196,
"document": {
"text": "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序"
}
},
{
"index": 2,
"relevance_score": 0.34100082626411193,
"document": {
"text": "预训练语言模型的发展给文本排序模型带来了新的进展"
}
}
]
},
"usage": {
"total_tokens": 79
}
}错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。
限流
模型限流触发条件请参考限流。