模型概览
模型名称 | 数据类型 | 向量维度 | 单次请求文本最大行数 | 单行最大输入Token | 支持语种 |
text-embedding-async-v2 | float(32位) | 1,536 | 100,000 | 2,048 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语 |
text-embedding-async-v1 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语 |
模型名称 | 单价 (每千输入Token) | 免费额度(注) | 限流条件(超出任一数值时触发限流) | |
任务下发接口RPS限制 | 同时处理中任务数量 | |||
text-embedding-async-v2 | 0.0007元 | 各2000万Token 有效期:百炼开通后180天内 | 1 | 当前用户在系统通用文本向量异步作业排队中和运行中的作业数量不超过50个。 另外,为了避免大量突发的作业占据太多资源,限制并发的作业数为3个,即任意时间,单个用户最多只有3个通用文本向量的异步作业在并发运行,其他的作业只能在队列中等待。 |
text-embedding-async-v1 |
前提条件
通用文本向量批处理接口API支持通过HTTP和DashScope SDK进行调用。
在调用前,您需要开通模型服务并获取API Key,再配置API Key到环境变量。
如需通过SDK进行调用,请安装DashScope SDK。目前,该SDK已支持Python和Java。
HTTP调用
HTTP调用仅支持异步模式,需通过两步完成:
创建任务:首先发送一个请求创建任务,该请求会返回任务ID。
根据任务ID查询结果:使用上一步获得的任务ID,查询模型生成的结果。
通过HTTP调用时需配置的endpoint:
POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
创建任务
请求参数 |
|
请求头(Headers) | |
Authorization 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 | |
Content-Type 请求内容类型。此参数必须设置为 | |
X-DashScope-Async 异步处理配置参数。HTTP请求只支持异步,必须设置为 | |
请求体(Request Body) | |
model 调用模型名称,可以选择 | |
input 用户需要批量向量化处理的输入。 | |
parameters 向量化处理参数。 |
响应参数 | 成功响应
异常响应
|
output 任务输出信息。 | |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 | |
code 请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息。 | |
message 请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息。 |
根据任务ID查询结果
GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
请求参数 | 查询任务结果您需要将
|
请求头(Headers) | |
Authorization 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 | |
URL路径参数(Path parameters) | |
task_id 任务ID。 |
响应参数 | 任务执行成功任务数据(如任务状态、处理结果URL等)仅保留24小时,超时后会被自动清除。请您务必及时保存生成的图像。
任务执行中
任务执行失败如果因为某种原因导致任务执行失败,任务状态将被设置为FAILED,并通过code和message字段明确指示错误原因。
|
output 任务输出信息。 | |
usage 输出信息统计。只对成功的结果计数。 | |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 |
Dashscope
请先确认已安装最新版DashScope SDK,否则可能运行报错:安装SDK。
DashScope SDK目前已支持Python和Java。
SDK与HTTP接口的参数名基本一致,参数结构根据不同语言的SDK封装而定。参数说明可参考HTTP调用。
由于模型处理时间较长,底层服务采用异步方式提供。SDK在上层进行了封装,支持同步、异步两种调用方式。
请求体 | 同步调用Python
Java
异步调用Python
Java
|
model 调用模型名称,可以选择 | |
url 用户需要批量向量化的文件HTTP url。(需要向量化的内容,一行一条) 文本限制:
| |
text_type 文本转换为向量后可以应用于检索、聚类、分类等下游任务,对检索这类非对称任务为了达到更好的检索效果建议区分查询文本(query)和底库文本(document)类型;聚类、分类等对称任务可以不用特殊指定,采用系统默认值 |
响应参数 | 同步调用成功响应
异常响应请求失败
任务执行失败
异步调用成功响应
异常响应请求失败
任务执行失败
|
status_code 请求状态码,表示请求的执行结果(如 200 表示成功)。详情请参见错误信息。 | |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 | |
code 请求失败时表示错误码,成功时返回参数中该参数为空。详情请参见错误信息。 | |
message 请求失败,表示失败详细信息,成功时返回参数中该参数为空。详情请参见错误信息。 | |
output 任务输出信息。 属性 | |
usage 属性 |
常见问题
输入文件限制
输入文件需为 UTF-8 编码的文本文件,每行包含一个需要计算文字向量的字符串。系统会逐行处理每个输入,并在最终输出文件中返回对应的行号和生成的 embedding 结果。
单个文件大小不得超过 200MB。
单次请求的文本行数不得超过 100,000 行。
每行内容的长度不得超过 2,048 Token。
空行(即不包含任何字符的行)会被系统自动跳过,不会计算其文字向量。然而,为了便于结果对应,输出文件中仍会保留这些空行的行号。
输出文件说明
当任务成功完成后,提交的输入数据将被转换为向量结果,并存储在输出文件中。为了节省存储空间并方便下载,输出文件会被压缩为
.gz
格式。下载至本地后可解压缩以获取对应的文本输出文件。任务数据(如任务状态、处理结果URL等)仅保留24小时,超时后会被自动清除。请您务必及时保存包含任务结果的输出文件。
经过模型向量化后输出的文件是一个 jsonl 格式文件,即每一行都是一个完整的 json 结构,包含对应输入文件特定行的向量化输出。
错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。
基础限流
为了保证用户调用模型的公平性,通用文本向量对用户设置了基础限流。如果超出调用限制,用户的API请求将因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。各模型详细限流条件请参见限流。