通用文本向量是由通义实验室开发的基于LLM的多语言统一文本向量模型,支持多个主流语种,为文本类数据提供高效的向量化转换服务,适用于RAG、文本分类、情感分析等自然语言处理任务。
模型概览
模型名称 | 向量维度 | 最大行数 | 单行最大Token数 | 单价(每千输入Token) | 支持语种 | 免费额度(注) |
text-embedding-v4 属于Qwen3-Embedding系列 | 2,048、1,536、1,024(默认)、768、512、256、128、64 | 10 | 8,192 | 0.0005元 Batch调用:0.00025元 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言 | 各100万Token 有效期:百炼开通后180天内 |
text-embedding-v3 | 1,024(默认)、768、512、256、128或64 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种 | ||||
text-embedding-v2 | 1,536 | 25 | 2,048 | 0.0007元 Batch调用:0.00035元 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语 | 各50万Token 有效期:百炼开通后180天内 |
text-embedding-v1 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语 |
关于模型限流,请参考限流。
前提条件
您需要已获取API Key并配置API Key到环境变量。如果通过SDK调用,还需要安装DashScope SDK。
OpenAI兼容
公共云
使用SDK调用时需配置的base_url:https://dashscope.aliyuncs.com/compatible-mode/v1
使用HTTP方式调用时需配置的endpoint:POST https://dashscope.aliyuncs.com/compatible-mode/v1/embeddings
金融云
使用SDK调用时需配置的base_url:https://dashscope-finance.aliyuncs.com/compatible-mode/v1
使用HTTP方式调用时需配置的endpoint:POST https://dashscope-finance.aliyuncs.com/compatible-mode/v1/embeddings
请求体 | 输入字符串Python
Java
curl
输入字符串列表Python
Java
curl
输入文件Python
Java
curl确保将 'texts_to_embedding.txt' 替换为您自己的文件名或路径
|
model 调用的模型,参考模型概览表格中的模型名称进行选择。 | |
input 输入文本的基本信息,可以是字符串,字符串列表, 或者打开的文件(需要Embedding的内容,一行一条)。 文本限制:
| |
dimension 用于用户指定输出向量维度,只适用于text-embedding-v3与text-embedding-v4模型。指定的值只能在2048(仅适用于text-embedding-v4)、1536(仅适用于text-embedding-v4)1024、768、512、256、128或64八个值之间选取,默认值为1024。 | |
encoding_format 用于控制返回的Embedding格式,当前仅支持 |
响应对象 | 成功响应
异常响应
|
data 任务输出信息。 | |
model 本次调用的模型名。 | |
object string 本次调用返回的data类型,默认为list。 | |
usage | |
id string 请求唯一标识。可用于请求明细溯源和问题排查。 |
DashScope
公共云
使用SDK调用时需配置的base_url:https://dashscope.aliyuncs.com/api/v1
使用HTTP方式调用时需配置的endpoint:POST https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
金融云
使用HTTP方式调用时需配置的endpoint:POST https://dashscope-finance.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding
通过SDK调用时需配置的base_url:https://dashscope-finance.aliyuncs.com/api/v1
Python:在导入模块之后,添加以下代码:
dashscope.base_http_api_url = 'https://dashscope-finance.aliyuncs.com/api/v1'
Java :将TextEmbedding textEmbedding = new TextEmbedding();
修改为
TextEmbedding textEmbedding = new TextEmbedding("http", "https://dashscope-finance.aliyuncs.com/api/v1");
请求体 | 输入字符串Python
Java
curl
输入字符串列表Python
Java
curl
输入文件Python
Java
curl确保将 'texts_to_embedding.txt' 替换为您自己的文件名或路径
|
model 调用的模型,参考模型概览表格中的模型名称进行选择。 | |
input 输入文本的基本信息,可以是字符串,字符串列表, 或者打开的文件(需要Embedding的内容,一行一条)。 文本限制:
| |
text_type 文本转换为向量后可以应用于检索、聚类、分类等下游任务,对检索这类非对称任务为了达到更好的检索效果建议区分查询文本(query)和底库文本(document)类型,入库、聚类、分类等对称任务可以不用特殊指定,采用系统默认值 | |
dimension 用于用户指定输出向量维度,只适用于text-embedding-v3与text-embedding-v4模型。指定的值只能在2048(仅适用于text-embedding-v4)、1536(仅适用于text-embedding-v4)1024、768、512、256、128或64八个值之间选取,默认值为1024。 | |
output_type 用户指定输出离散向量表示只适用于text_embedding_v3与text_embedding_v4模型,取值在dense、sparse、dense&sparse之间,默认取dense,只输出连续向量。 | |
instruct 添加自定义任务说明,仅在使用 |
响应对象 | 成功响应
异常响应
|
status_code 状态码,表示请求的执行结果(如 200 表示成功)。 | |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 | |
code 请求失败,表示错误码,成功时返回参数中该参数为空。 | |
message 请求失败,表示失败详细信息,成功时返回参数中该参数为空。 | |
output 任务输出信息。 | |
usage | |
request_id 请求唯一标识。可用于请求明细溯源和问题排查。 |
错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。