通义千问-图像翻译API参考

更新时间:
复制为 MD 格式

通义千问-图像翻译模型(Qwen-MT-Image)可精准翻译图像中的文字,并保留原始排版。该模型还支持领域提示、敏感词过滤、术语干预等自定义功能。

重要

本文档仅适用于中国内地部署模式,必须使用对应的API Key

模型概览

1

源语种:中文

2

英文

3

日文

4

韩语

es

西班牙语

fr

法语

模型名称

模型简介

输出图像规格

qwen-mt-image

通义千问-图像翻译模型

支持中/英文与其他语种之间的互译,但不支持在非中/英语种之间直接翻译(例如,从日语翻译为韩语)。详情请参见支持的语种

图片格式:JPG。

前提条件

您需要已获取API Key配置API Key到环境变量

HTTP调用

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2image/image-synthesis

HTTP API 采用异步模式,调用流程分两步:

  1. 创建任务获取任务ID:发送一个请求创建任务,该请求会返回任务ID(task_id)

  2. 根据任务ID查询结果:使用task_id轮询任务状态,直到任务完成并获得图像URL。

步骤1:创建任务获取任务ID

说明
  • 创建成功后,使用接口返回的 task_id 查询结果,task_id 有效期为 24 小时。请勿重复创建任务,轮询获取即可。

  • 新手指引请参见Postman

请求参数

图像翻译

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image2image/image-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "qwen-mt-image",
    "input": {
        "image_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250916/ordhsk/1.webp",
        "source_lang": "zh",
        "target_lang": "en",
        "ext": {
            "config": {
                "imageSegment": false
            }
        }
    }
}'

请求头(Headers)

Content-Type string (必选)

请求内容类型。此参数必须设置为application/json

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

X-DashScope-Async string (必选)

异步处理配置参数。HTTP请求只支持异步,必须设置为enable

重要

缺少此请求头将报错:“current user api does not support synchronous calls”。

请求体(Request Body)

model string (必选)

模型名称,必须设置为qwen-mt-image

input object (必选)

输入参数对象,包含以下字段:

属性

image_url string (必选)

图像的公网可访问的URL,支持 HTTP 和 HTTPS 协议。如需获取本地文件的公网URL,请参见上传文件获取临时URL

  • 格式限制:JPG、JPEG、PNG、BMP、PNM、PPM、TIFF、WEBP

  • 尺寸限制:图像的宽度和高度均需在15-8192像素范围内,宽高比在1:1010:1范围内。

  • 大小限制:不超过100MB

  • URL地址中不能包含中文字符。

  • 示例https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250916/ordhsk/1.webp

source_lang string (必选)

源语种

  • 支持值:语种全称、语种编码或auto(自动检测),对大小写不敏感

  • 限制:与target_lang不同,且至少有一项为中文或英文

  • 示例Chineseenauto

target_lang string (必选)

目标语种

  • 支持值:语种全称或语种编码,对大小写不敏感

  • 限制:与source_lang不同,且至少有一项为中文或英文

  • 示例Chineseen

ext object (可选)

可选拓展字段。

属性

domainHint string (可选)

领域提示,为使译文风格更贴合特定领域,可以使用英文描述使用场景、译文风格等需求。

为确保翻译效果,建议不超过200个英文单词。

重要

领域提示语句当前只支持英文

示例:These sentences are from seller-buyer conversations on a B2C ecommerce platform. Translate them into clear, engaging customer service language, ensuring the translation is appropriate for handling potential issues or disputes.

sensitives array (可选)

配置敏感词,以在翻译前过滤图片中完全匹配的文本,对大小写敏感

敏感词的语种可与源语种不一致,支持全部的源语种目标语种。为确保翻译效果,建议单次请求添加的敏感词不超过50个。

示例:["全场9折", "七天无理由退换"]

terminologies array (可选)

术语干预,为特定术语设定译文,以满足特定领域的翻译需求,术语对的语种需要与source_langtarget_lang对应。

属性

src string (必选)

术语的源文本,语种需要与源语种source_lang一致。

tgt string (必选)

术语的目标文本,语种需要与目标语种target_lang一致。

示例:[{"src": "应用程序接口", "tgt": "API"}, {"src": "机器学习", "tgt": "ML"}]

config object (可选)

属性

imageSegment bool (可选)

是否开启图像主体分割。开启后,将跳过对图像中主体(如人物、商品、Logo)上文字的翻译。

  • false:(默认值)翻译图像中的所有文字。

  • true:不翻译图像主体的文字。

注意:旧版本参数名为skipImgSegment(是否跳过图像主体分割)。为保持兼容,该参数仍受支持,但建议使用新的 imageSegment参数。

响应参数

成功响应

请保存 task_id,用于查询任务状态与结果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

异常响应

创建任务失败,请参见错误信息进行解决。

{
    "code": "InvalidApiKey",
    "message": "No API-key provided.",
    "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

message string

请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

步骤2:根据任务ID查询结果

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

说明
  • task_id 有效期为24小时,若ID不存在或已过期,任务状态将返回 UNKNOWN

  • 任务成功后返回的 url有效期为24小时,请及时下载并保存图像。

  • 此查询接口的默认RPS1。如需更高频次的查询或事件通知,请配置异步任务回调

  • 如需批量查询或取消任务,请参见管理异步任务

请求参数

查询任务结果

您需要将86ecf553-d340-4e21-xxxxxxxxx替换为真实的task_id。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
请求头(Headers)

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

URL路径参数(Path parameters)

task_id string(必选)

任务ID。

响应参数

任务执行成功-存在可翻译内容

任务数据(如任务状态、图像URL等)仅保留24小时,超时后会被自动清除。请您务必及时保存生成的图像。

{
    "request_id": "5fec62eb-bf94-91f8-b9f4-f7f758e4e27e",
    "output": {
        "task_id": "72c52225-8444-4cab-ad0c-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-08-13 18:11:16.954",
        "scheduled_time": "2025-08-13 18:11:17.003",
        "end_time": "2025-08-13 18:11:23.860",
        "image_url": "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx?Expires=xxx"
    },
    "usage": {
        "image_count":1
    }
}

任务执行成功-无可翻译内容

在图像中无可翻译文本(例如,在识别出图像主体后,其余部分无文字)时,任务仍会成功并正常计费,但会返回No text detected for translation的提示。

{
    "request_id": "0ccb84aa-e034-431d-9d54-08e14fxxxxxx",
    "output": {
        "task_id": "34ec4208-97d6-498b-a390-9173f7xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2026-01-12 17:56:23.625",
        "scheduled_time": "2026-01-12 17:56:23.656",
        "end_time": "2026-01-12 17:56:25.324",
        "image_url": "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx.jpg?Expires=xxx",
        "message": "No text detected for translation"
    },
    "usage": {
        "image_count": 1
    }
}

任务执行失败

若任务执行失败,task_status将置为 FAILED,并提供错误码和信息。请参见错误信息进行解决。

{
    "request_id": "daad9007-6acd-9fb3-a6bc-d55902b9c9ff",
    "output": {
        "task_id": "fe8aa114-d9f1-4f76-b598-xxxxxx",
        "task_status": "FAILED",
        "submit_time": "2025-08-20 09:54:21.911",
        "scheduled_time": "2025-08-20 09:54:21.984",
        "end_time": "2025-08-20 12:55:00.818",
        "code": "InternalError",
        "message": "xxxxxx"
    }
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

submit_time string

任务提交时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任务执行时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任务完成时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

image_url string

模型生成图像的URL地址,与原图长宽相同,JPG格式。有效期为24小时,请及时下载并保存图像。

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

message string

请求失败的详细信息,详情请参见错误信息

通常请求成功时不会返回此参数,仅在图像中无可翻译文本(例如,在分割图像主体后,其余部分无文字)时,任务仍会成功并正常计费,但会返回No text detected for translation的提示。

usage object

输出信息统计。只对成功的结果计数。

属性

image_count integer

模型生成图像的数量,固定为1。

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

支持的语种

进行图像翻译时,源语种或目标语种必须至少有一种是中文或英文。不支持在两个非中、英语种之间直接翻译(例如,从日语翻译为韩语)。若不确定源语种,可将 source_lang 设置为 auto 进行自动检测。

语种(中文名)

英文全称

编码

支持作为源语种

支持作为目标语种

简体中文

Chinese

zh

支持

支持

英文

English

en

支持

支持

韩语

Korean

ko

支持

支持

日语

Japanese

ja

支持

支持

俄语

Russian

ru

支持

支持

西班牙语

Spanish

es

支持

支持

法语

French

fr

支持

支持

葡萄牙语

Portuguese

pt

支持

支持

意大利语

Italian

it

支持

支持

德语

German

de

支持

不支持

越南语

Vietnamese

vi

支持

支持

马来语

Malay

ms

不支持

支持

泰语

Thai

th

不支持

支持

印尼语

Indonesian

id

不支持

支持

阿拉伯语

Arabian

ar

不支持

支持

计费与限流

  • 模型免费额度和计费单价请参见模型价格

  • 模型限流请参见限流

  • 计费说明:按成功生成的图像张数计费。模型调用失败或处理错误不产生任何费用,也不消耗新人免费额度

  • 注意:如果图像中无可翻译文本,或在启用主体识别功能后,非主体部分无文字时,任务仍记为成功正常计费,此时接口会返回No text detected for translation的提示。

图像访问权限配置

图像存储于阿里云 OSS,链接允许公开访问,仅在 24 小时内有效。如果业务系统因安全策略无法访问阿里云OSS链接,请将以下 OSS 域名加入网络访问白名单。

dashscope-result-bj.oss-cn-beijing.aliyuncs.com
dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

错误码

如果模型调用失败并返回报错信息,请参见错误信息进行解决。

常见问题

Q:为什么图中的内容没有被翻译?

A:因为启用了主体分割功能,模型不会翻译图片中人物、商品、Logo等主体上的文字。若需翻译所有文字,请将ext.config.imgSegment参数设置为false

Q:如何将临时的图像链接转为永久链接?

A:临时链接无法直接转为永久链接。需通过后端服务下载图像,再上传至对象存储服务(如阿里云 OSS)以生成新的永久链接。

示例代码:下载图像到本地

import requests

def download_and_save_image(image_url, save_path):
    try:
        response = requests.get(image_url, stream=True, timeout=300) # 设置超时
        response.raise_for_status() # 如果HTTP状态码不是200,则引发异常
        with open(save_path, 'wb') as f:
            for chunk in response.iter_content(chunk_size=8192):
                f.write(chunk)
        print(f"图像已成功下载到: {save_path}")
        # 此处可以接上传到永久存储的逻辑
    except requests.exceptions.RequestException as e:
        print(f"图像下载失败: {e}")

if __name__ == '__main__':
    image_url = "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx?Expires=xxx"
    save_path = "image-translation.jpg"
    download_and_save_image(image_url, save_path)

Q: 如何查看模型调用量?

A: 模型调用完一小时后,请在模型观测页面,查看模型的调用次数、成功率等指标。如何查看模型调用记录