图片翻译
图片翻译将图片中嵌入的文字转换为目标语言,同时保留原始排版、字体样式、对齐方式和视觉设计。该服务专为电商图片场景设计,适用于商品主图、详情图、横幅和营销素材。
在控制台翻译图片
登录 Aidge 控制台,在侧边栏中点击试用与 API 配置,选择图片标签页。
页面以左右分栏布局:左侧翻译前图片上传区,右侧翻译后结果展示区。在左侧点击点击上传图片,或将文件直接拖入。像素不超过 4000x4000;大小不超过 10 MB,支持 PNG、JPEG、JPG、BMP、WebP。
在右侧配置面板语言区设置:
原始语向下拉框 —— Pro 版支持自动识别(9 个语向);标准版需手动选择。
目标语向下拉框 —— 默认英语,可改为其他目标语种。原始语向和目标语向不能相同。
在配置区开启可选开关:
译文纠正 —— 对翻译结果做拼写和语法纠正。开启后可在干预词表下拉中选择已创建的词表对术语翻译进行强制干预。
点击右下角开始翻译。处理过程中右侧显示Thinking 思考态;处理完成后展示翻译图片。
满意结果后,点击保存为 API 将当前配置创建为可复用的 API。保存为 API 仅在至少执行过一次开始翻译后可点击。如需手动微调翻译文字的位置、字号或措辞,详见编辑器。
用量与额度
页面底部状态栏实时显示用量:当前免费额度剩余百分比 + 剩余张数(如"剩余 40%,766 张"),右侧提供去充值链接跳转购买商品包页面。
页面状态
状态 | 触发条件 | 页面表现 |
空状态 | 尚未上传图片 | 左侧显示"点击上传图片",右侧显示"翻译结果将在此显示"+"上传图片后开始翻译" |
Thinking 态 | 已点击开始翻译,模型处理中 | 右侧显示加载动画 + "Thinking..."文案 |
已翻译 | 翻译成功完成 | 右侧展示翻译后图片,可下载或打开编辑器 |
翻译失败 | 模型异常 / 输入图片不合规 | 右侧展示失败提示 + 错误码 + 重试按钮 |
核心概念
多模态大模型翻译
Pro 版采用自研多模态大模型 (Ovis) 分析完整的图片上下文,而非仅提取文字。具体能力包括:
根据周围视觉元素正确理解缩写或含义模糊的文字。
生成符合广告和产品描述习惯的目标语言自然表达。
通过交叉参照图片中可见的品牌信息,准确翻译品牌名。
品牌和主体保护
开启品牌保护后,图片中可见的品牌名不会被翻译。此功能针对人工添加的品牌文字,不影响产品本身印刷的自然文字。
主体保护功能区分两类文字:
人工文字 -- 图片编辑过程中添加的文字(标题、标注、价格标签),会被翻译。
自然文字 -- 产品表面或环境中自带的文字(包装、标签、路牌),保持原样。
字体和排版保留
翻译后的文字保持原始字号、样式、颜色和对齐方式。文字擦除过程干净无残留色块,翻译文字在原位置和原尺寸下渲染。
单位转换
度量单位自动转换为目标语言的相应格式。中文单位如"斤""两""寸""尺""英吋"等会转换为目标语言的对应单位(如 kg、cm)。
从右到左 (RTL) 排版
翻译为阿拉伯语、希伯来语等 RTL 语言时,翻译文字按从右到左的方向排列,符合目标语言的阅读习惯。
复杂表格支持
图片中复杂表格结构内的文字在翻译后还原到原始单元格位置,保留表格边框和对齐方式。
图片编辑器
图片模式提供内置编辑器,用于手动调整翻译结果。翻译完成后,在预览面板中打开编辑器,微调文字位置、字号或措辞。
最大图片分辨率
支持处理最高 4000 x 4000 像素的图片,输出保持完整分辨率和清晰度。
支持的语言
图片翻译(标准版 / Pro 版 / PLUS 版)支持的翻译语向与文本翻译一致,共 96 个语向(含桥接,覆盖 44 种语言;繁体中文 zh-tw 经简体中文桥接)。Pro 版与 PLUS 版额外支持源语言自动识别(auto)。
使用限制
限制项 | 值 |
最大图片分辨率 | 4000 x 4000 像素 |
单图多语种自动识别 | 不支持,仅翻译指定的源语言文字。 |
QPS 限制 | 详见频率限制 |
说明: 如果图片中包含多种语言的文字,仅翻译指定的源语言。例如,图片同时包含中文和英文,源语言设为中文时,仅翻译中文文字,英文保持不变。
计费方式
图片翻译按张计费,按实际处理的图片张数计量。标准版与 Pro 版费率不同,具体价格以 Aidge 控制台定价页面为准。
标准版:¥0.015 / 张。
Pro 版(保留版式、支持图内文案编辑):¥0.06 / 张。
常见问题
支持不同语言的图片自动识别吗?
不支持。图片翻译仅翻译指定源语言的文字。如果图片同时包含中文和英文,源语言设为中文时仅翻译中文,英文保持不变;反之亦然。
图片翻译结果有瑕疵怎么调整?
如果图片不是电商商品图、不包含商品主体,或遇到漏翻问题,尝试关闭主体保护设置后重新提交请求。