08-图片提示词-云市场(Marketplace)-阿里云帮助中心

图片提示词（垫图）

本文档详细介绍悠船 API 的图片提示词（Image Prompt / 垫图）功能。该功能允许开发者在图像生成任务中传入参考图片，悠船会分析参考图的核心元素（构图、色彩、主体等）作为灵感来源，生成全新图像。

功能概述

与大多数图像生成 API 将图片和文本通过独立字段分开传入不同，悠船 API 采用在 text 提示词字段中嵌入图片 URL 的方式来实现图片引导。这种方式简洁直观，允许在同一个提示词中灵活组合多张参考图和文本描述。

核心机制：

在提示词的 text 字段中嵌入公开可访问的图片 URL
悠船会自动识别 URL 并将其作为参考图像分析
参考图用于提供构图、色彩、主体等视觉灵感
文本描述用于补充细节和创作方向

支持的接口

接口	方法	路径	说明
图像生成	POST	`/v1/tob/diffusion`	文生图 / 图生图

说明：图片提示词（垫图）仅在图像生成接口中使用。其他编辑类接口（变化、重塑、延展等）使用的是上游生成的图像结果，不直接接受垫图输入。

使用方式

模式一：纯文本生图（无垫图）

不嵌入任何图片 URL，仅使用文本描述生成图像。

一只橘猫坐在窗台上，阳光照射，水彩画风格 --ar 16:9

模式二：单图 + 文本

以一张图片为参考，结合文字描述生成新图。

https://example.com/cat.jpg 一只橘猫坐在窗台上，阳光照射，水彩画风格

模式三：多图混合

不搭配文本，仅混合多张图片的风格与元素。

https://example.com/cat.jpg https://example.com/window.jpg

模式四：多图 + 文本

多张参考图配合文字做更精确的引导。

https://example.com/cat.jpg https://example.com/window.jpg 猫咪在窗台上晒太阳，温暖的光线

参数说明

图像权重（`--iw`）

控制参考图对最终生成结果的影响程度。值越大，生成结果越接近参考图；值越小，创作自由度越高。

模型	取值范围	默认值
v6 / v6.1 / v7 / v8.1	0 - 3	1
niji 6 / niji 7	0 - 2	1

使用建议：

--iw 0.3 ~ 0.5：弱参考，仅保留参考图的基调和氛围
--iw 1（默认）：平衡参考与创作
--iw 2 ~ 3：强参考，生成结果与参考图高度相似

支持的图片格式

格式	扩展名
PNG	`.png`
GIF	`.gif`
WebP	`.webp`
JPEG	`.jpg`、`.jpeg`

重要规则

#	规则	说明
1	图片数量上限	一个提示词中最多嵌入 20 张图片
2	仅图片无文本的兼容性	仅使用图像而不含文本提示时，不与 `--stylize` 或 `--weird` 参数兼容
3	URL 可访问性	嵌入的图片 URL 必须为公开可访问的 HTTPS 链接
4	参数位置	所有 `--` 前缀的参数应放置在提示词末尾

最佳实践

选择最接近设想的参考图：先选择与您最终设想最接近的图片作为基础参考，再用文字描述补充细节和调整方向。
权重调优策略：需要强参考效果时提高 --iw（如 2-3），需要更多创作自由度时降低（如 0.3-0.5）。
多图组合：使用多图时，每张图应承担不同的引导角色（如一张提供构图、一张提供色彩），避免使用高度相似的多张图片。
文本与图片互补：文本描述应用于文字说明参考图中无法传达的信息（如具体物体名称、场景细节），而非重复图片已有的内容。
测试不同权重：同一组参考图和文本，尝试 --iw 0.5、--iw 1、--iw 2 三个值，观察效果差异后选择最合适的。

与其他图片引导方式的区别

悠船 API 提供多种图片引导方式，各自用途不同：

引导方式	参数	用途	详情
图片提示词	URL 嵌入 text 字段	参考构图、色彩、主体等整体灵感	本文档
角色参考	`--cref`	在多张图中保持同一角色的外观一致性（面部、发型、服装）	各模型指南
风格参考	`--sref`	捕捉已有图像的视觉氛围并应用到新创作中	各模型指南
万物引用	`--oref`	将参考图中的角色/物体精确放入新场景中	各模型指南

图片提示词是最基础的图生图方式，适用于大多数需要参考图像的场景。如需更精细的角色或风格控制，请参考各模型指南中的高级引导方式。