08-图片提示词
图片提示词(垫图)
本文档详细介绍悠船 API 的图片提示词(Image Prompt / 垫图)功能。该功能允许开发者在图像生成任务中传入参考图片,悠船会分析参考图的核心元素(构图、色彩、主体等)作为灵感来源,生成全新图像。
功能概述
与大多数图像生成 API 将图片和文本通过独立字段分开传入不同,悠船 API 采用在 text 提示词字段中嵌入图片 URL 的方式来实现图片引导。这种方式简洁直观,允许在同一个提示词中灵活组合多张参考图和文本描述。
核心机制:
在提示词的
text字段中嵌入公开可访问的图片 URL悠船会自动识别 URL 并将其作为参考图像分析
参考图用于提供构图、色彩、主体等视觉灵感
文本描述用于补充细节和创作方向
支持的接口
接口 | 方法 | 路径 | 说明 |
图像生成 | POST |
| 文生图 / 图生图 |
说明:图片提示词(垫图)仅在图像生成接口中使用。其他编辑类接口(变化、重塑、延展等)使用的是上游生成的图像结果,不直接接受垫图输入。
使用方式
模式一:纯文本生图(无垫图)
不嵌入任何图片 URL,仅使用文本描述生成图像。
一只橘猫坐在窗台上,阳光照射,水彩画风格 --ar 16:9模式二:单图 + 文本
以一张图片为参考,结合文字描述生成新图。
https://example.com/cat.jpg 一只橘猫坐在窗台上,阳光照射,水彩画风格模式三:多图混合
不搭配文本,仅混合多张图片的风格与元素。
https://example.com/cat.jpg https://example.com/window.jpg模式四:多图 + 文本
多张参考图配合文字做更精确的引导。
https://example.com/cat.jpg https://example.com/window.jpg 猫咪在窗台上晒太阳,温暖的光线参数说明
图像权重(--iw)
控制参考图对最终生成结果的影响程度。值越大,生成结果越接近参考图;值越小,创作自由度越高。
模型 | 取值范围 | 默认值 |
v6 / v6.1 / v7 / v8.1 | 0 - 3 | 1 |
niji 6 / niji 7 | 0 - 2 | 1 |
使用建议:
--iw 0.3 ~ 0.5:弱参考,仅保留参考图的基调和氛围--iw 1(默认):平衡参考与创作--iw 2 ~ 3:强参考,生成结果与参考图高度相似
支持的图片格式
格式 | 扩展名 |
PNG |
|
GIF |
|
WebP |
|
JPEG |
|
重要规则
# | 规则 | 说明 |
1 | 图片数量上限 | 一个提示词中最多嵌入 20 张图片 |
2 | 仅图片无文本的兼容性 | 仅使用图像而不含文本提示时,不与 |
3 | URL 可访问性 | 嵌入的图片 URL 必须为公开可访问的 HTTPS 链接 |
4 | 参数位置 | 所有 |
最佳实践
选择最接近设想的参考图:先选择与您最终设想最接近的图片作为基础参考,再用文字描述补充细节和调整方向。
权重调优策略:需要强参考效果时提高
--iw(如 2-3),需要更多创作自由度时降低(如 0.3-0.5)。多图组合:使用多图时,每张图应承担不同的引导角色(如一张提供构图、一张提供色彩),避免使用高度相似的多张图片。
文本与图片互补:文本描述应用于文字说明参考图中无法传达的信息(如具体物体名称、场景细节),而非重复图片已有的内容。
测试不同权重:同一组参考图和文本,尝试
--iw 0.5、--iw 1、--iw 2三个值,观察效果差异后选择最合适的。
与其他图片引导方式的区别
悠船 API 提供多种图片引导方式,各自用途不同:
引导方式 | 参数 | 用途 | 详情 |
图片提示词 | URL 嵌入 text 字段 | 参考构图、色彩、主体等整体灵感 | 本文档 |
角色参考 |
| 在多张图中保持同一角色的外观一致性(面部、发型、服装) | 各模型指南 |
风格参考 |
| 捕捉已有图像的视觉氛围并应用到新创作中 | 各模型指南 |
万物引用 |
| 将参考图中的角色/物体精确放入新场景中 | 各模型指南 |
图片提示词是最基础的图生图方式,适用于大多数需要参考图像的场景。如需更精细的角色或风格控制,请参考各模型指南中的高级引导方式。