08-图片提示词

更新时间:
复制为 MD 格式

图片提示词(垫图)

本文档详细介绍悠船 API 的图片提示词(Image Prompt / 垫图)功能。该功能允许开发者在图像生成任务中传入参考图片,悠船会分析参考图的核心元素(构图、色彩、主体等)作为灵感来源,生成全新图像。

功能概述

与大多数图像生成 API 将图片和文本通过独立字段分开传入不同,悠船 API 采用在 text 提示词字段中嵌入图片 URL 的方式来实现图片引导。这种方式简洁直观,允许在同一个提示词中灵活组合多张参考图和文本描述。

核心机制:

  • 在提示词的 text 字段中嵌入公开可访问的图片 URL

  • 悠船会自动识别 URL 并将其作为参考图像分析

  • 参考图用于提供构图、色彩、主体等视觉灵感

  • 文本描述用于补充细节和创作方向

支持的接口

接口

方法

路径

说明

图像生成

POST

/v1/tob/diffusion

文生图 / 图生图

说明:图片提示词(垫图)仅在图像生成接口中使用。其他编辑类接口(变化、重塑、延展等)使用的是上游生成的图像结果,不直接接受垫图输入。

使用方式

模式一:纯文本生图(无垫图)

不嵌入任何图片 URL,仅使用文本描述生成图像。

一只橘猫坐在窗台上,阳光照射,水彩画风格 --ar 16:9

模式二:单图 + 文本

以一张图片为参考,结合文字描述生成新图。

https://example.com/cat.jpg 一只橘猫坐在窗台上,阳光照射,水彩画风格

模式三:多图混合

不搭配文本,仅混合多张图片的风格与元素。

https://example.com/cat.jpg https://example.com/window.jpg

模式四:多图 + 文本

多张参考图配合文字做更精确的引导。

https://example.com/cat.jpg https://example.com/window.jpg 猫咪在窗台上晒太阳,温暖的光线

参数说明

图像权重(--iw

控制参考图对最终生成结果的影响程度。值越大,生成结果越接近参考图;值越小,创作自由度越高。

模型

取值范围

默认值

v6 / v6.1 / v7 / v8.1

0 - 3

1

niji 6 / niji 7

0 - 2

1

使用建议:

  • --iw 0.3 ~ 0.5:弱参考,仅保留参考图的基调和氛围

  • --iw 1(默认):平衡参考与创作

  • --iw 2 ~ 3:强参考,生成结果与参考图高度相似

支持的图片格式

格式

扩展名

PNG

.png

GIF

.gif

WebP

.webp

JPEG

.jpg.jpeg

重要规则

#

规则

说明

1

图片数量上限

一个提示词中最多嵌入 20 张图片

2

仅图片无文本的兼容性

仅使用图像而不含文本提示时,不与 --stylize--weird 参数兼容

3

URL 可访问性

嵌入的图片 URL 必须为公开可访问的 HTTPS 链接

4

参数位置

所有 -- 前缀的参数应放置在提示词末尾

最佳实践

  1. 选择最接近设想的参考图:先选择与您最终设想最接近的图片作为基础参考,再用文字描述补充细节和调整方向。

  2. 权重调优策略:需要强参考效果时提高 --iw(如 2-3),需要更多创作自由度时降低(如 0.3-0.5)。

  3. 多图组合:使用多图时,每张图应承担不同的引导角色(如一张提供构图、一张提供色彩),避免使用高度相似的多张图片。

  4. 文本与图片互补:文本描述应用于文字说明参考图中无法传达的信息(如具体物体名称、场景细节),而非重复图片已有的内容。

  5. 测试不同权重:同一组参考图和文本,尝试 --iw 0.5--iw 1--iw 2 三个值,观察效果差异后选择最合适的。

与其他图片引导方式的区别

悠船 API 提供多种图片引导方式,各自用途不同:

引导方式

参数

用途

详情

图片提示词

URL 嵌入 text 字段

参考构图、色彩、主体等整体灵感

本文档

角色参考

--cref

在多张图中保持同一角色的外观一致性(面部、发型、服装)

各模型指南

风格参考

--sref

捕捉已有图像的视觉氛围并应用到新创作中

各模型指南

万物引用

--oref

将参考图中的角色/物体精确放入新场景中

各模型指南

图片提示词是最基础的图生图方式,适用于大多数需要参考图像的场景。如需更精细的角色或风格控制,请参考各模型指南中的高级引导方式。