| id | long | 否 | | 1 |
| body | object | 否 | | |
| billingType | string | 否 | | configurable |
| pricingConfig | any | 否 | 计费配置 JSON
-
Token 阶梯计费(token_tiered)
适用于 Chat 类模型。按输入 Token 数量分阶梯计价,支持常规模式、思考模式、缓存命中三种价格维度。JSON 格式:
json
{
"tiers": [
{
"min_tokens": 0,
"max_tokens": 32000,
"input_price": 2.5,
"output_price": 10,
"thinking_input_price": 2.5,
"thinking_output_price": 10,
"cached_input_price": 2.5
},
{
"min_tokens": 32000,
"max_tokens": 128000,
"input_price": 4,
"output_price": 16,
"thinking_input_price": 4,
"thinking_output_price": 16,
"cached_input_price": 4
}
]
}
字段说明:
字段 类型 必填 语义 单位
tiers array 是 阶梯定价数组,至少一个元素 -
tiers[].min_tokens integer 是 当前阶梯 Token 数量下限(含) Token
tiers[].max_tokens integer 是 当前阶梯 Token 数量上限(不含),0 表示不限 Token
tiers[].input_price number 是 常规模式输入 Token 单价 元 / 百万 Token
tiers[].output_price number 是 常规模式输出 Token 单价 元 / 百万 Token
tiers[].thinking_input_price number 否 思考模式输入 Token 单价 元 / 百万 Token
tiers[].thinking_output_price number 否 思考模式输出 Token 单价 元 / 百万 Token
tiers[].cached_input_price number 否 缓存命中时输入 Token 单价 元 / 百万 Token
thinking_mode_tiers array 否 思考模式专用阶梯,结构与 tiers 相同。当请求中存在 reasoning_tokens 且该字段非空时,优先使用此阶梯替代 tiers -
约束:
第一个阶梯的 min_tokens 必须为 0
非最后一个阶梯的 max_tokens 必须大于 min_tokens
相邻阶梯必须连续衔接(前一阶梯 max_tokens = 后一阶梯 min_tokens),不允许重叠或间隙
-
按图片计费(per_image)
适用于 ImageGeneration、ImageEdit 类模型。按生成/处理图片的张数计价。JSON 格式:
json
{
"price_per_image": 0.2
}
字段说明:
字段 类型 必填 语义 单位
price_per_image number 是 每张图片的计费单价 元 / 张
-
视频矩阵计费(video_matrix)
适用于 VideoGeneration、VideoImageGeneration 类模型。按视频分辨率和是否有音频两个维度组合定价。
注意: 前端交互时使用 matrix 字段,但调用 API 保存时需使用 tiers 字段(matrix 会在服务端自动转换)。以下给出的是 API 侧的标准格式。
JSON 格式:
json
{
"tiers": [
{
"resolution": 480,
"has_audio": 0,
"price_per_second": 0.24
},
{
"resolution": 480,
"has_audio": 1,
"price_per_second": 0.24
},
{
"resolution": 720,
"has_audio": 0,
"price_per_second": 0.24
},
{
"resolution": 720,
"has_audio": 1,
"price_per_second": 0.24
}
],
"default_price_per_second": 0.24
}
字段说明:
字段 类型 必填 语义 单位
tiers array 是 视频矩阵定价数组 -
tiers[].resolution integer 是 视频分辨率,取值:480、720、1080 像素高度(p)
tiers[].has_audio integer 是 是否包含音频,取值:0(无声)、1(有声) -
tiers[].price_per_second number 是 该组合下的每秒单价 元 / 秒
default_price_per_second number 否 未匹配到矩阵项时的默认每秒单价 元 / 秒
约束:
resolution 仅支持 480p、720p、1080p
resolution + has_audio 组合不可重复
-
按时长计费(per_duration)
适用于 ASR(语音识别)类模型。按音频时长计价。JSON 格式:
json
{
"price_per_unit": 0.00022
}
字段说明:
字段 类型 必填 语义 单位
price_per_unit number 是 音频每秒计费单价 元 / 秒
-
按字符计费(per_character)
适用于 TTS(语音合成)类模型。按合成文本的字符数计价。JSON 格式:
json
{
"price_per_unit": 0.8
}
字段说明:
字段 类型 必填 语义 单位
price_per_unit number 是 每万字符计费单价 元 / 万字符
-
Token 统一计费(token_flat)
适用于 Embedding、Rerank、MultimodalEmbedding、MultimodalRerank 类模型。不区分阶梯,按统一单价计费。JSON 格式:
json
{
"input_price": 0.5,
"multimodal_input_price": 0.5
}
字段说明:
字段 类型 必填 语义 单位
input_price number 是 纯文本输入 Token 单价 元 / 百万 Token
multimodal_input_price number 否 多模态输入 Token 单价 元 / 百万 Token
-
全模态多维度计费(omni_multimodal)
适用于 ChatFullmodal 类全模态模型(如 qwen3.5-omni-plus)。对文本、音频、图片、视频等不同模态的输入和输出分别定价。JSON 格式:
json
{
"text_input_price": 7,
"audio_input_price": 53,
"image_input_price": 7,
"video_input_price": 7,
"text_output_price": 40,
"audio_output_price": 213,
"multi_text_output_price": 0
}
字段说明:
字段 类型 必填 语义 单位
text_input_price number 是 文本输入 Token 单价 元 / 百万 Token
audio_input_price number 是 音频输入 Token 单价 元 / 百万 Token
image_input_price number 否 图片输入 Token 单价 元 / 百万 Token
video_input_price number 否 视频输入 Token 单价 元 / 百万 Token
text_output_price number 是 文本输出 Token 单价 元 / 百万 Token
audio_output_price number 否 音频输出 Token 单价 元 / 百万 Token
multi_text_output_price number 否 多模态输入后的文本输出 Token 单价(当输入包含图片/音频/视频时,文本输出的单独计价) 元 / 百万 Token
计费类型自动映射关系
模型类型(model_type) 自动识别的计费类型 pricingConfig 关键识别字段
Chat token_tiered 存在 tiers 字段
ChatFullmodal omni_multimodal 存在 text_input_price 或 audio_input_price
ImageGeneration / ImageEdit per_image 存在 price_per_image
VideoGeneration / VideoImageGeneration video_matrix 存在 tiers 且 tier 元素含 resolution
ASR per_duration 存在 price_per_unit(ASR 场景)
TTS per_character 存在 price_per_unit(TTS 场景)
Embedding / Rerank / MultimodalEmbedding / MultimodalRerank token_flat 存在 input_price
| {
"tiers": [
{
"min_tokens": 0,
"max_tokens": 32000,
"input_price": 2.5,
"output_price": 2.5,
"thinking_output_price": 10,
"cached_input_price": 1.25
},
{
"min_tokens": 32000,
"max_tokens": 0,
"input_price": 1.25,
"output_price": 1.25,
"thinking_output_price": 5,
"cached_input_price": 0.625
}
]
} |
| effectiveTime | string | 否 | | 2024-01-01T00:00:00Z |
| expireTime | string | 否 | | 2025-01-01T00:00:00Z |
| status | integer | 否 | | 1 |
| version | integer | 否 | | 1 |