模型调用(按量付费)

更新时间:
复制为 MD 格式

按量付费是一种先使用后付费的计费方式,根据您工作空间实际的 AI 中心内置模型 Token 用量进行结算。

说明

AI 中心已于 2026 年 4 月 27 日全面开启商业化收费,详情请参见EMR Serverless Spark AI中心商业化公告

按量付费说明

特性

说明

计费规则

按照工作空间一个周期内(1 小时)内置模型服务的 Token 用量计费,不同内置模型的计费规则不同:

  • qwen3.6-plus:按输入 Token 和输出 Token 计费,思考模式和非思考模式同价。

  • qwen3.5-plus:按输入 Token 和输出 Token 计费,思考模式和非思考模式同价。

  • qwen-plus:按输入 Token 和输出 Token 计费,分非思考模式和思考模式。

  • text-embedding-v4:按输入 Token 计费,输出不计费。

  • tongyi-embedding-vision-plus:按输入 Token 计费,输出不计费,支持图片、视频和文本输入。

模型调用费用为:模型输入 Token 用量 × 模型输入单价 + 模型输出 Token 用量 × 模型输出单价

例如,在杭州地域调用 ai_query() 10,000 次,每次调用输入 Token 260、输出 Token 50(非思考模式)。对应的费用为:0.96 × 260 × 10000 ÷ 1000000 + 2.4 × 50 × 10000 ÷ 1000000 = 3.696 元

说明

Token 用量预估可参考模型调用

计费周期

按照每小时整点计算一次费用(以 UTC+8 时间为准),计算完毕后进入新的计费周期。在每个计费周期结束后,系统会生成账单,并从您账户中扣除相应费用。账单流水数据相对于实际费用消耗可能会有延迟,详情请参见了解阿里云账单

地域单价

qwen3.6-plus

说明

qwen3.6-plus 的思考模式和非思考模式同价。

地域名称

单次请求的输入 Token 范围

输入单价(元/百万Tokens)

输出单价(元/百万Tokens)

  • 华北2(北京)

  • 华东2(上海)

  • 华东1(杭州)

  • 华南1(深圳)

  • 华北3(张家口)

  • 华北6(乌兰察布)

  • 西南1(成都)

0 < Token ≤ 128K

2.4

14.4

128K < Token ≤ 256K

9.6

57.6

  • 中国香港

  • 新加坡

  • 德国(法兰克福)

  • 美国(弗吉尼亚)

  • 美国(硅谷)

  • 日本(东京)

  • 印度尼西亚(雅加达)

0 < Token ≤ 256K

4.497

26.979

256K < Token ≤ 1M

17.986

53.958

qwen3.5-plus

说明

qwen3.5-plus 的思考模式和非思考模式同价。

地域名称

单次请求的输入 Token 范围

输入单价(元/百万Tokens)

输出单价(元/百万Tokens)

  • 华北2(北京)

  • 华东2(上海)

  • 华东1(杭州)

  • 华南1(深圳)

  • 华北3(张家口)

  • 华北6(乌兰察布)

  • 西南1(成都)

0 < Token ≤ 128K

0.96

5.76

128K < Token ≤ 256K

2.4

14.4

256K < Token ≤ 1M

4.8

28.8

  • 中国香港

  • 新加坡

  • 德国(法兰克福)

  • 美国(弗吉尼亚)

  • 美国(硅谷)

  • 日本(东京)

  • 印度尼西亚(雅加达)

0 < Token ≤ 256K

3.523

21.137

256K < Token ≤ 1M

4.404

26.422

qwen-plus

地域名称

模式

计费模式及单次请求的输入 Token 范围

输入单价(元/百万Tokens)

输出单价(元/百万Tokens)

  • 华北2(北京)

  • 华东2(上海)

  • 华东1(杭州)

  • 华南1(深圳)

  • 华北3(张家口)

  • 华北6(乌兰察布)

  • 西南1(成都)

非思考模式

0 < Token ≤ 128K

0.96

2.4

128K < Token ≤ 256K

2.88

24.0

256K < Token ≤ 1M

5.76

57.6

思考模式

0 < Token ≤ 128K

0.96

9.6

128K < Token ≤ 256K

2.88

28.8

256K < Token ≤ 1M

5.76

76.8

  • 中国香港

  • 新加坡

  • 德国(法兰克福)

  • 美国(弗吉尼亚)

  • 美国(硅谷)

  • 日本(东京)

  • 印度尼西亚(雅加达)

非思考模式

0 < Token ≤ 256K

3.523

10.568

256K < Token ≤ 1M

10.568

31.705

思考模式

0 < Token ≤ 256K

3.523

35.228

256K < Token ≤ 1M

10.568

105.685

text-embedding-v4

地域名称

输入单价(元/百万Tokens)

  • 华北2(北京)

  • 华东2(上海)

  • 华东1(杭州)

  • 华南1(深圳)

  • 华北3(张家口)

  • 华北6(乌兰察布)

  • 西南1(成都)

0.6

  • 中国香港

  • 新加坡

  • 德国(法兰克福)

  • 美国(弗吉尼亚)

  • 美国(硅谷)

  • 日本(东京)

  • 印度尼西亚(雅加达)

0.617

tongyi-embedding-vision-plus

地域名称

输入模态

输入单价(元/百万Tokens)

  • 华北2(北京)

  • 华东2(上海)

  • 华东1(杭州)

  • 华南1(深圳)

  • 华北3(张家口)

  • 华北6(乌兰察布)

  • 西南1(成都)

图片/视频/文本

0.6