按量付费是一种先使用后付费的计费方式,根据您工作空间实际的 AI 中心内置模型 Token 用量进行结算。
AI 中心已于 2026 年 4 月 27 日全面开启商业化收费,详情请参见EMR Serverless Spark AI中心商业化公告。
按量付费说明
特性 | 说明 |
计费规则 | 按照工作空间一个周期内(1 小时)内置模型服务的 Token 用量计费,不同内置模型的计费规则不同:
模型调用费用为: 例如,在杭州地域调用 ai_query() 10,000 次,每次调用输入 Token 260、输出 Token 50(非思考模式)。对应的费用为: 说明 Token 用量预估可参考模型调用。 |
计费周期 | 按照每小时整点计算一次费用(以 UTC+8 时间为准),计算完毕后进入新的计费周期。在每个计费周期结束后,系统会生成账单,并从您账户中扣除相应费用。账单流水数据相对于实际费用消耗可能会有延迟,详情请参见了解阿里云账单。 |
地域单价
qwen3.6-plus
qwen3.6-plus 的思考模式和非思考模式同价。
地域名称 | 单次请求的输入 Token 范围 | 输入单价(元/百万Tokens) | 输出单价(元/百万Tokens) |
| 0 < Token ≤ 128K | 2.4 | 14.4 |
128K < Token ≤ 256K | 9.6 | 57.6 | |
| 0 < Token ≤ 256K | 4.497 | 26.979 |
256K < Token ≤ 1M | 17.986 | 53.958 |
qwen3.5-plus
qwen3.5-plus 的思考模式和非思考模式同价。
地域名称 | 单次请求的输入 Token 范围 | 输入单价(元/百万Tokens) | 输出单价(元/百万Tokens) |
| 0 < Token ≤ 128K | 0.96 | 5.76 |
128K < Token ≤ 256K | 2.4 | 14.4 | |
256K < Token ≤ 1M | 4.8 | 28.8 | |
| 0 < Token ≤ 256K | 3.523 | 21.137 |
256K < Token ≤ 1M | 4.404 | 26.422 |
qwen-plus
地域名称 | 模式 | 计费模式及单次请求的输入 Token 范围 | 输入单价(元/百万Tokens) | 输出单价(元/百万Tokens) |
| 非思考模式 | 0 < Token ≤ 128K | 0.96 | 2.4 |
128K < Token ≤ 256K | 2.88 | 24.0 | ||
256K < Token ≤ 1M | 5.76 | 57.6 | ||
思考模式 | 0 < Token ≤ 128K | 0.96 | 9.6 | |
128K < Token ≤ 256K | 2.88 | 28.8 | ||
256K < Token ≤ 1M | 5.76 | 76.8 | ||
| 非思考模式 | 0 < Token ≤ 256K | 3.523 | 10.568 |
256K < Token ≤ 1M | 10.568 | 31.705 | ||
思考模式 | 0 < Token ≤ 256K | 3.523 | 35.228 | |
256K < Token ≤ 1M | 10.568 | 105.685 |
text-embedding-v4
地域名称 | 输入单价(元/百万Tokens) |
| 0.6 |
| 0.617 |
tongyi-embedding-vision-plus
地域名称 | 输入模态 | 输入单价(元/百万Tokens) |
| 图片/视频/文本 | 0.6 |