除了按量付费外,您还可以购买预付费的节省计划或资源包来降低成本。两者的核心区别如下:
节省计划:金额抵扣,类似“购物卡”。购买一定面额的额度,用于抵扣模型的调用费用。
资源包:用量抵扣,类似“流量包”。购买指定数量的 Token(输入/输出),用于抵扣模型的用量。
当您的账户同时存在多种权益时,系统将按此顺序进行抵扣:新人免费额度 > 资源包 > 节省计划 > 按量付费。
节省计划
您预先支付一笔费用,用于抵扣超出免费额度后产生的实时推理费用。节省计划用完后自动转为账户余额扣费,支持叠加购买多个节省计划。
支持的节省计划
大语言模型
购买方式 | |
档位 | 阿里云百炼提供以下的购买档位:20元、100元、1,000元、5,000元、10,000元、20,000元、50,000元、100,000元、200,000元、300,000元、500,000元。 |
有效期 |
|
适用模型 | 阿里云百炼平台上,按 Token 计费的在架商业化模型(例如,通义千问、DeepSeek以及通义法睿等)。请前往模型列表查看所有按Token计费的模型及其调用价格。 |
通义万相模型
购买方式 | |
购买说明 | 阿里云百炼提供五个购买档位,分别为:
优惠示例:以 1,000元 档位为例,假设生成某个视频消费1元,实际将从节省计划中抵扣1*0.98=0.98元。 |
有效期 |
|
适用模型 | 图像生成:wan2.5-t2i-preview、wan2.5-i2i-preview、wan2.2-t2i-plus、wan2.2-t2i-flash、wanx2.0-t2i-turbo、wanx2.1-t2i-plus、wanx2.1-imageedit、wanx2.1-t2i-turbo、wanx-sketch-to-image-lite、wanx-v1 视频生成:wan2.5-t2v-preview、wan2.5-i2v-preview、wan2.2-t2v-plus、wan2.2-i2v-flash、wan2.2-t2v-flash、wan2.2-i2v-plus、wanx2.1-vace-plus、wanx2.1-kf2v-plus、wanx2.1-t2v-turbo、wanx2.1-t2v-plus、wanx2.1-i2v-turbo、wanx2.1-i2v-plus 请前往模型列表查看所有模型及其调用价格。 |
通义语音模型
购买方式 | |
购买说明 | 阿里云百炼提供五个购买档位,分别为:
优惠示例:以 1,000元 档位为例,假设消费1元,实际将从节省计划中抵扣1*0.85=0.85元。 ASR模型按秒计费,TTS模型按字符计费,请前往模型列表查看模型调用价格。 |
有效期 | 6个月。 |
适用模型 | 因地域而异:
请前往模型列表查看所有模型。 |
使用说明
生效时间:节省计划购买后立即生效,无需手动“激活”或“绑定”。
有效期说明:有效期根据购买套餐而定。超出有效期后,节省计划中剩余的金额,将无法使用,不支持退款。
抵扣逻辑:
抵扣顺序:新人免费额度 > 节省计划 > 按量付费。
多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。
查询账单:请参见如何查询节省计划账单。
资源包
您预先购买的是具体的 Token 数量,用于抵扣特定模型超出免费额度后产生的实时推理用量。
大语言模型推理资源包
订购地址 | |||
适用模型 | qwen-plus及qwen-plus-latest 的实时推理服务(非思考模式) | qwen-max及qwen-max-latest 的实时推理服务(非思考模式) | qwen-turbo及qwen-turbo-latest 的实时推理服务(非思考模式) |
包含输入和输出总Tokens | 1,200万/1.1亿 | 1,800万/3,900万/3.9亿/11.7亿/19.5亿 | 3,500万/3.5亿/17.5亿/35亿 |
价格(元) | 11.66/114.4 | 57.6/125/1250/3750/6250 | 11.45/114.45/572.25/1144.5 |
有效期 | 自购买日起生效,有效期可选 3 个月、6 个月或 1 年。 | 自购买之日起有效期为 1 年。 | 自购买之日起有效期为 1 年。 |
使用限制 | |||
使用说明
生效时间:资源包购买后立即生效,无需手动“激活”或“绑定”。
有效期说明:有效期根据购买套餐而定。超出有效期后,资源包中剩余的Tokens,自动作废。
抵扣逻辑:
抵扣顺序:新人免费额度 > 资源包 > 按量付费。
多个同类型的资源包:优先抵扣先到期的资源包。若到期时间相同,则优先抵扣先购买的资源包。
超出部分处理:如果同类资源包全部到期或额度全部抵扣完后,若仍有超出部分,自动转为按量付费。
余量监控与预警:
退订说明:
不支持自动退款。
根据退订规则,预付费商品未发生使用的部分,可按未使用额度费用申请退款;已使用的部分则无法退款。
常见问题
Q:资源包和节省计划如果同时存在,怎么扣费?
A:系统的抵扣优先级为:免费额度 > 资源包 > 节省计划 > 按量付费。
即:先用免费额度;用完后扣资源包;资源包不够或不适用时,扣节省计划;最后才使用账户余额。
Q:为什么购买了节省计划,但没有抵扣?
A:节省计划的抵扣需要满足特定条件,常见原因如下:
Q:为什么购买了资源包,但没有抵扣?
A:资源包的抵扣需要满足特定条件,常见原因如下:
模型不匹配:您调用的模型与购买的资源包不一致。例如,购买 qwen-max 资源包却调用了 qwen-plus模型。
使用了不支持的功能:资源包不支持抵扣这些功能产生的费用:批量推理(Batch)、上下文缓存、模型调优、模型部署。
Token 长度超限:对于 qwen-plus 资源包,单次请求输入超过 128K Token 的部分无法抵扣。
免费额度未用完:系统抵扣顺序为:免费额度 > 资源包。资源包仅抵扣免费额度用尽后产生的账单。
Q:如果先购买了资源包但未开通阿里云百炼服务,应该如何使用?
A:请先开通阿里云百炼的模型服务。服务开通后,优先会抵扣免费额度,待免费额度消耗完后,才会开始抵扣资源包。