节省计划与资源包

除了按量付费外,您还可以购买预付费节省计划资源包来降低成本。两者的核心区别如下:

  • 节省计划金额抵扣,类似“购物卡”。购买一定面额的额度,用于抵扣模型的调用费用。

  • 资源包用量抵扣,类似“流量包”。购买指定数量的 Token(输入/输出),用于抵扣模型的用量。

当您的账户同时存在多种权益时,系统将按此顺序进行抵扣:新人免费额度 > 资源包 > 节省计划 > 按量付费。

节省计划

您预先支付一笔费用,用于抵扣超出免费额度后产生的实时推理费用。节省计划用完后自动转为账户余额扣费,支持叠加购买多个节省计划。

支持的节省计划

大语言模型

购买方式

单击此处购买大语言模型推理节省计划

档位

阿里云百炼提供以下的购买档位:20元、100元、1,000元、5,000元、10,000元、20,000元、50,000元、100,000元、200,000元、300,000元、500,000元。

有效期

  • 对于20元、100元、1,000元三档,有效期可选 3 个月、6 个月或 1 年。

  • 对于5,000元、10,000元、20,000元、50,000元、100,000元、200,000元、300,000元、500,000元八档,有效期1年。

适用模型

阿里云百炼平台上,按 Token 计费的在架商业化模型(例如,通义千问、DeepSeek以及通义法睿等)。请前往模型列表查看所有按Token计费的模型及其调用价格。

通义万相模型

购买方式

单击此处购买通义万相模型节省计划

购买说明

阿里云百炼提供五个购买档位,分别为:

  • 20元:无折扣

  • 100元:无折扣

  • 1,000元:享9.8折优惠

  • 10,000元:享9.5折优惠

  • 30,000元:享9折优惠

优惠示例:以 1,000元 档位为例,假设生成某个视频消费1元,实际将从节省计划中抵扣1*0.98=0.98元。

有效期

  • 对于20元、100元两档,有效期3个月。

  • 对于1,000元、10,000元、30,000元三档,有效期6个月。

适用模型

图像生成:wan2.5-t2i-preview、wan2.5-i2i-preview、wan2.2-t2i-plus、wan2.2-t2i-flash、wanx2.0-t2i-turbo、wanx2.1-t2i-plus、wanx2.1-imageedit、wanx2.1-t2i-turbo、wanx-sketch-to-image-lite、wanx-v1

视频生成:wan2.5-t2v-preview、wan2.5-i2v-preview、wan2.2-t2v-plus、wan2.2-i2v-flash、wan2.2-t2v-flash、wan2.2-i2v-plus、wanx2.1-vace-plus、wanx2.1-kf2v-plus、wanx2.1-t2v-turbo、wanx2.1-t2v-plus、wanx2.1-i2v-turbo、wanx2.1-i2v-plus

请前往模型列表查看所有模型及其调用价格。

通义语音模型

购买方式

单击此处购买通义语音模型节省计划

购买说明

阿里云百炼提供五个购买档位,分别为:

  • 20元:享9.8折优惠

  • 100元:享9.6折优惠

  • 500元:享9折优惠

  • 1,000元:享8.5折优惠

  • 5,000元:享8折优惠

优惠示例:以 1,000元 档位为例,假设消费1元,实际将从节省计划中抵扣1*0.85=0.85元。

ASR模型按秒计费,TTS模型按字符计费,请前往模型列表查看模型调用价格。

有效期

6个月。

适用模型

因地域而异:

  • 北京:

    • 实时语音合成(CosyVoice):cosyvoice-v3-plus、cosyvoice-v3-flash、cosyvoice-v2、cosyvoice-v1

    • 实时语音合成(Qwen-TTS-Realtime):qwen3-tts-flash-realtime、qwen3-tts-flash-realtime-2025-09-18、qwen-tts-realtime、qwen-tts-realtime-latest、qwen-tts-realtime-2025-07-15

    • 语音合成(Qwen-TTS):qwen3-tts-flash、qwen3-tts-flash-2025-09-18、qwen-tts、qwen-tts-latest、qwen-tts-2025-05-22、qwen-tts-2025-04-10

    • 实时语音识别(Paraformer):paraformer-realtime-v2、paraformer-realtime-v1、paraformer-realtime-8k-v2、paraformer-realtime-8k-v1

    • 实时语音识别(Fun-ASR):fun-asr-realtime、fun-asr-realtime-2025-11-07、fun-asr-realtime-2025-09-15

    • 实时语音识别(Qwen-ASR-Realtime):qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27

    • 实时长语音识别/翻译(Gummy):gummy-realtime-v1

    • 实时短语音(一句话)识别/翻译(Gummy):gummy-chat-v1

    • 录音文件识别(Paraformer):paraformer-v2、paraformer-v1、paraformer-8k-v2、paraformer-8k-v1、paraformer-mtl-v1

    • 录音文件识别(Fun-ASR):fun-asr、fun-asr-2025-11-07、fun-asr-2025-08-25、fun-asr-mtl、fun-asr-mtl-2025-08-25

    • 录音文件识别(Qwen-ASR):qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08

    • 录音文件识别(SenseVoice):sensevoice-v1

  • 新加坡:

    • 实时语音合成(Qwen-TTS-Realtime):qwen3-tts-flash-realtime、qwen3-tts-flash-realtime-2025-09-18

    • 语音合成(Qwen-TTS):qwen3-tts-flash、qwen3-tts-flash-2025-09-18

    • 实时语音识别(Qwen-ASR-Realtime):qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27

    • 录音文件识别(Fun-ASR):fun-asr、fun-asr-2025-11-07、fun-asr-2025-08-25

    • 录音文件识别(Qwen-ASR):qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08

请前往模型列表查看所有模型。

使用说明

生效时间:节省计划购买后立即生效,无需手动“激活”或“绑定”。

有效期说明:有效期根据购买套餐而定。超出有效期后,节省计划中剩余的金额,将无法使用,不支持退款。

抵扣逻辑

  • 抵扣顺序:新人免费额度 > 节省计划 > 按量付费

  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。

  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。

查询账单:请参见如何查询节省计划账单

资源包

您预先购买的是具体的 Token 数量,用于抵扣特定模型超出免费额度后产生的实时推理用量。

大语言模型推理资源包

订购地址

大语言模型推理资源包qwen-plus

大语言模型推理资源包qwen-max

大语言模型推理资源包qwen-turbo

适用模型

qwen-plusqwen-plus-latest

的实时推理服务(非思考模式

qwen-maxqwen-max-latest

的实时推理服务(非思考模式

qwen-turboqwen-turbo-latest

的实时推理服务(非思考模式

包含输入和输出总Tokens

1,200万/1.1亿

1,800万/3,900万/3.9亿/11.7亿/19.5亿

3,500万/3.5亿/17.5亿/35亿

价格(元)

11.66/114.4

57.6/125/1250/3750/6250

11.45/114.45/572.25/1144.5

有效期

自购买日起生效,有效期可选 3 个月、6 个月或 1 年。

自购买之日起有效期为 1 年。

自购买之日起有效期为 1 年。

使用限制

使用说明

生效时间:资源包购买后立即生效,无需手动“激活”或“绑定”。

有效期说明:有效期根据购买套餐而定。超出有效期后,资源包中剩余的Tokens,自动作废。

抵扣逻辑

  • 抵扣顺序:新人免费额度 > 资源包 > 按量付费

  • 多个同类型的资源包:优先抵扣先到期的资源包。若到期时间相同,则优先抵扣先购买的资源包。

  • 超出部分处理:如果同类资源包全部到期或额度全部抵扣完后,若仍有超出部分,自动转为按量付费。

余量监控与预警:

  • 查看余量:点击资源包查看剩余量情况,点击统计查看使用信息。具体请参见资源包使用介绍

  • 设置预警:建议设置资源包余量预警。当资源包使用量低于预设阈值时,系统将通过短信、邮件及站内信自动触发通知。

退订说明

  • 不支持自动退款。

  • 根据退订规则,预付费商品未发生使用的部分,可按未使用额度费用申请退款;已使用的部分则无法退款。

常见问题

Q:资源包和节省计划如果同时存在,怎么扣费?

A:系统的抵扣优先级为:免费额度 > 资源包 > 节省计划 > 按量付费
即:先用免费额度;用完后扣资源包;资源包不够或不适用时,扣节省计划;最后才使用账户余额。

Q:为什么购买了节省计划,但没有抵扣?

A:节省计划的抵扣需要满足特定条件,常见原因如下:

  1. 模型不匹配:您调用的模型不在节省计划的适用范围内。例如:购买了“大语言模型节省计划”,却调用了“通义万相”模型。

  2. 使用了不支持的功能:节省计划不支持抵扣模型调优模型部署产生的费用。

    • 免费额度未用完:系统抵扣顺序为:免费额度 > 节省计划。节省计划仅抵扣免费额度用尽后产生的账单。

    Q:为什么购买了资源包,但没有抵扣?

    A:资源包的抵扣需要满足特定条件,常见原因如下:

    1. 模型不匹配:您调用的模型与购买的资源包不一致。例如,购买 qwen-max 资源包却调用了 qwen-plus模型。

    2. 使用了不支持的功能:资源包不支持抵扣这些功能产生的费用:批量推理(Batch)上下文缓存模型调优模型部署

    3. Token 长度超限:对于 qwen-plus 资源包,单次请求输入超过 128K Token 的部分无法抵扣。

    4. 免费额度未用完:系统抵扣顺序为:免费额度 > 资源包。资源包仅抵扣免费额度用尽后产生的账单。

    Q:如果先购买了资源包但未开通阿里云百炼服务,应该如何使用?

    A:请先开通阿里云百炼的模型服务。服务开通后,优先会抵扣免费额度,待免费额度消耗完后,才会开始抵扣资源包。