模型调用价格

更新时间: 2026-03-21 00:09:38

文本生成-千问

千问Max

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-max

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

2.5元

10元

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

4元

16元

128K<Token≤252K

7元

28元

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

2.5元

10元

32K<Token≤128K

4元

16元

128K<Token≤252K

7元

28元

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

6元

24元

32K<Token≤128K

10元

40元

128K<Token≤252K

15元

60元

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

6元

24元

32K<Token≤128K

10元

40元

128K<Token≤252K

15元

60元

更多模型

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

2.4元

9.6元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-max-latest

Batch调用半价

仅非思考模式

无阶梯计价

2.4元

9.6元

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

2.4元

9.6元

qwen-max-2024-09-19

仅非思考模式

无阶梯计价

20元

60元

qwen-max-2024-04-28

仅非思考模式

无阶梯计价

40元

120元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

仅非思考模式

0<Token≤32K

2.5元

10元

32K<Token≤128K

4元

16元

128K<Token≤252K

7元

28元

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

6元

24元

32K<Token≤128K

10元

40元

128K<Token≤252K

15元

60元

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

6元

24元

32K<Token≤128K

10元

40元

128K<Token≤252K

15元

60元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

8.807元

44.035元

32K<Token≤128K

17.614元

88.071元

128K<Token≤252K

22.018元

110.089元

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

8.807元

44.035元

32K<Token≤128K

17.614元

88.071元

128K<Token≤252K

22.018元

110.089元

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

8.807元

44.035元

32K<Token≤128K

17.614元

88.071元

128K<Token≤252K

22.018元

110.089元

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

8.807元

44.035元

32K<Token≤128K

17.614元

88.071元

128K<Token≤252K

22.018元

110.089元

更多模型

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

11.743元

46.971元

qwen-max-latest

仅非思考模式

无阶梯计价

11.743元

46.971元

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

11.743元

46.971元

金融云

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

38元

114元

100万Token

有效期:阿里云百炼开通后90天内

千问Plus

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3.5-plus

0<Token≤128K

0.8元

4.8元

4.8元

各100万Token

有效期:阿里云百炼开通后90天内

128K<Token≤256K

2元

12元

12元

256K<Token≤1M

4元

24元

24元

qwen3.5-plus-2026-02-15

0<Token≤128K

0.8元

4.8元

4.8元

128K<Token≤256K

2元

12元

12元

256K<Token≤1M

4元

24元

24元

qwen-plus

Batch调用半价

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-latest

Batch调用半价

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-12-01

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-09-11

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-07-28

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-07-14

无阶梯计价

0.8元

2元

8元

qwen-plus-2025-04-28

无阶梯计价

0.8元

2元

8元

更多模型

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus-2025-01-25

无阶梯计价

0.8元

2元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-plus-2025-01-12

无阶梯计价

0.8元

2元

qwen-plus-2024-12-20

无阶梯计价

0.8元

2元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3.5-plus

0<Token≤128K

0.8元

4.8元

4.8元

128K<Token≤256K

2元

12元

12元

256K<Token≤1M

4元

24元

24元

qwen3.5-plus-2026-02-15

0<Token≤128K

0.8元

4.8元

4.8元

128K<Token≤256K

2元

12元

12元

256K<Token≤1M

4元

24元

24元

qwen-plus

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-12-01

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-09-11

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

qwen-plus-2025-07-28

0<Token≤128K

0.8元

2元

8元

128K<Token≤256K

2.4元

20元

24元

256K<Token≤1M

4.8元

48元

64元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3.5-plus

0<Token≤256K

2.936元

17.614元

17.614元

256K<Token≤1M

3.67元

22.018元

22.018元

qwen3.5-plus-2026-02-15

0<Token≤256K

2.936元

17.614元

17.614元

256K<Token≤1M

3.67元

22.018元

22.018元

qwen-plus

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-latest

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-2025-12-01

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-2025-09-11

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-2025-07-28

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-2025-07-14

无阶梯计价

2.936元

8.807元

29.357元

qwen-plus-2025-04-28

无阶梯计价

2.936元

8.807元

29.357元

更多模型

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-plus-2025-01-25

无阶梯计价

2.936元

8.807元

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus-us

上下文缓存享有折扣

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

qwen-plus-2025-12-01-us

0<Token≤256K

2.936元

8.807元

29.357元

256K<Token≤1M

8.807元

26.421元

88.071元

金融云

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus

Batch调用半价

无阶梯计价

1.52元

3.8元

100万Token

有效期:阿里云百炼开通后90天内

千问Flash

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3.5-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤128K

0.2元

2元

各100万Token

有效期:阿里云百炼开通后90天内

128K<Token≤256K

0.8元

8元

256K<Token≤1M

1.2元

12元

qwen3.5-flash-2026-02-23

非思考和思考模式

0<Token≤128K

0.2元

2元

128K<Token≤256K

0.8元

8元

256K<Token≤1M

1.2元

12元

qwen-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤128K

0.15元

1.5元

128K<Token≤256K

0.6元

6元

256K<Token≤1M

1.2元

12元

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤128K

0.15元

1.5元

128K<Token≤256K

0.6元

6元

256K<Token≤1M

1.2元

12元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3.5-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤128K

0.2元

2元

128K<Token≤256K

0.8元

8元

256K<Token≤1M

1.2元

12元

qwen3.5-flash-2026-02-23

非思考和思考模式

0<Token≤128K

0.2元

2元

128K<Token≤256K

0.8元

8元

256K<Token≤1M

1.2元

12元

qwen-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤128K

0.15元

1.5元

128K<Token≤256K

0.6元

6元

256K<Token≤1M

1.2元

12元

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤128K

0.15元

1.5元

128K<Token≤256K

0.6元

6元

256K<Token≤1M

1.2元

12元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3.5-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤1M

0.734元

2.936元

qwen3.5-flash-2026-02-23

非思考和思考模式

0<Token≤1M

0.734元

2.936元

qwen-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤256K

0.367元

2.936元

256K<Token≤1M

1.835元

14.678元

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤256K

0.367元

2.936元

256K<Token≤1M

1.835元

14.678元

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-flash-us

上下文缓存享有折扣

0<Token≤256K

0.367元

2.936元

256K<Token≤1M

1.835元

14.678元

qwen-flash-2025-07-28-us

0<Token≤256K

0.367元

2.936元

256K<Token≤1M

1.835元

14.678元

千问Turbo

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen-turbo

Batch调用半价

非思考和思考模式

0.3元

0.6元

3元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-turbo-latest

Batch调用半价

非思考和思考模式

0.3元

0.6元

3元

qwen-turbo-2025-07-15

非思考和思考模式

0.3元

0.6元

3元

qwen-turbo-2025-04-28

非思考和思考模式

0.3元

0.6元

3元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

有效期:百炼开通后90天内

qwen-turbo-2025-02-11

0.3元

0.6元

100万Token

qwen-turbo-2024-11-01

0.3元

0.6元

1000万Token

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-turbo

Batch调用半价

非思考和思考

0.367元

1.468元

3.67元

qwen-turbo-latest

非思考和思考

0.367元

1.468元

3.67元

qwen-turbo-2025-04-28

非思考和思考

0.367元

1.468元

3.67元

更多模型

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-turbo-2024-11-01

0.367元

1.468元

QwQ

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-plus

Batch调用半价

仅思考模式

1.6元

4元

各100万Token

有效期:阿里云百炼开通后90天内

qwq-plus-latest

仅思考模式

1.6元

4元

qwq-plus-2025-03-05

仅思考模式

1.6元

4元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

qwq-plus

仅思考模式

5.871元

17.614元

千问Long

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-long

Batch调用半价

0.5元

2元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-long-latest

0.5元

2元

qwen-long-2025-01-25

0.5元

2元

千问Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

1.8元

15.8元

3.3元

6.9元

12.7元

62.6元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-2025-12-01

非思考和思考模式

1.8元

15.8元

3.3元

6.9元

12.7元

62.6元

qwen3-omni-flash-2025-09-15

非思考和思考模式

1.8元

15.8元

3.3元

6.9元

12.7元

62.6元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

0.4元

25元

1.5元

1.6元

4.5元

50元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-latest

0.4元

25元

1.5元

1.6元

4.5元

50元

qwen-omni-turbo-2025-03-26

0.4元

25元

1.5元

1.6元

4.5元

50元

qwen-omni-turbo-2025-01-19

0.4元

25元

1.5元

1.6元

4.5元

50元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

3.156元

27.962元

5.725元

12.183元

22.458元

110.896元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-2025-12-01

非思考和思考模式

3.156元

27.962元

5.725元

12.183元

22.458元

110.896元

qwen3-omni-flash-2025-09-15

非思考和思考模式

3.156元

27.962元

5.725元

12.183元

22.458元

110.896元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

0.514元

32.586元

1.541元

1.982元

4.624元

65.246元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-latest

0.514元

32.586元

1.541元

1.982元

4.624元

65.246元

qwen-omni-turbo-2025-03-26

0.514元

32.586元

1.541元

1.982元

4.624元

65.246元

千问Omni-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

非思考和思考模式

2.2元

18.9元

3.9元

8.3元

15.2元

75.1元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

非思考和思考模式

2.2元

18.9元

3.9元

8.3元

15.2元

75.1元

qwen3-omni-flash-realtime-2025-09-15

非思考和思考模式

2.2元

18.9元

3.9元

8.3元

15.2元

75.1元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo-realtime

1.6元

25元

6元

6.4元

18元

50元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-realtime-latest

1.6元

25元

6元

6.4元

18元

50元

qwen-omni-turbo-realtime-2025-05-08

1.6元

25元

6元

6.4元

18元

50元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

非思考和思考模式

3.816元

33.54元

6.899元

14.605元

26.935元

133.06元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

非思考和思考模式

3.816元

33.54元

6.899元

14.605元

26.935元

133.06元

qwen3-omni-flash-realtime-2025-09-15

非思考和思考模式

3.816元

33.54元

6.899元

14.605元

26.935元

133.06元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo-realtime

1.982元

32.586元

6.165元

7.853元

18.495元

65.246元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-realtime-latest

1.982元

32.586元

6.165元

7.853元

18.495元

65.246元

qwen-omni-turbo-realtime-2025-05-08

1.982元

32.586元

6.165元

7.853元

18.495元

65.246元

QVQ

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qvq-max

8元

32元

各100万Token

有效期:阿里云百炼开通后90天内

qvq-max-latest

8元

32元

qvq-max-2025-05-15

8元

32元

qvq-max-2025-03-25

8元

32元

qvq-plus

2元

5元

qvq-plus-latest

2元

5元

qvq-plus-2025-05-15

2元

5元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qvq-max

8.807元

35.228元

qvq-max-latest

8.807元

35.228元

qvq-max-2025-03-25

8.807元

35.228元

千问VL

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-plus

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1元

10元

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

1.5元

15元

128K<Token≤256K

3元

30元

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

1元

10元

32K<Token≤128K

1.5元

15元

128K<Token≤256K

3元

30元

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1元

10元

32K<Token≤128K

1.5元

15元

128K<Token≤256K

3元

30元

qwen3-vl-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.15元

1.5元

32K<Token≤128K

0.3元

3元

128K<Token≤256K

0.6元

6元

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

0.15元

1.5元

32K<Token≤128K

0.3元

3元

128K<Token≤256K

0.6元

6元

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.15元

1.5元

32K<Token≤128K

0.3元

3元

128K<Token≤256K

0.6元

6元

更多模型

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-vl-max

Batch调用半价
上下文缓存享有折扣

无阶梯计价

1.6元

4元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-vl-max-latest

Batch调用半价

无阶梯计价

1.6元

4元

qwen-vl-max-2025-08-13

无阶梯计价

1.6元

4元

qwen-vl-max-2025-04-08

无阶梯计价

3元

9元

qwen-vl-max-2025-04-02

无阶梯计价

3元

9元

qwen-vl-max-2025-01-25

无阶梯计价

3元

9元

qwen-vl-max-2024-12-30

无阶梯计价

3元

9元

qwen-vl-max-2024-11-19

无阶梯计价

3元

9元

qwen-vl-plus

Batch调用半价
上下文缓存享有折扣

无阶梯计价

0.8元

2元

qwen-vl-plus-latest

Batch调用半价

无阶梯计价

0.8元

2元

qwen-vl-plus-2025-08-15

无阶梯计价

0.8元

2元

qwen-vl-plus-2025-07-10

无阶梯计价

0.15元

1.5元

qwen-vl-plus-2025-05-07

无阶梯计价

1.5元

4.5元

qwen-vl-plus-2025-01-25

无阶梯计价

1.5元

4.5元

qwen-vl-plus-2025-01-02

无阶梯计价

1.5元

4.5元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1元

10元

32K<Token≤128K

1.5元

15元

128K<Token≤256K

3元

30元

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1元

10元

32K<Token≤128K

1.5元

15元

128K<Token≤256K

3元

30元

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.15元

1.5元

32K<Token≤128K

0.3元

3元

128K<Token≤256K

0.6元

6元

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.15元

1.5元

32K<Token≤128K

0.3元

3元

128K<Token≤256K

0.6元

6元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1.468元

11.743元

32K<Token≤128K

2.202元

17.614元

128K<Token≤256K

4.404元

35.228元

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

1.468元

11.743元

32K<Token≤128K

2.202元

17.614元

128K<Token≤256K

4.404元

35.228元

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1.468元

11.743元

32K<Token≤128K

2.202元

17.614元

128K<Token≤256K

4.404元

35.228元

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.367元

2.936元

32K<Token≤128K

0.55元

4.404元

128K<Token≤256K

0.881元

7.046元

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

0.367元

2.936元

32K<Token≤128K

0.55元

4.404元

128K<Token≤256K

0.881元

7.046元

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.367元

2.936元

32K<Token≤128K

0.55元

4.404元

128K<Token≤256K

0.881元

7.046元

更多模型

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-vl-max

上下文缓存享有折扣

无阶梯计价

5.871元

23.486元

qwen-vl-max-latest

无阶梯计价

5.871元

23.486元

qwen-vl-max-2025-08-13

无阶梯计价

5.871元

23.486元

qwen-vl-max-2025-04-08

无阶梯计价

5.871元

23.486元

qwen-vl-plus

上下文缓存享有折扣

无阶梯计价

1.541元

4.624元

qwen-vl-plus-latest

无阶梯计价

1.541元

4.624元

qwen-vl-plus-2025-08-15

无阶梯计价

1.541元

4.624元

qwen-vl-plus-2025-05-07

无阶梯计价

1.541元

4.624元

qwen-vl-plus-2025-01-25

无阶梯计价

1.541元

4.624元

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-flash-us

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.367元

2.936元

32K<Token≤128K

0.55元

4.404元

128K<Token≤256K

0.881元

7.046元

qwen3-vl-flash-2025-10-15-us

非思考和思考模式

0<Token≤32K

0.367元

2.936元

32K<Token≤128K

0.55元

4.404元

128K<Token≤256K

0.881元

7.046元

千问OCR

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-vl-ocr

Batch调用半价

0.3元

0.5元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-vl-ocr-latest

Batch调用半价

0.3元

0.5元

qwen-vl-ocr-2025-11-20

0.3元

0.5元

qwen-vl-ocr-2025-08-28

5元

5元

qwen-vl-ocr-2025-04-13

5元

5元

qwen-vl-ocr-2024-10-28

5元

5元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-ocr

0.3元

0.5元

qwen-vl-ocr-2025-11-20

0.3元

0.5元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-ocr

0.514元

1.174元

qwen-vl-ocr-2025-11-20

0.514元

1.174元

千问Audio

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

计费规则:按输入和输出的总Token数进行计费。

音频Token计算规则:每一秒钟的音频对应25个Token。若音频时长不足1秒,则按25个Token计算。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-audio-turbo

目前仅供免费体验。

免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型

各10万Token

有效期:阿里云百炼开通后90天内

qwen-audio-turbo-latest

千问数学模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-math-plus

4元

12元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-math-turbo

2元

6元

千问Coder

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-coder-plus

上下文缓存享有折扣

0<Token≤32K

4元

16元

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-plus-2025-09-23

0<Token≤32K

4元

16元

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-plus-2025-07-22

0<Token≤32K

4元

16元

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-flash

0<Token≤32K

1元

4元

32K<Token≤128K

1.5元

6元

128K<Token≤256K

2.5元

10元

256K<Token≤1M

5元

25元

qwen3-coder-flash-2025-07-28

0<Token≤32K

1元

4元

32K<Token≤128K

1.5元

6元

128K<Token≤256K

2.5元

10元

256K<Token≤1M

5元

25元

更多模型

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-coder-plus

无阶梯计价

3.5元

7元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-coder-plus-latest

无阶梯计价

3.5元

7元

qwen-coder-plus-2024-11-06

无阶梯计价

3.5元

7元

qwen-coder-turbo

无阶梯计价

2元

6元

qwen-coder-turbo-latest

无阶梯计价

2元

6元

qwen-coder-turbo-2024-09-19

无阶梯计价

2元

6元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-coder-plus

0<Token≤32K

4元

16元

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-plus-2025-09-23

0<Token≤32K

4元

16元

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-plus-2025-07-22

0<Token≤32K

4元

16元

32K<Token≤128K

6元

24元

128K<Token≤256K

10元

40元

256K<Token≤1M

20元

200元

qwen3-coder-flash

0<Token≤32K

1元

4元

32K<Token≤128K

1.5元

6元

128K<Token≤256K

2.5元

10元

256K<Token≤1M

5元

25元

qwen3-coder-flash-2025-07-28

0<Token≤32K

1元

4元

32K<Token≤128K

1.5元

6元

128K<Token≤256K

2.5元

10元

256K<Token≤1M

5元

25元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-coder-plus

0<Token≤32K

7.339元

36.696元

32K<Token≤128K

13.211元

66.053元

128K<Token≤256K

22.018元

110.089元

256K<Token≤1M

44.035元

440.354元

qwen3-coder-plus-2025-09-23

0<Token≤32K

7.339元

36.696元

32K<Token≤128K

13.211元

66.053元

128K<Token≤256K

22.018元

110.089元

256K<Token≤1M

44.035元

440.354元

qwen3-coder-plus-2025-07-22

0<Token≤32K

7.339元

36.696元

32K<Token≤128K

13.211元

66.053元

128K<Token≤256K

22.018元

110.089元

256K<Token≤1M

44.035元

440.354元

qwen3-coder-flash

0<Token≤32K

2.202元

11.009元

32K<Token≤128K

3.67元

18.348元

128K<Token≤256K

5.871元

29.357元

256K<Token≤1M

11.743元

70.457元

qwen3-coder-flash-2025-07-28

0<Token≤32K

2.202元

11.009元

32K<Token≤128K

3.67元

18.348元

128K<Token≤256K

5.871元

29.357元

256K<Token≤1M

11.743元

70.457元

千问翻译模型

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-mt-plus

1.8元

5.4元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-mt-flash

0.7元

1.95元

qwen-mt-lite

0.6元

1.6元

qwen-mt-turbo

0.7元

1.95元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-mt-plus

1.8元

5.4元

qwen-mt-flash

0.7元

1.95元

qwen-mt-lite

0.6元

1.6元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-mt-plus

18.055元

54.09元

qwen-mt-flash

1.174元

3.596元

qwen-mt-lite

0.881元

2.642元

qwen-mt-turbo

1.174元

3.596元

千问数据挖掘模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-doc-turbo

0.6元

1元

无免费额度

千问深入研究模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-deep-research

54元

163元

无免费额度

通义晓蜜对话分析模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

tongyi-xiaomi-analysis-flash

0.2元

0.4元

各100万Token

有效期:百炼开通后90天内

tongyi-xiaomi-analysis-pro

1.0元

2.7元

文本生成-千问-开源版

Qwen3.5

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3.5-397b-a17b

0<Token≤128K

1.2元

7.2元

7.2元

各100万Token

有效期:阿里云百炼开通后90天内

128K<Token≤256K

3元

18元

18元

qwen3.5-122b-a10b

0<Token≤128K

0.8元

6.4元

6.4元

128K<Token≤256K

2元

16元

16元

qwen3.5-27b

0<Token≤128K

0.6元

4.8元

4.8元

128K<Token≤256K

1.8元

14.4元

14.4元

qwen3.5-35b-a3b

0<Token≤128K

0.4元

3.2元

3.2元

128K<Token≤256K

1.6元

12.8元

12.8元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3.5-397b-a17b

0<Token≤128K

1.2元

7.2元

7.2元

128K<Token≤256K

3元

18元

18元

qwen3.5-122b-a10b

0<Token≤128K

0.8元

6.4元

6.4元

128K<Token≤256K

2元

16元

16元

qwen3.5-27b

0<Token≤128K

0.6元

4.8元

4.8元

128K<Token≤256K

1.8元

14.4元

14.4元

qwen3.5-35b-a3b

0<Token≤128K

0.4元

3.2元

3.2元

128K<Token≤256K

1.6元

12.8元

12.8元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3.5-397b-a17b

0<Token≤256K

4.404元

26.421元

26.421元

qwen3.5-122b-a10b

0<Token≤256K

2.936元

23.486元

23.486元

qwen3.5-27b

0<Token≤256K

2.202元

17.614元

17.614元

qwen3.5-35b-a3b

0<Token≤256K

1.835元

14.678元

14.678元

Qwen3

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1元

-

10元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-next-80b-a3b-instruct

仅非思考模式

1元

4元

-

qwen3-235b-a22b-thinking-2507

仅思考模式

2元

-

20元

qwen3-235b-a22b-instruct-2507

仅非思考模式

2元

8元

-

qwen3-30b-a3b-thinking-2507

仅思考模式

0.75元

-

7.5元

qwen3-30b-a3b-instruct-2507

仅非思考模式

0.75元

3元

-

qwen3-235b-a22b

非思考和思考模式

2元

8元

20元

qwen3-32b

非思考和思考模式

2元

8元

20元

qwen3-30b-a3b

非思考和思考模式

0.75元

3元

7.5元

qwen3-14b

非思考和思考模式

1元

4元

10元

qwen3-8b

非思考和思考模式

0.5元

2元

5元

qwen3-4b

非思考和思考模式

0.3元

1.2元

3元

qwen3-1.7b

非思考和思考模式

0.3元

1.2元

3元

qwen3-0.6b

非思考和思考模式

0.3元

1.2元

3元

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1元

-

10元

无免费额度

qwen3-next-80b-a3b-instruct

仅非思考模式

1元

4元

-

qwen3-235b-a22b-thinking-2507

仅思考模式

1.688元

-

16.88元

qwen3-235b-a22b-instruct-2507

仅非思考模式

1.688元

6.752元

-

qwen3-30b-a3b-thinking-2507

仅思考模式

0.75元

-

7.5元

qwen3-30b-a3b-instruct-2507

仅非思考模式

0.75元

3元

-

qwen3-235b-a22b

非思考和思考模式

2元

8元

20元

qwen3-32b

非思考和思考模式

1.174元

4.697元

4.697元

qwen3-30b-a3b

非思考和思考模式

0.75元

3元

7.5元

qwen3-14b

非思考和思考模式

1元

4元

10元

qwen3-8b

非思考和思考模式

0.5元

2元

5元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1.101元

-

8.807元

无免费额度

qwen3-next-80b-a3b-instruct

仅非思考模式

1.101元

8.807元

-

qwen3-235b-a22b-thinking-2507

仅思考模式

1.688元

-

16.88元

qwen3-235b-a22b-instruct-2507

仅非思考模式

1.688元

6.752元

-

qwen3-30b-a3b-thinking-2507

仅思考模式

1.468元

-

17.614元

qwen3-30b-a3b-instruct-2507

仅非思考模式

1.468元

5.871元

-

qwen3-235b-a22b

非思考和思考模式

5.137元

20.55元

61.65元

qwen3-32b

非思考和思考模式

1.174元

4.697元

4.697元

qwen3-30b-a3b

非思考和思考模式

1.468元

5.871元

17.614元

qwen3-14b

非思考和思考模式

2.569元

10.275元

30.825元

qwen3-8b

非思考和思考模式

1.321元

5.137元

15.412元

qwen3-4b

非思考和思考模式

0.807元

3.082元

9.247元

qwen3-1.7b

非思考和思考模式

0.807元

3.082元

9.247元

qwen3-0.6b

非思考和思考模式

0.807元

3.082元

9.247元

QwQ-开源版

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b

2元

6元

100万Token

有效期:阿里云百炼开通后90天内

QwQ-Preview

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b-preview

Batch调用半价

2元

6元

各100万Token

有效期:阿里云百炼开通后90天内

Qwen2.5

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-14b-instruct-1m

1元

3元

各100万Token

有效期:阿里云百炼开通后90天内

qwen2.5-7b-instruct-1m

0.5元

1元

qwen2.5-72b-instruct

4元

12元

qwen2.5-32b-instruct

2元

6元

qwen2.5-14b-instruct

1元

3元

qwen2.5-7b-instruct

0.5元

1元

qwen2.5-3b-instruct

0.3元

0.9元

qwen2.5-1.5b-instruct

目前仅供免费体验

免费额度用完后不可调用,推荐使用Qwen3DeepSeek-阿里云Kimi-阿里云作为替代模型

qwen2.5-0.5b-instruct

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen2.5-14b-instruct-1m

5.908元

23.632元

qwen2.5-7b-instruct-1m

2.701元

10.789元

qwen2.5-72b-instruct

10.275元

41.1元

qwen2.5-32b-instruct

5.137元

20.55元

qwen2.5-14b-instruct

2.569元

10.275元

qwen2.5-7b-instruct

1.284元

5.137元

Qwen2

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2-72b-instruct

4元

12元

各100万Token

有效期:阿里云百炼开通后90天内

qwen2-57b-a14b-instruct

3.5元

7元

qwen2-7b-instruct

1元

2元

qwen2-1.5b-instruct

限时免费

qwen2-0.5b-instruct

Qwen1.5

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen1.5-110b-chat

7元

14元

各100万Token

有效期:阿里云百炼开通后90天内

qwen1.5-72b-chat

5元

10元

qwen1.5-32b-chat

3.5元

7元

qwen1.5-14b-chat

2元

4元

qwen1.5-7b-chat

1元

2元

qwen1.5-1.8b-chat

限时免费

qwen1.5-0.5b-chat

QVQ

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qvq-72b-preview

12元

36元

10万Token

有效期:阿里云百炼开通后90天内

Qwen-Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

0.6元

38元

2元

2.4元

6元

76元

100万Token(不区分模态)

有效期:阿里云百炼开通后90天

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

0.734元

49.613元

2.055元

2.936元

6.165元

99.153元

Qwen3-Omni-Captioner

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-omni-30b-a3b-captioner

15.8元

12.7元

100万Token

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-omni-30b-a3b-captioner

27.962元

22.458元

Qwen-VL

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-235b-a22b-thinking

仅思考模式

2元

20元

各100万 Token

有效期:阿里云百炼开通后90天内

qwen3-vl-235b-a22b-instruct

仅非思考模式

2元

8元

qwen3-vl-32b-thinking

仅思考模式

2元

20元

qwen3-vl-32b-instruct

仅非思考模式

2元

8元

qwen3-vl-30b-a3b-thinking

仅思考模式

0.75元

7.5元

qwen3-vl-30b-a3b-instruct

仅非思考模式

0.75元

3元

qwen3-vl-8b-thinking

仅思考模式

0.5元

5元

qwen3-vl-8b-instruct

仅非思考模式

0.5元

2元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-vl-72b-instruct

16元

48元

各100万 Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-32b-instruct

8元

24元

qwen2.5-vl-7b-instruct

2元

5元

qwen2.5-vl-3b-instruct

1.2元

3.6元

qwen2-vl-72b-instruct

16元

48元

qwen2-vl-7b-instruct

目前仅供免费体验。

免费额度用完后不可调用,建议改用qwen-vl-max、qwen-vl-plus模型。

各10万Token

有效期:阿里云百炼开通后90天内

qwen2-vl-2b-instruct

限时免费

qwen-vl-v1

目前仅供免费体验。

免费额度用完后不可调用,建议改用qwen-vl-max、qwen-vl-plus模型。

qwen-vl-chat-v1

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

2元

20元

qwen3-vl-235b-a22b-instruct

仅非思考模式

2元

8元

qwen3-vl-32b-thinking

仅思考模式

1.174元

4.697元

qwen3-vl-32b-instruct

仅非思考模式

1.174元

4.697元

qwen3-vl-30b-a3b-thinking

仅思考模式

0.75元

7.5元

qwen3-vl-30b-a3b-instruct

仅非思考模式

0.75元

3元

qwen3-vl-8b-thinking

仅思考模式

0.5元

5元

qwen3-vl-8b-instruct

仅非思考模式

0.5元

2元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

2.936元

29.357元

qwen3-vl-235b-a22b-instruct

仅非思考模式

2.936元

11.743元

qwen3-vl-32b-thinking

仅思考模式

1.174元

4.697元

qwen3-vl-32b-instruct

仅非思考模式

1.174元

4.697元

qwen3-vl-30b-a3b-thinking

仅思考模式

1.468元

17.614元

qwen3-vl-30b-a3b-instruct

仅非思考模式

1.468元

5.871元

qwen3-vl-8b-thinking

仅思考模式

1.321元

15.412元

qwen3-vl-8b-instruct

仅非思考模式

1.321元

5.137元

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-vl-72b-instruct

20.55元

61.65元

各100万 Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-32b-instruct

10.275元

30.825元

qwen2.5-vl-7b-instruct

2.569元

7.706元

qwen2.5-vl-3b-instruct

1.541元

4.624元

Qwen-Audio

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2-audio-instruct

目前仅供免费体验。

免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型。

各10万Token

有效期:阿里云百炼开通后90天内

qwen-audio-chat

Qwen-Math

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-math-72b-instruct

4元

12元

各100万Token

有效期:阿里云百炼开通后90天内

qwen2.5-math-7b-instruct

1元

2元

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-coder-next

0<Token≤32K

1元

4元

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

1.5元

6元

128K<Token≤256K

2.5元

10元

qwen3-coder-480b-a35b-instruct

0<Token≤32K

6元

24元

32K<Token≤128K

9元

36元

128K<Token≤200K

15元

60元

qwen3-coder-30b-a3b-instruct

0<Token≤32K

1.5元

6元

32K<Token≤128K

2.25元

9元

128K<Token≤200K

3.75元

15元

qwen2.5-coder-32b-instruct

无阶梯计价

2元

6元

qwen2.5-coder-14b-instruct

无阶梯计价

2元

6元

qwen2.5-coder-7b-instruct

无阶梯计价

1元

2元

qwen2.5-coder-3b-instruct

无阶梯计价

限时免费

qwen2.5-coder-1.5b-instruct

无阶梯计价

qwen2.5-coder-0.5b-instruct

无阶梯计价

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

6元

24元

32K<Token≤128K

9元

36元

128K<Token≤200K

15元

60元

qwen3-coder-30b-a3b-instruct

0<Token≤32K

1.5元

6元

32K<Token≤128K

2.25元

9元

128K<Token≤200K

3.75元

15元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-next

0<Token≤32K

2.202元

11.009元

32K<Token≤128K

3.67元

18.348元

128K<Token≤256K

5.871元

29.357元

qwen3-coder-480b-a35b-instruct

0<Token≤32K

11.009元

55.044元

32K<Token≤128K

19.816元

99.08元

128K<Token≤200K

33.027元

165.133元

qwen3-coder-30b-a3b-instruct

0<Token≤32K

3.303元

16.513元

32K<Token≤128K

5.504元

27.522元

128K<Token≤200K

8.807元

44.035元

文本生成-第三方模型

DeepSeek

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

deepseek-v3.2

上下文缓存享有折扣

2元

3元

各100万Token

有效期:阿里云百炼开通后90天内

deepseek-v3.2-exp

2元

3元

deepseek-v3.1

4元

12元

deepseek-r1

Batch调用半价

4元

16元

deepseek-r1-0528

4元

16元

deepseek-v3

Batch调用半价

2元

8元

deepseek-r1-distill-qwen-1.5b

限时免费

deepseek-r1-distill-qwen-7b

0.5元

1元

各100万Token

有效期:阿里云百炼开通后90天内

deepseek-r1-distill-qwen-14b

1元

3元

deepseek-r1-distill-qwen-32b

2元

6元

deepseek-r1-distill-llama-8b

限时免费

deepseek-r1-distill-llama-70b

目前仅供免费体验

免费额度用完后不可调用,推荐使用深度思考DeepSeek-阿里云Kimi-阿里云作为替代模型

各100万Token

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

deepseek-v3.2

上下文缓存享有折扣

4.272元

12.815元

DeepSeek-硅基流动

说明

仅支持中国内地部署模式。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度

siliconflow/deepseek-v3.2

2元

3元

siliconflow/deepseek-v3.1-terminus

4元

12元

siliconflow/deepseek-r1-0528

4元

16元

siliconflow/deepseek-v3-0324

2元

8元

Kimi

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

kimi-k2.5

4元

21元

各100万Token

有效期:阿里云百炼开通后90天内

kimi-k2-thinking

4元

16元

Moonshot-Kimi-K2-Instruct

4元

16元

Kimi-月之暗面

说明

仅支持中国内地部署模式。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

kimi/kimi-k2.5

4元

21元

GLM

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

glm-5

非思考和思考模式

0<Token≤32K

4元

18元

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤198K

6元

22元

glm-4.7

非思考和思考模式

0<Token≤32K

3元

14元

32K<Token≤166K

4元

16元

glm-4.6

非思考和思考模式

0<Token≤32K

3元

14元

32K<Token≤166K

4元

16元

glm-4.5

非思考和思考模式

0<Token≤32K

3元

14元

32K<Token≤96K

4元

16元

glm-4.5-air

非思考和思考模式

0<Token≤32K

0.8元

6元

32K<Token≤96K

1.2元

8元

MiniMax

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

MiniMax-M2.5

仅思考模式

2.1元

8.4元

各100万Token

有效期:阿里云百炼开通后90天内

MiniMax-M2.1

仅思考模式

2.1元

8.4元

MiniMax-稀宇科技

说明

仅支持中国内地部署模式。

计费规则:按输入Token和输出Token计费。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

MiniMax/MiniMax-M2.7

仅思考模式

2.1元

8.4元

MiniMax/MiniMax-M2.5

仅思考模型

2.1元

8.4元

MiniMax/MiniMax-M2.1

仅思考模式

2.1元

8.4元

MiniMax-abab

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

abab6.5g-chat

目前仅供免费体验。

免费额度用完后不可调用,推荐使用 Qwen3DeepSeek-阿里云Kimi-阿里云等作为替代模型

各100万Token(需申请)

有效期:申请通过后90天内

abab6.5t-chat

abab6.5s-chat

图像生成

计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。

计费公式:费用 = 图像单价 × 输出的图像张数

计费说明:

  • 费用与输出图像的分辨率、宽高比无关。

  • 请求失败不产生任何费用,也不消耗免费额度。

计费示例:部分图像生成失败

假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。

  • 计费数量:3 张。

  • 费用计算:0.1 × 3 = 0.3元

千问文生图

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

qwen-image-2.0-pro

0.5元/张

各100张

有效期:阿里云百炼开通后90天内

qwen-image-2.0-pro-2026-03-03

0.5元/张

qwen-image-2.0

0.2元/张

qwen-image-2.0-2026-03-03

0.2元/张

qwen-image-max

0.5元/张

qwen-image-max-2025-12-30

0.5元/张

qwen-image-plus

0.2元/张

qwen-image-plus-2026-01-09

0.2元/张

qwen-image

0.25元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

qwen-image-2.0-pro

0.550443元/张

qwen-image-2.0-pro-2026-03-03

0.550443元/张

qwen-image-2.0

0.256873元/张

qwen-image-2.0-2026-03-03

0.256873元/张

qwen-image-max

0.550443元/张

qwen-image-max-2025-12-30

0.550443元/张

qwen-image-plus

0.220177元/张

qwen-image-plus-2026-01-09

0.220177元/张

qwen-image

0.256873元/张

千问图像编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

qwen-image-2.0-pro

0.5元/张

各100张

有效期:阿里云百炼开通后90天内

qwen-image-2.0-pro-2026-03-03

0.5元/张

qwen-image-2.0

0.2元/张

qwen-image-2.0-2026-03-03

0.2元/张

qwen-image-edit-max

0.5元/张

qwen-image-edit-max-2026-01-16

0.5元/张

qwen-image-edit-plus

0.2元/张

qwen-image-edit-plus-2025-12-15

0.2元/张

qwen-image-edit-plus-2025-10-30

0.2元/张

qwen-image-edit

0.3元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

qwen-image-2.0-pro

0.550443元/张

qwen-image-2.0-pro-2026-03-03

0.550443元/张

qwen-image-2.0

0.256873元/张

qwen-image-2.0-2026-03-03

0.256873元/张

qwen-image-edit-max

0.550443元/张

qwen-image-edit-max-2026-01-16

0.550443元/张

qwen-image-edit-plus

0.220177元/张

qwen-image-edit-plus-2025-12-15

0.220177元/张

qwen-image-edit-plus-2025-10-30

0.220177元/张

qwen-image-edit

0.330266元/张

千问图像翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

qwen-mt-image

0.003元/张

100张

有效期:阿里云百炼开通后90天内

Z-Image

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

z-image-turbo

关闭提示词改写(prompt_extend=false):0.1元/张

开启提示词改写(prompt_extend=true):0.2元/张

100张

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

z-image-turbo

关闭提示词改写(prompt_extend=false):0.110089元/张

开启提示词改写(prompt_extend=true):0.220177元/张

万相文生图

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2i

0.20元/张

50张

wan2.5-t2i-preview

0.20元/张

50张

wan2.2-t2i-plus

0.20元/张

100张

wan2.2-t2i-flash

0.14元/张

100张

wanx2.1-t2i-plus

0.20元/张

500张

wanx2.1-t2i-turbo

0.14元/张

500张

wanx2.0-t2i-turbo

0.04元/张

500张

wanx-v1

0.16元/张

500张

全球

说明

全球部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

0.20元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

0.220177元/张

wan2.5-t2i-preview

0.220177元/张

wan2.2-t2i-plus

0.366962元/张

wan2.2-t2i-flash

0.183481元/张

wan2.1-t2i-plus

0.366962元/张

wan2.1-t2i-turbo

0.183481元/张

万相图像生成与编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-image

0.20元/张

50张

全球

说明

全球部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-image

0.20元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-image

0.220177元/张

万相通用图像编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.5-i2i-preview

0.20元/张

50张

wanx2.1-imageedit

0.14元/张

500张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.5-i2i-preview

0.220177元/张

万相涂鸦作画

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-sketch-to-image-lite

0.06元/张

500张

有效期:阿里云百炼开通后90天内

万相图像局部重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-x-painting

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-千问图像编辑-万相2.1获取替代方案。

500张

有效期:阿里云百炼开通后90天内

人像风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-style-repaint-v1

0.12元/张

500张

有效期:阿里云百炼开通后90天内

图像背景生成

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-background-generation-v2

0.08元/张

500张

有效期:阿里云百炼开通后90天内

图像画面扩展

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-out-painting

0.18元/张

500张

有效期:阿里云百炼开通后90天内

人物实例分割

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-instance-segmentation

目前仅供免费体验。

免费额度用完后不可调用。

500张

有效期:阿里云百炼开通后90天内

图像擦除补全

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-erase-completion

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-千问图像编辑-万相2.1获取替代方案。

500张

有效期:阿里云百炼开通后90天内

虚拟模特

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-virtualmodel

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-千问图像编辑-万相2.1获取替代方案。

各500张

有效期:阿里云百炼开通后90天内

virtualmodel-v2

鞋靴模特

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

shoemodel-v1

目前仅供免费体验。

免费额度用完后不可调用。

500张

有效期:阿里云百炼开通后90天内

创意海报生成

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-poster-generation-v1

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-千问图像编辑-万相2.1获取替代方案。

500张

有效期:阿里云百炼开通后90天内

人物写真生成-FaceChain

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • facechain-facedetect:限时免费。

  • facechain-finetune:按训练次数计费,请求失败不计费。

  • facechain-generation:输入不计费,输出计费。输出按成功生成的图片张数计费,计费规则请参见图像生成

模型服务

模型名称

单价

免费额度(注)

人物图像检测

facechain-facedetect

限时免费

限时免费

人物形象训练

facechain-finetune

2.5元/次

50次

有效期:申请通过后90天内

人物写真生成

facechain-generation

0.18元/张

500张

有效期:申请通过后90天内

创意文字生成-WordArt锦书

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型服务

模型名称

输出单价

免费额度(注)

文字纹理生成

wordart-texture

0.08元/张

500张

有效期:阿里云百炼开通后90天内

文字变形

wordart-semantic

0.24元/张

AI试衣-OutfitAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • aitryon:输入不计费,输出计费。计费规则请参见图像生成

  • aitryon-plus:输入不计费,输出计费。计费规则请参见图像生成

  • aitryon-parsing-v1:输入计费,输出不计费。按输入的图像张数计费,请求失败不计费。

  • aitryon-refiner:输入不计费,输出计费。计费规则请参见图像生成

模型服务

模型名称

免费额度(注)

有效期:阿里云百炼开通后90天内

AI试衣-基础版

aitryon

400张

AI试衣-Plus版

aitryon-plus

400张

AI试衣-图片分割

aitryon-parsing-v1

400张

AI试衣-图片精修

aitryon-refiner

100张

模型服务

模型名称

单价

折扣

阶梯层级

AI试衣-基础版

aitryon

0.20元/张

AI试衣-Plus版

aitryon-plus

0.50元/张

AI试衣-图片分割

aitryon-parsing-v1

0.004元/张

AI试衣-图片精修

aitryon-refiner

0.30元/张

生成数量 ≤ 25张

0.275元/张

9.2折

25张 < 生成数量 ≤ 125张

0.25元/张

8.4折

125张 < 生成数量 ≤ 250张

0.225元/张

7.5折

250张 < 生成数量 ≤ 1250张

0.20元/张

6.7折

1250张 < 生成数量 ≤ 2500张

0.175元/张

5.8折

2500张 < 生成数量 ≤ 2.5万张

0.15元/张

5折

生成数量 > 2.5万张

图像生成-第三方模型

StableDiffusion文生图模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

stable-diffusion-3.5-large

目前仅供免费体验。

免费额度用完后不可调用,推荐参考文本生成图像获取替代方案

各500张

有效期:申请通过后90天内

stable-diffusion-3.5-large-turbo

stable-diffusion-xl

stable-diffusion-v1.5

FLUX文生图模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

flux-merged

目前仅供免费体验。

免费额度用完后不可调用,推荐参考文本生成图像获取替代方案

各100张

有效期:阿里云百炼开通后90天内

flux-dev

flux-schnell

语音合成(文本转语音)

Qwen-TTS

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

千问3-TTS-Instruct-Flash

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-instruct-flash

0.8元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-instruct-flash-2026-01-26

0.8元

不计费

千问3-TTS-VD

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vd-2026-01-26

0.8元

不计费

1万字符

有效期:阿里云百炼开通后90天内

千问3-TTS-VC

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vc-2026-01-22

0.8元

不计费

1万字符

有效期:阿里云百炼开通后90天内

千问3-TTS-Flash

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-flash

0.8元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-11-27

0.8元

不计费

qwen3-tts-flash-2025-09-18

0.8元

不计费

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

千问-TTS

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-tts-flash

1.6元

10元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-tts-latest

1.6元

10元

qwen-tts-2025-05-22

1.6元

10元

qwen-tts-2025-04-10

1.6元

10元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

千问3-TTS-Instruct-Flash

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-instruct-flash

0.8元

qwen3-tts-instruct-flash-2026-01-26

0.8元

千问3-TTS-VD

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vd-2026-01-26

0.8元

千问3-TTS-VC

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vc-2026-01-22

0.8元

千问3-TTS-Flash

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-flash

0.733924元

qwen3-tts-flash-2025-11-27

0.733924元

qwen3-tts-flash-2025-09-18

0.733924元

Qwen-TTS-Realtime

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

千问3-TTS-Instruct-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-instruct-flash-realtime

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-instruct-flash-realtime-2026-01-22

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

千问3-TTS-VD-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vd-realtime-2026-01-15

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vd-realtime-2025-12-16

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

千问3-TTS-VC-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vc-realtime-2026-01-15

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vc-realtime-2025-11-27

千问3-TTS-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-flash-realtime

1元

不计费

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-11-27

1元

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-09-18

1元

不计费

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

千问-TTS-Realtime

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-tts-realtime

2.4元

12元

各100万Token

有效期:阿里云百炼开通后90天内

qwen-tts-realtime-latest

2.4元

12元

qwen-tts-realtime-2025-07-15

2.4元

12元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

千问3-TTS-Instruct-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-instruct-flash-realtime

1元

qwen3-tts-instruct-flash-realtime-2026-01-22

1元

千问3-TTS-VD-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vd-realtime-2026-01-15

0.954101元

qwen3-tts-vd-realtime-2025-12-16

0.954101元

千问3-TTS-VC-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vc-realtime-2026-01-15

0.954101元

qwen3-tts-vc-realtime-2025-11-27

千问3-TTS-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-flash-realtime

0.954101元

qwen3-tts-flash-realtime-2025-11-27

0.954101元

qwen3-tts-flash-realtime-2025-09-18

0.954101元

Qwen-TTS声音复刻

计费规则:按新建音色个数计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-enrollment

0.01元

1000个音色/账号

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-enrollment

0.01元

Qwen-TTS声音设计

计费规则:按新建音色个数计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-design

0.2元

10个音色/账号

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-design

0.2元

CosyVoice

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

cosyvoice-v3.5-plus

1.5元

1万字符

有效期:阿里云百炼开通后90天内

cosyvoice-v3.5-flash

0.8元

cosyvoice-v3-plus

2元

cosyvoice-v3-flash

1元

cosyvoice-v2

2元

cosyvoice-v1

2元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

cosyvoice-v3-plus

1.9082元

无免费额度

cosyvoice-v3-flash

0.9541元

Sambert

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

参见模型列表

1元

每主账号每模型每月3万字符。

语音识别(语音转文本)与翻译(语音转成指定语种的文本)

千问3-LiveTranslate-Flash-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费说明

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

64元

8元

64元

240元

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-livetranslate-flash-realtime-2025-09-22

64元

8元

64元

240元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万 Token)

输出单价 (每百万 Token)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

73.392元

9.541元

73.392元

278.891元

qwen3-livetranslate-flash-realtime-2025-09-22

73.392元

9.541元

73.392元

278.891元

千问ASR

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

免费额度(注)

qwen3-asr-flash-filetrans

0.00022元/秒

不计费

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2026-02-10

qwen3-asr-flash-2025-09-08

更多模型

计费规则:按输入和输出的总Token计费。

音频Token计算规则:每秒音频转换为25个Token,不足1秒按1秒计算。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-audio-asr

目前仅供免费体验。

免费额度用完后不可调用,推荐使用 Qwen3 ASR。

各10万Token

有效期:阿里云百炼开通后90天内

qwen-audio-asr-latest

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

qwen3-asr-flash-filetrans

0.00026元/秒

不计费

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2026-02-10

qwen3-asr-flash-2025-09-08

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

qwen3-asr-flash-us

0.000035元/秒

不计费

qwen3-asr-flash-2025-09-08-us

千问ASR-Realtime

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

qwen3-asr-flash-realtime

0.00033元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-realtime-2026-02-10

qwen3-asr-flash-realtime-2025-10-27

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

qwen3-asr-flash-realtime

0.00066元/秒

qwen3-asr-flash-realtime-2026-02-10

qwen3-asr-flash-realtime-2025-10-27

Gummy语音识别/翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

gummy-realtime-v1

0.00015元/秒

36,000秒(10小时)

2025年1月17日0点前开通百炼:有效期至2025年7月15日

2025年1月17日0点起至9月8日11点前开通百炼:自开通日起90天有效

2025年9月8日11点后开通百炼:自开通日起90天有效

gummy-chat-v1

Fun-ASR

录音文件识别

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

fun-asr

0.00022元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

fun-asr

0.00026元/秒

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

实时语音识别

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

fun-asr-realtime

0.00033元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天

fun-asr-realtime-2026-02-28

fun-asr-realtime-2025-11-07

fun-asr-realtime-2025-09-15

fun-asr-flash-8k-realtime

0.00022元/秒

fun-asr-flash-8k-realtime-2026-01-28

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

fun-asr-realtime

0.00066元/秒

fun-asr-realtime-2025-11-07

Paraformer

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

paraformer-v2

0.00008元/秒

36,000秒(10小时)

每月1日0点自动发放

有效期1个月

paraformer-8k-v2

paraformer-v1

paraformer-8k-v1

paraformer-mtl-v1

实时语音识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

paraformer-realtime-v2

0.00024元/秒

36,000秒(10小时)

每月1日0点自动发放

有效期1个月

paraformer-realtime-v1

paraformer-realtime-8k-v2

paraformer-realtime-8k-v1

SenseVoice

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

sensevoice-v1

0.0007元/秒

36,000秒(10小时)

每月1日0点自动发放

有效期1个月

视频生成

计费规则:输入不计费,输出计费。输出按成功生成的 视频秒数 计费。

计费公式:费用 = 视频单价 × 输出的视频时长(单位:秒)

计费说明:

  • 部分模型按输出视频分辨率定价。不同分辨率(480P/720P/1080P)的计费价格有差异。

  • 部分模型按输出视频模式定价。不同视频模式(标准版/专业版)的计费价格有差异。

  • 部分模型按输出视频画幅定价。不同视频画幅(1:1/3:4)的计费价格有差异。

  • 部分模型采用统一定价,与分辨率、模式或画幅无关。

  • 请求失败不产生任何费用,也不会消耗免费额度。

万相-文生视频

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2v

720P

0.6元/秒

50秒

1080P

1元/秒

wan2.5-t2v-preview

480P

0.3元/秒

50秒

720P

0.6元/秒

1080P

1元/秒

wan2.2-t2v-plus

480P

0.14元/秒

50秒

1080P

0.70元/秒

wanx2.1-t2v-turbo

480P

0.24元/秒

200秒

720P

0.24元/秒

wanx2.1-t2v-plus

720P

0.70元/秒

200秒

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

0.6元/秒

1080P

1元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

0.733924元/秒

1080P

1.100886元/秒

wan2.5-t2v-preview

480P

0.366961元/秒

720P

0.733923元/秒

1080P

1.100885元/秒

wan2.2-t2v-plus

480P

0.146785元/秒

1080P

0.733924元/秒

wan2.1-t2v-turbo

480P

0.264213元/秒

720P

0.264213元/秒

wan2.1-t2v-plus

720P

0.733924元/秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v-us

720P

0.733924元/秒

1080P

1.100886元/秒

万相-图生视频-基于首帧

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频类型

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-i2v-flash

有声视频

audio=true

720P

0.3元/秒

50秒

1080P

0.5元/秒

无声视频

audio=false

720P

0.15元/秒

1080P

0.25元/秒

wan2.6-i2v

有声视频

720P

0.6元/秒

50秒

1080P

1元/秒

wan2.5-i2v-preview

有声视频

480P

0.3元/秒

50秒

720P

0.6元/秒

1080P

1元/秒

wan2.2-i2v-flash

无声视频

480P

0.10元/秒

50秒

720P

0.20元/秒

1080P

0.48元/秒

wan2.2-i2v-plus

无声视频

480P

0.14元/秒

50秒

1080P

0.70元/秒

wanx2.1-i2v-turbo

无声视频

480P

0.24元/秒

200秒

720P

0.24元/秒

wanx2.1-i2v-plus

无声视频

720P

0.70元/秒

200秒

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v

有声视频

720P

0.6元/秒

1080P

1元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-flash

有声视频

audio=true

720P

0.366962元/秒

1080P

0.550443元/秒

无声视频

audio=false

720P

0.183481元/秒

1080P

0.275221元/秒

wan2.6-i2v

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

wan2.5-i2v-preview

有声视频

480P

0.366961元/秒

720P

0.733923元/秒

1080P

1.100885元/秒

wan2.2-i2v-flash

无声视频

480P

0.110089元/秒

720P

0.264213元/秒

wan2.2-i2v-plus

无声视频

480P

0.146785元/秒

1080P

0.733924元/秒

wan2.1-i2v-turbo

无声视频

480P

0.264213元/秒

720P

0.264213元/秒

wan2.1-i2v-plus

无声视频

720P

0.733924元/秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-us

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

万相-图生视频-基于首尾帧

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.2-kf2v-flash

480P

0.10元/秒

50秒

720P

0.20元/秒

1080P

0.48元/秒

wanx2.1-kf2v-plus

720P

0.70元/秒

200秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.1-kf2v-plus

720P

0.733924元/秒

万相-参考生视频

计费规则:输入视频和输出视频均计费,按视频秒数计费,失败不计费也不占用免费额度。

  • 计费公式:计费时长 = 输入视频时长(上限 5 秒)+ 输出视频时长。

    • 输入视频的计费时长不超过 5 秒,计算规则参见万相-参考生视频

    • 输出视频的计费时长为成功生成的视频秒数

  • 定价说明:计费单价由分辨率档位和 audio(是否输出有声视频)决定,与输入视频的实际分辨率或音频状态无关。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-r2v-flash

有声视频

audio=true

720P

0.3元/秒

50秒

1080P

0.5元/秒

无声视频

audio=false

720P

0.15元/秒

1080P

0.25元/秒

wan2.6-r2v

有声视频

720P

0.6元/秒

50秒

1080P

1元/秒

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

wan2.6-r2v

有声视频

720P

0.6元/秒

1080P

1元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

wan2.6-r2v-flash

有声视频

audio=true

720P

0.366962元/秒

1080P

0.550443元/秒

无声视频

audio=false

720P

0.183481元/秒

1080P

0.275221元/秒

wan2.6-r2v

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

万相-通用视频编辑

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

wanx2.1-vace-plus

720P

0.70元/秒

50秒

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.1-vace-plus

720P

0.733924元/秒

万相-数字人

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • wan2.2-s2v-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • wan2.2-s2v:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

wan2.2-s2v-detect

输入图像:0.004元/张

200张

视频生成

wan2.2-s2v

输出视频:

  • 480P:0.5元/秒

  • 720P:0.9元/秒

100秒

万相-图生动作

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-move

标准模式wan-std

0.4元/秒

50秒

有效期:阿里云百炼开通后90天内

专业模式wan-pro

0.6元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-move

标准模式wan-std

0.880709元/秒

专业模式wan-pro

1.321063元/秒

万相-视频换人

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-mix

标准模式wan-std

0.6元/秒

50秒

有效期:阿里云百炼开通后90天内

专业模式wan-pro

0.9元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-mix

标准模式wan-std

1.321063元/秒

专业模式wan-pro

1.908202元/秒

舞动人像AnimateAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • animate-anyone-detect-gen2:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • animate-anyone-template-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

  • animate-anyone-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

animate-anyone-detect-gen2

输入图像:0.004元/张

200张

动作模板生成

animate-anyone-template-gen2

输出视频:0.08元/秒

1800秒(30分钟)

视频生成

animate-anyone-gen2

输出视频:0.08元/秒

1800秒(30分钟)

悦动人像EMO

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emo-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emo-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

emo-detect-v1

输入图像:0.004元/张

200张

视频生成

emo-v1

输出视频:

  • 1:1画幅视频:0.08元/秒

  • 3:4画幅视频:0.16元/秒

1800秒(30分钟)

灵动人像LivePortrait

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • liveportrait-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • liveportrait:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

liveportrait-detect

输入图像:0.004元/张

200张

视频生成

liveportrait

输出视频:0.02元/秒

1800秒(30分钟)

表情包Emoji

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emoji-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emoji-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

emoji-detect-v1

输入图像:0.004元/张

200张

视频生成

emoji-v1

输出视频:0.08元/秒

1800秒(30分钟)

声动人像VideoRetalk

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

videoretalk

0.08元/秒

1800秒(30分钟)

视频风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频分辨率

输出单价

免费额度(注)

video-style-transform

540P

0.2元/秒

600秒

有效期:阿里云百炼开通后90天内

720P

0.5元/秒

视频生成-第三方模型

文生视频-爱诗

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频类型

输出视频分辨率

输出单价

pixverse/pixverse-v5.6-t2v

有声视频

audio=true

360P

0.47元/秒

540P

0.47元/秒

720P

0.53元/秒

1080P

0.7元/秒

无声视频

audio=false

360P

0.21元/秒

540P

0.21元/秒

720P

0.27元/秒

1080P

0.44元/秒

图生视频-基于首帧-爱诗

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频类型

输出视频分辨率

输出单价

pixverse/pixverse-v5.6-it2v

有声视频

audio=true

360P

0.47元/秒

540P

0.47元/秒

720P

0.53元/秒

1080P

0.7元/秒

无声视频

audio=false

360P

0.21元/秒

540P

0.21元/秒

720P

0.27元/秒

1080P

0.44元/秒

图生视频-基于首尾帧-爱诗

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频类型

输出视频分辨率

输出单价

pixverse/pixverse-v5.6-kf2v

有声视频

audio=true

360P

0.47元/秒

540P

0.47元/秒

720P

0.53元/秒

1080P

0.7元/秒

无声视频

audio=false

360P

0.21元/秒

540P

0.21元/秒

720P

0.27元/秒

1080P

0.44元/秒

参考生视频-爱诗

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频类型

输出视频分辨率

输出单价

pixverse/pixverse-v5.6-r2v

有声视频

audio=true

360P

0.47元/秒

540P

0.47元/秒

720P

0.53元/秒

1080P

0.7元/秒

无声视频

audio=false

360P

0.21元/秒

540P

0.21元/秒

720P

0.27元/秒

1080P

0.44元/秒

文本向量

计费规则:按输入Token计费,输出不计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

免费额度(注)

有效期:阿里云百炼开通后90天内

text-embedding-v4

Batch调用半价

0.5元

100万Token

text-embedding-v3

Batch调用半价

0.5元

50万Token

text-embedding-v2

Batch调用半价

0.7元

50万Token

text-embedding-v1

Batch调用半价

0.7元

50万Token

text-embedding-async-v2

0.7元

2000万Token

text-embedding-async-v1

0.7元

2000万Token

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

text-embedding-v4

0.514元

text-embedding-v3

0.514元

金融云

模型名称

输入单价(每百万Token)

text-embedding-v3

1.33元

多模态向量

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token计费,输出不计费。

模型名称

输入单价(每百万Token)

免费额度(注)

文本

图片/视频

qwen3-vl-embedding

0.7元

1.8元

各100万Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-embedding

tongyi-embedding-vision-plus

0.5元

0.5元

tongyi-embedding-vision-flash

0.15元

0.15元

multimodal-embedding-v1

0.7元

0.9元

文本分类、抽取、排序

OpenNLU

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token计费,输出不计费。

模型名称

输入单价(每百万Token)

免费额度(注)

opennlu-v1

4.65元

100万Token

有效期:阿里云百炼开通后90天内

文本排序模型

计费规则:按输入Token计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-rerank

0.5元

各100万Token

有效期:阿里云百炼开通后90天内

gte-rerank-v2

0.8元

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-rerank

0.5元

各100万Token

有效期:阿里云百炼开通后90天内

gte-rerank-v2

0.8元

行业模型

通义法睿

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

farui-plus

20元

20元

无免费额度

意图理解

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

tongyi-intent-detect-v3

0.4元

1元

100万Token

有效期:阿里云百炼开通后90天内

角色扮演

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus-character

0.8元

2元

100万Token

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-plus-character-ja

3.67元

10.275元

界面交互

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

gui-plus

1.5元

4.5元

100万Token

有效期:阿里云百炼开通后90天内

gui-plus-2026-02-26

上一篇: 新人免费额度 下一篇: 模型训练与部署计费
阿里云首页 大模型服务平台百炼 相关技术圈