模型调用价格

更新时间:
复制为 MD 格式

文本生成-通义千问

通义千问Max

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-max

Batch调用半价
上下文缓存享有折扣

仅非思考模式

0<Token≤32K

2.5

10

100Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

4

16

128K<Token≤252K

7

28

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

2.5

10

32K<Token≤128K

4

16

128K<Token≤252K

7

28

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

6

24

32K<Token≤128K

10

40

128K<Token≤252K

15

60

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

6

24

32K<Token≤128K

10

40

128K<Token≤252K

15

60

更多模型

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

2.4

9.6

100Token

有效期:阿里云百炼开通后90天内

qwen-max-latest

Batch调用半价

仅非思考模式

无阶梯计价

2.4

9.6

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

2.4

9.6

qwen-max-2024-09-19

仅非思考模式

无阶梯计价

20

60

qwen-max-2024-04-28

仅非思考模式

无阶梯计价

40

120

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

仅非思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

仅非思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

8.807

44.035

32K<Token≤128K

17.614

88.071

128K<Token≤252K

22.018

110.089

更多模型

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

11.743

46.971

qwen-max-latest

仅非思考模式

无阶梯计价

11.743

46.971

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

11.743

46.971

金融云

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

38

114

100Token

有效期:阿里云百炼开通后90天内

通义千问Plus

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen-plus

Batch调用半价

0<Token≤128K

0.8

2

8

100Token

有效期:阿里云百炼开通后90天内

128K<Token≤256K

2.4

20

24

256K<Token≤1M

4.8

48

64

qwen-plus-latest

Batch调用半价

0<Token≤128K

0.8

2

8

128K<Token≤256K

2.4

20

24

256K<Token≤1M

4.8

48

64

qwen-plus-2025-12-01

0<Token≤128K

0.8

2

8

128K<Token≤256K

2.4

20

24

256K<Token≤1M

4.8

48

64

qwen-plus-2025-09-11

0<Token≤128K

0.8

2

8

128K<Token≤256K

2.4

20

24

256K<Token≤1M

4.8

48

64

qwen-plus-2025-07-28

0<Token≤128K

0.8

2

8

128K<Token≤256K

2.4

20

24

256K<Token≤1M

4.8

48

64

qwen-plus-2025-07-14

无阶梯计价

0.8

2

8

qwen-plus-2025-04-28

无阶梯计价

0.8

2

8

更多模型

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus-2025-01-25

无阶梯计价

0.8

2

100Token

有效期:阿里云百炼开通后90天内

qwen-plus-2025-01-12

无阶梯计价

0.8

2

qwen-plus-2024-12-20

无阶梯计价

0.8

2

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-12-01

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-09-11

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-07-28

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-latest

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-12-01

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-09-11

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-07-28

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-07-14

无阶梯计价

2.936

8.807

29.357

qwen-plus-2025-04-28

无阶梯计价

2.936

8.807

29.357

更多模型

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-plus-2025-01-25

无阶梯计价

2.936

8.807

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus-us

上下文缓存享有折扣

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

qwen-plus-2025-12-01-us

0<Token≤256K

2.936

8.807

29.357

256K<Token≤1M

8.807

26.421

88.071

金融云

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus

Batch调用半价

无阶梯计价

1.52

3.8

100Token

有效期:阿里云百炼开通后90天内

通义千问Flash

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤128K

0.15

1.5

100Token

有效期:阿里云百炼开通后90天内

128K<Token≤256K

0.6

6

256K<Token≤1M

1.2

12

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤128K

0.15

1.5

128K<Token≤256K

0.6

6

256K<Token≤1M

1.2

12

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤256K

0.367

2.936

100Token

有效期:阿里云百炼开通后90天内

256K<Token≤1M

1.835

14.678

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤256K

0.367

2.936

256K<Token≤1M

1.835

14.678

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤256K

0.367

2.936

100Token

有效期:阿里云百炼开通后90天内

256K<Token≤1M

1.835

14.678

qwen-flash-2025-07-28

非思考和思考模式

0<Token≤256K

0.367

2.936

256K<Token≤1M

1.835

14.678

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-flash-us

上下文缓存享有折扣

0<Token≤256K

0.367

2.936

256K<Token≤1M

1.835

14.678

qwen-flash-2025-07-28-us

0<Token≤256K

0.367

2.936

256K<Token≤1M

1.835

14.678

通义千问Turbo

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen-turbo

Batch调用半价

非思考和思考模式

0.3

0.6

3

100Token

有效期:阿里云百炼开通后90天内

qwen-turbo-latest

Batch调用半价

非思考和思考模式

0.3

0.6

3

qwen-turbo-2025-07-15

非思考和思考模式

0.3

0.6

3

qwen-turbo-2025-04-28

非思考和思考模式

0.3

0.6

3

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

有效期:百炼开通后90天内

qwen-turbo-2025-02-11

0.3

0.6

100Token

qwen-turbo-2024-11-01

0.3

0.6

1000Token

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-turbo

Batch调用半价

非思考和思考

0.367

1.468

3.67

qwen-turbo-latest

非思考和思考

0.367

1.468

3.67

qwen-turbo-2025-04-28

非思考和思考

0.367

1.468

3.67

更多模型

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-turbo-2024-11-01

0.367

1.468

QwQ

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-plus

Batch调用半价

仅思考模式

1.6

4

100Token

有效期:阿里云百炼开通后90天内

qwq-plus-latest

仅思考模式

1.6

4

qwq-plus-2025-03-05

仅思考模式

1.6

4

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

qwq-plus

仅思考模式

5.871

17.614

通义千问Long

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-long

Batch调用半价

0.5

2

100Token

有效期:阿里云百炼开通后90天内

qwen-long-latest

0.5

2

qwen-long-2025-01-25

0.5

2

通义千问Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

1.8

15.8

3.3

6.9

12.7

62.6

100Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-2025-12-01

非思考和思考模式

1.8

15.8

3.3

6.9

12.7

62.6

qwen3-omni-flash-2025-09-15

非思考和思考模式

1.8

15.8

3.3

6.9

12.7

62.6

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

0.4

25

1.5

1.6

4.5

50

100Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-latest

0.4

25

1.5

1.6

4.5

50

qwen-omni-turbo-2025-03-26

0.4

25

1.5

1.6

4.5

50

qwen-omni-turbo-2025-01-19

0.4

25

1.5

1.6

4.5

50

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

3.156

27.962

5.725

12.183

22.458

110.896

100Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-2025-12-01

非思考和思考模式

3.156

27.962

5.725

12.183

22.458

110.896

qwen3-omni-flash-2025-09-15

非思考和思考模式

3.156

27.962

5.725

12.183

22.458

110.896

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

0.514

32.586

1.541

1.982

4.624

65.246

100Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-latest

0.514

32.586

1.541

1.982

4.624

65.246

qwen-omni-turbo-2025-03-26

0.514

32.586

1.541

1.982

4.624

65.246

通义千问Omni-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

非思考和思考模式

2.2

18.9

3.9

8.3

15.2

75.1

100Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

非思考和思考模式

2.2

18.9

3.9

8.3

15.2

75.1

qwen3-omni-flash-realtime-2025-09-15

非思考和思考模式

2.2

18.9

3.9

8.3

15.2

75.1

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo-realtime

1.6

25

6

6.4

18

50

100Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-realtime-latest

1.6

25

6

6.4

18

50

qwen-omni-turbo-realtime-2025-05-08

1.6

25

6

6.4

18

50

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

非思考和思考模式

3.816

33.54

6.899

14.605

26.935

133.06

100Token

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

非思考和思考模式

3.816

33.54

6.899

14.605

26.935

133.06

qwen3-omni-flash-realtime-2025-09-15

非思考和思考模式

3.816

33.54

6.899

14.605

26.935

133.06

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo-realtime

1.982

32.586

6.165

7.853

18.495

65.246

100Token

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-realtime-latest

1.982

32.586

6.165

7.853

18.495

65.246

qwen-omni-turbo-realtime-2025-05-08

1.982

32.586

6.165

7.853

18.495

65.246

QVQ

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qvq-max

8

32

100Token

有效期:阿里云百炼开通后90天内

qvq-max-latest

8

32

qvq-max-2025-05-15

8

32

qvq-max-2025-03-25

8

32

qvq-plus

2

5

qvq-plus-latest

2

5

qvq-plus-2025-05-15

2

5

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qvq-max

8.807

35.228

qvq-max-latest

8.807

35.228

qvq-max-2025-03-25

8.807

35.228

通义千问VL

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-plus

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1

10

100Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

1.5

15

128K<Token≤256K

3

30

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

1

10

32K<Token≤128K

1.5

15

128K<Token≤256K

3

30

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1

10

32K<Token≤128K

1.5

15

128K<Token≤256K

3

30

qwen3-vl-flash

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.15

1.5

32K<Token≤128K

0.3

3

128K<Token≤256K

0.6

6

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

0.15

1.5

32K<Token≤128K

0.3

3

128K<Token≤256K

0.6

6

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.15

1.5

32K<Token≤128K

0.3

3

128K<Token≤256K

0.6

6

更多模型

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-vl-max

Batch调用半价
上下文缓存享有折扣

无阶梯计价

1.6

4

100Token

有效期:阿里云百炼开通后90天内

qwen-vl-max-latest

Batch调用半价

无阶梯计价

1.6

4

qwen-vl-max-2025-08-13

无阶梯计价

1.6

4

qwen-vl-max-2025-04-08

无阶梯计价

3

9

qwen-vl-max-2025-04-02

无阶梯计价

3

9

qwen-vl-max-2025-01-25

无阶梯计价

3

9

qwen-vl-max-2024-12-30

无阶梯计价

3

9

qwen-vl-max-2024-11-19

无阶梯计价

3

9

qwen-vl-plus

Batch调用半价
上下文缓存享有折扣

无阶梯计价

0.8

2

qwen-vl-plus-latest

Batch调用半价

无阶梯计价

0.8

2

qwen-vl-plus-2025-08-15

无阶梯计价

0.8

2

qwen-vl-plus-2025-07-10

无阶梯计价

0.15

1.5

qwen-vl-plus-2025-05-07

无阶梯计价

1.5

4.5

qwen-vl-plus-2025-01-25

无阶梯计价

1.5

4.5

qwen-vl-plus-2025-01-02

无阶梯计价

1.5

4.5

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1.468

11.743

32K<Token≤128K

2.202

17.614

128K<Token≤256K

4.404

35.228

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1.468

11.743

32K<Token≤128K

2.202

17.614

128K<Token≤256K

4.404

35.228

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

1.468

11.743

32K<Token≤128K

2.202

17.614

128K<Token≤256K

4.404

35.228

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

1.468

11.743

32K<Token≤128K

2.202

17.614

128K<Token≤256K

4.404

35.228

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

1.468

11.743

32K<Token≤128K

2.202

17.614

128K<Token≤256K

4.404

35.228

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

更多模型

模型名称

单次请求的输入Token

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-vl-max

上下文缓存享有折扣

无阶梯计价

5.871

23.486

qwen-vl-max-latest

无阶梯计价

5.871

23.486

qwen-vl-max-2025-08-13

无阶梯计价

5.871

23.486

qwen-vl-max-2025-04-08

无阶梯计价

5.871

23.486

qwen-vl-plus

上下文缓存享有折扣

无阶梯计价

1.541

4.624

qwen-vl-plus-latest

无阶梯计价

1.541

4.624

qwen-vl-plus-2025-08-15

无阶梯计价

1.541

4.624

qwen-vl-plus-2025-05-07

无阶梯计价

1.541

4.624

qwen-vl-plus-2025-01-25

无阶梯计价

1.541

4.624

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-flash-us

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

qwen3-vl-flash-2025-10-15-us

非思考和思考模式

0<Token≤32K

0.367

2.936

32K<Token≤128K

0.55

4.404

128K<Token≤256K

0.881

7.046

通义千问OCR

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-vl-ocr

Batch调用半价

5

5

100Token

有效期:阿里云百炼开通后90天内

qwen-vl-ocr-latest

Batch调用半价

0.3

0.5

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-2025-08-28

5

5

qwen-vl-ocr-2025-04-13

qwen-vl-ocr-2024-10-28

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-ocr

0.514

1.174

qwen-vl-ocr-2025-11-20

0.514

1.174

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-ocr

5.284

5.284

qwen-vl-ocr-2025-11-20

0.514

1.174

通义千问Audio

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

计费规则:按输入和输出的总Token数进行计费。

音频Token计算规则:每一秒钟的音频对应25Token。若音频时长不足1秒,则按25Token计算。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-audio-turbo

目前仅供免费体验。

免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型

10Token

有效期:阿里云百炼开通后90天内

qwen-audio-turbo-latest

通义千问数学模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-math-plus

4

12

100Token

有效期:阿里云百炼开通后90天内

qwen-math-turbo

2

6

通义千问Coder

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-coder-plus

上下文缓存享有折扣

0<Token≤32K

4

16

100Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

6

24

128K<Token≤256K

10

40

256K<Token≤1M

20

200

qwen3-coder-plus-2025-09-23

0<Token≤32K

4

16

32K<Token≤128K

6

24

128K<Token≤256K

10

40

256K<Token≤1M

20

200

qwen3-coder-plus-2025-07-22

0<Token≤32K

4

16

32K<Token≤128K

6

24

128K<Token≤256K

10

40

256K<Token≤1M

20

200

qwen3-coder-flash

0<Token≤32K

1

4

32K<Token≤128K

1.5

6

128K<Token≤256K

2.5

10

256K<Token≤1M

5

25

qwen3-coder-flash-2025-07-28

0<Token≤32K

1

4

32K<Token≤128K

1.5

6

128K<Token≤256K

2.5

10

256K<Token≤1M

5

25

更多模型

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-coder-plus

无阶梯计价

3.5

7

100Token

有效期:阿里云百炼开通后90天内

qwen-coder-plus-latest

无阶梯计价

3.5

7

qwen-coder-plus-2024-11-06

无阶梯计价

3.5

7

qwen-coder-turbo

无阶梯计价

2

6

qwen-coder-turbo-latest

无阶梯计价

2

6

qwen-coder-turbo-2024-09-19

无阶梯计价

2

6

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-coder-plus

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-plus-2025-09-23

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-plus-2025-07-22

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-flash

0<Token≤32K

2.202

11.009

32K<Token≤128K

3.67

18.348

128K<Token≤256K

5.871

29.357

256K<Token≤1M

11.743

70.457

qwen3-coder-flash-2025-07-28

0<Token≤32K

2.202

11.009

32K<Token≤128K

3.67

18.348

128K<Token≤256K

5.871

29.357

256K<Token≤1M

11.743

70.457

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

单次请求的输入Token

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen3-coder-plus

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-plus-2025-09-23

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-plus-2025-07-22

0<Token≤32K

7.339

36.696

32K<Token≤128K

13.211

66.053

128K<Token≤256K

22.018

110.089

256K<Token≤1M

44.035

440.354

qwen3-coder-flash

0<Token≤32K

2.202

11.009

32K<Token≤128K

3.67

18.348

128K<Token≤256K

5.871

29.357

256K<Token≤1M

11.743

70.457

qwen3-coder-flash-2025-07-28

0<Token≤32K

2.202

11.009

32K<Token≤128K

3.67

18.348

128K<Token≤256K

5.871

29.357

256K<Token≤1M

11.743

70.457

通义千问翻译模型

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-mt-plus

1.8

5.4

100Token

有效期:阿里云百炼开通后90天内

qwen-mt-flash

0.7

1.95

qwen-mt-lite

0.6

1.6

qwen-mt-turbo

0.7

1.95

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-mt-plus

18.055

54.09

qwen-mt-flash

1.174

3.596

qwen-mt-lite

0.881

2.642

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-mt-plus

18.055

54.09

qwen-mt-flash

1.174

3.596

qwen-mt-lite

0.881

2.642

qwen-mt-turbo

1.174

3.596

通义千问数据挖掘模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-doc-turbo

0.6

1

无免费额度

通义千问深入研究模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-deep-research

54

163

无免费额度

通义晓蜜对话分析模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

tongyi-xiaomi-analysis-flash

0.2

0.4

100Token

有效期:百炼开通后90天内

tongyi-xiaomi-analysis-pro

1.0

2.7

文本生成-通义千问-开源版

Qwen3

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1

-

10

100Token

有效期:阿里云百炼开通后90天内

qwen3-next-80b-a3b-instruct

仅非思考模式

1

4

-

qwen3-235b-a22b-thinking-2507

仅思考模式

2

-

20

qwen3-235b-a22b-instruct-2507

仅非思考模式

2

8

-

qwen3-30b-a3b-thinking-2507

仅思考模式

0.75

-

7.5

qwen3-30b-a3b-instruct-2507

仅非思考模式

0.75

3

-

qwen3-235b-a22b

非思考和思考模式

2

8

20

qwen3-32b

非思考和思考模式

2

8

20

qwen3-30b-a3b

非思考和思考模式

0.75

3

7.5

qwen3-14b

非思考和思考模式

1

4

10

qwen3-8b

非思考和思考模式

0.5

2

5

qwen3-4b

非思考和思考模式

0.3

1.2

3

qwen3-1.7b

非思考和思考模式

0.3

1.2

3

qwen3-0.6b

非思考和思考模式

0.3

1.2

3

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1.101

-

8.807

无免费额度

qwen3-next-80b-a3b-instruct

仅非思考模式

1.101

8.807

-

qwen3-235b-a22b-thinking-2507

仅思考模式

1.688

-

16.88

qwen3-235b-a22b-instruct-2507

仅非思考模式

1.688

6.752

-

qwen3-30b-a3b-thinking-2507

仅思考模式

1.468

-

17.614

qwen3-30b-a3b-instruct-2507

仅非思考模式

1.468

5.871

-

qwen3-235b-a22b

非思考和思考模式

5.137

20.55

61.65

qwen3-32b

非思考和思考模式

1.174

4.697

4.697

qwen3-30b-a3b

非思考和思考模式

1.468

5.871

17.614

qwen3-14b

非思考和思考模式

2.569

10.275

30.825

qwen3-8b

非思考和思考模式

1.321

5.137

15.412

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

1.101

-

8.807

无免费额度

qwen3-next-80b-a3b-instruct

仅非思考模式

1.101

8.807

-

qwen3-235b-a22b-thinking-2507

仅思考模式

1.688

-

16.88

qwen3-235b-a22b-instruct-2507

仅非思考模式

1.688

6.752

-

qwen3-30b-a3b-thinking-2507

仅思考模式

1.468

-

17.614

qwen3-30b-a3b-instruct-2507

仅非思考模式

1.468

5.871

-

qwen3-235b-a22b

非思考和思考模式

5.137

20.55

61.65

qwen3-32b

非思考和思考模式

1.174

4.697

4.697

qwen3-30b-a3b

非思考和思考模式

1.468

5.871

17.614

qwen3-14b

非思考和思考模式

2.569

10.275

30.825

qwen3-8b

非思考和思考模式

1.321

5.137

15.412

qwen3-4b

非思考和思考模式

0.807

3.082

9.247

qwen3-1.7b

非思考和思考模式

0.807

3.082

9.247

qwen3-0.6b

非思考和思考模式

0.807

3.082

9.247

QwQ-开源版

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b

2

6

100Token

有效期:阿里云百炼开通后90天内

QwQ-Preview

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b-preview

Batch调用半价

2

6

100Token

有效期:阿里云百炼开通后90天内

Qwen2.5

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-14b-instruct-1m

1

3

100Token

有效期:阿里云百炼开通后90天内

qwen2.5-7b-instruct-1m

0.5

1

qwen2.5-72b-instruct

4

12

qwen2.5-32b-instruct

2

6

qwen2.5-14b-instruct

1

3

qwen2.5-7b-instruct

0.5

1

qwen2.5-3b-instruct

0.3

0.9

qwen2.5-1.5b-instruct

目前仅供免费体验

免费额度用完后不可调用,推荐使用Qwen3DeepSeek-阿里云百炼Kimi作为替代模型

qwen2.5-0.5b-instruct

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen2.5-14b-instruct-1m

5.908

23.632

qwen2.5-7b-instruct-1m

2.701

10.789

qwen2.5-72b-instruct

10.275

41.1

qwen2.5-32b-instruct

5.137

20.55

qwen2.5-14b-instruct

2.569

10.275

qwen2.5-7b-instruct

1.284

5.137

Qwen2

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2-72b-instruct

4

12

100Token

有效期:阿里云百炼开通后90天内

qwen2-57b-a14b-instruct

3.5

7

qwen2-7b-instruct

1

2

qwen2-1.5b-instruct

限时免费

qwen2-0.5b-instruct

Qwen1.5

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen1.5-110b-chat

7

14

100Token

有效期:阿里云百炼开通后90天内

qwen1.5-72b-chat

5

10

qwen1.5-32b-chat

3.5

7

qwen1.5-14b-chat

2

4

qwen1.5-7b-chat

1

2

qwen1.5-1.8b-chat

限时免费

qwen1.5-0.5b-chat

QVQ

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qvq-72b-preview

12

36

10Token

有效期:阿里云百炼开通后90天内

Qwen-Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

0.6

38

2

2.4

6

76

100Token(不区分模态)

有效期:阿里云百炼开通后90

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

0.734

49.613

2.055

2.936

6.165

99.153

Qwen3-Omni-Captioner

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-omni-30b-a3b-captioner

15.8

12.7

100Token

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-omni-30b-a3b-captioner

27.962

22.458

Qwen-VL

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-235b-a22b-thinking

仅思考模式

2

20

100万 Token

有效期:阿里云百炼开通后90天内

qwen3-vl-235b-a22b-instruct

仅非思考模式

2

8

qwen3-vl-32b-thinking

仅思考模式

2

20

qwen3-vl-32b-instruct

仅非思考模式

2

8

qwen3-vl-30b-a3b-thinking

仅思考模式

0.75

7.5

qwen3-vl-30b-a3b-instruct

仅非思考模式

0.75

3

qwen3-vl-8b-thinking

仅思考模式

0.5

5

qwen3-vl-8b-instruct

仅非思考模式

0.5

2

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-vl-72b-instruct

16

48

100万 Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-32b-instruct

8

24

qwen2.5-vl-7b-instruct

2

5

qwen2.5-vl-3b-instruct

1.2

3.6

qwen2-vl-72b-instruct

16

48

qwen2-vl-7b-instruct

目前仅供免费体验。

免费额度用完后不可调用,建议改用qwen-vl-max、qwen-vl-plus模型。

10Token

有效期:阿里云百炼开通后90天内

qwen2-vl-2b-instruct

限时免费

qwen-vl-v1

目前仅供免费体验。

免费额度用完后不可调用,建议改用qwen-vl-max、qwen-vl-plus模型。

qwen-vl-chat-v1

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

2.936

29.357

qwen3-vl-235b-a22b-instruct

仅非思考模式

2.936

11.743

qwen3-vl-32b-thinking

仅思考模式

1.174

4.697

qwen3-vl-32b-instruct

仅非思考模式

1.174

4.697

qwen3-vl-30b-a3b-thinking

仅思考模式

1.468

17.614

qwen3-vl-30b-a3b-instruct

仅非思考模式

1.468

5.871

qwen3-vl-8b-thinking

仅思考模式

1.321

15.412

qwen3-vl-8b-instruct

仅非思考模式

1.321

5.137

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

2.936

29.357

qwen3-vl-235b-a22b-instruct

仅非思考模式

2.936

11.743

qwen3-vl-32b-thinking

仅思考模式

1.174

4.697

qwen3-vl-32b-instruct

仅非思考模式

1.174

4.697

qwen3-vl-30b-a3b-thinking

仅思考模式

1.468

17.614

qwen3-vl-30b-a3b-instruct

仅非思考模式

1.468

5.871

qwen3-vl-8b-thinking

仅思考模式

1.321

15.412

qwen3-vl-8b-instruct

仅非思考模式

1.321

5.137

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-vl-72b-instruct

20.55

61.65

100万 Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-32b-instruct

10.275

30.825

qwen2.5-vl-7b-instruct

2.569

7.706

qwen2.5-vl-3b-instruct

1.541

4.624

Qwen-Audio

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2-audio-instruct

目前仅供免费体验。

免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型。

10Token

有效期:阿里云百炼开通后90天内

qwen-audio-chat

Qwen-Math

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-math-72b-instruct

4

12

100Token

有效期:阿里云百炼开通后90天内

qwen2.5-math-7b-instruct

1

2

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

6

24

100Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

9

36

128K<Token≤200K

15

60

qwen3-coder-30b-a3b-instruct

0<Token≤32K

1.5

6

32K<Token≤128K

2.25

9

128K<Token≤200K

3.75

15

qwen2.5-coder-32b-instruct

无阶梯计价

2

6

qwen2.5-coder-14b-instruct

无阶梯计价

2

6

qwen2.5-coder-7b-instruct

无阶梯计价

1

2

qwen2.5-coder-3b-instruct

无阶梯计价

限时免费

qwen2.5-coder-1.5b-instruct

无阶梯计价

qwen2.5-coder-0.5b-instruct

无阶梯计价

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际(新加坡)模型无免费额度。

模型名称

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

11.009

55.044

32K<Token≤128K

19.816

99.08

128K<Token≤200K

33.027

165.133

qwen3-coder-30b-a3b-instruct

0<Token≤32K

3.303

16.513

32K<Token≤128K

5.504

27.522

128K<Token≤200K

8.807

44.035

文本生成-第三方模型

DeepSeek

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

deepseek-v3.2

上下文缓存享有折扣

2

3

100Token

有效期:阿里云百炼开通后90天内

deepseek-v3.2-exp

2

3

deepseek-v3.1

4

12

deepseek-r1

Batch调用半价

4

16

deepseek-r1-0528

4

16

deepseek-v3

Batch调用半价

2

8

deepseek-r1-distill-qwen-1.5b

限时免费

deepseek-r1-distill-qwen-7b

0.5

1

100Token

有效期:阿里云百炼开通后90天内

deepseek-r1-distill-qwen-14b

1

3

deepseek-r1-distill-qwen-32b

2

6

deepseek-r1-distill-llama-8b

限时免费

deepseek-r1-distill-llama-70b

目前仅供免费体验

免费额度用完后不可调用,推荐使用深度思考DeepSeek-阿里云百炼Kimi作为替代模型

100Token

有效期:阿里云百炼开通后90天内

DeepSeek-硅基流动

说明

仅支持中国内地部署模式。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度

siliconflow/deepseek-v3.2

2

3

siliconflow/deepseek-v3.1-terminus

4

12

siliconflow/deepseek-r1-0528

4

16

siliconflow/deepseek-v3-0324

2

8

Kimi

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

kimi-k2-thinking

4

16

100Token

有效期:阿里云百炼开通后90天内

Moonshot-Kimi-K2-Instruct

4

16

GLM

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

模式

单次请求的输入Token

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

glm-4.7

非思考和思考模式

0<Token≤32K

3

14

100Token

有效期:阿里云百炼开通后90天内

32K<Token≤166K

4

16

glm-4.6

非思考和思考模式

0<Token≤32K

3

14

32K<Token≤166K

4

16

glm-4.5

非思考和思考模式

0<Token≤32K

3

14

32K<Token≤96K

4

16

glm-4.5-air

非思考和思考模式

0<Token≤32K

0.8

6

32K<Token≤96K

1.2

8

MiniMax-M2.1

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

免费额度(注)

MiniMax-M2.1

仅思考模式

2.1

8.4

100Token

有效期:阿里云百炼开通后90天内

MiniMax-abab

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

abab6.5g-chat

目前仅供免费体验。

免费额度用完后不可调用,推荐使用 Qwen3DeepSeek-阿里云百炼Kimi等作为替代模型

100Token(需申请)

有效期:申请通过后90天内

abab6.5t-chat

abab6.5s-chat

图像生成

计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。

计费公式:费用 = 图像单价 × 输出的图像张数

计费说明:

  • 费用与输出图像的分辨率、宽高比无关。

  • 请求失败不产生任何费用,也不消耗免费额度。

计费示例:部分图像生成失败

假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。

  • 计费数量:3 张。

  • 费用计算:0.1 × 3 = 0.3

通义千问文生图

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

qwen-image-max

0.5元/张

100

有效期:阿里云百炼开通后90天内

qwen-image-max-2025-12-30

0.5元/张

qwen-image-plus

0.2元/张

qwen-image-plus-2026-01-09

0.2元/张

qwen-image

0.25元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

qwen-image-max

0.550443元/张

qwen-image-max-2025-12-30

0.550443元/张

qwen-image-plus

0.220177元/张

qwen-image-plus-2026-01-09

0.220177元/张

qwen-image

0.256873元/张

通义千问图像编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

qwen-image-edit-max

0.5元/张

100

有效期:阿里云百炼开通后90天内

qwen-image-edit-max-2026-01-16

0.5元/张

qwen-image-edit-plus

0.2元/张

qwen-image-edit-plus-2025-12-15

0.2元/张

qwen-image-edit-plus-2025-10-30

0.2元/张

qwen-image-edit

0.3元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

qwen-image-edit-max

0.550443元/张

qwen-image-edit-max-2026-01-16

0.550443元/张

qwen-image-edit-plus

0.220177元/张

qwen-image-edit-plus-2025-12-15

0.220177元/张

qwen-image-edit-plus-2025-10-30

0.220177元/张

qwen-image-edit

0.330266元/张

通义千问图像翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

qwen-mt-image

0.003元/张

100

有效期:阿里云百炼开通后90天内

通义-文生图-Z-Image

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

z-image-turbo

关闭提示词改写(prompt_extend=false):0.1元/张

开启提示词改写(prompt_extend=true):0.2元/张

100

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

z-image-turbo

关闭提示词改写(prompt_extend=false):0.110089元/张

开启提示词改写(prompt_extend=true):0.220177元/张

通义万相文生图

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2i

0.20元/张

50

wan2.5-t2i-preview

0.20元/张

50

wan2.2-t2i-plus

0.20元/张

100

wan2.2-t2i-flash

0.14元/张

100

wanx2.1-t2i-plus

0.20元/张

500

wanx2.1-t2i-turbo

0.14元/张

500

wanx2.0-t2i-turbo

0.04元/张

500

wanx-v1

0.16元/张

500

全球

说明

全球部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

0.220177元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

0.220177元/张

wan2.5-t2i-preview

0.220177元/张

wan2.2-t2i-plus

0.366962元/张

wan2.2-t2i-flash

0.183481元/张

wan2.1-t2i-plus

0.366962元/张

wan2.1-t2i-turbo

0.183481元/张

通义万相图像生成与编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-image

0.20元/张

50

全球

说明

全球部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-image

0.220177元/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-image

0.220177元/张

通义万相通用图像编辑

仅输出计费,计费规则请参见图像生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.5-i2i-preview

0.20元/张

50

wanx2.1-imageedit

0.14元/张

500

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出单价

wan2.5-i2i-preview

0.220177元/张

通义万相涂鸦作画

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-sketch-to-image-lite

0.06元/张

500

有效期:阿里云百炼开通后90天内

通义万相图像局部重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-x-painting

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-通义千问图像编辑-通义万相2.1获取替代方案。

500

有效期:阿里云百炼开通后90天内

人像风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-style-repaint-v1

0.12元/张

500

有效期:阿里云百炼开通后90天内

图像背景生成

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-background-generation-v2

0.08元/张

500

有效期:阿里云百炼开通后90天内

图像画面扩展

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-out-painting

0.18元/张

500

有效期:阿里云百炼开通后90天内

人物实例分割

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-instance-segmentation

目前仅供免费体验。

免费额度用完后不可调用。

500

有效期:阿里云百炼开通后90天内

图像擦除补全

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

image-erase-completion

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-通义千问图像编辑-通义万相2.1获取替代方案。

500

有效期:阿里云百炼开通后90天内

虚拟模特

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-virtualmodel

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-通义千问图像编辑-通义万相2.1获取替代方案。

500

有效期:阿里云百炼开通后90天内

virtualmodel-v2

鞋靴模特

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

shoemodel-v1

目前仅供免费体验。

免费额度用完后不可调用。

500

有效期:阿里云百炼开通后90天内

创意海报生成

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

wanx-poster-generation-v1

目前仅供免费体验。

免费额度用完后不可调用,推荐参考图像编辑-通义千问图像编辑-通义万相2.1获取替代方案。

500

有效期:阿里云百炼开通后90天内

人物写真生成-FaceChain

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • facechain-facedetect:限时免费。

  • facechain-finetune:按训练次数计费,请求失败不计费。

  • facechain-generation:输入不计费,输出计费。输出按成功生成的图片张数计费,计费规则请参见图像生成

模型服务

模型名称

单价

免费额度(注)

人物图像检测

facechain-facedetect

限时免费

限时免费

人物形象训练

facechain-finetune

2.5元/次

50

有效期:申请通过后90天内

人物写真生成

facechain-generation

0.18元/张

500

有效期:申请通过后90天内

创意文字生成-WordArt锦书

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型服务

模型名称

输出单价

免费额度(注)

文字纹理生成

wordart-texture

0.08元/张

500

有效期:阿里云百炼开通后90天内

文字变形

wordart-semantic

0.24元/张

AI试衣-OutfitAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • aitryon:输入不计费,输出计费。计费规则请参见图像生成

  • aitryon-plus:输入不计费,输出计费。计费规则请参见图像生成

  • aitryon-parsing-v1:输入计费,输出不计费。按输入的图像张数计费,请求失败不计费。

  • aitryon-refiner:输入不计费,输出计费。计费规则请参见图像生成

模型服务

模型名称

免费额度(注)

有效期:阿里云百炼开通后90天内

AI试衣-基础版

aitryon

400

AI试衣-Plus

aitryon-plus

400

AI试衣-图片分割

aitryon-parsing-v1

400

AI试衣-图片精修

aitryon-refiner

100

模型服务

模型名称

单价

折扣

阶梯层级

AI试衣-基础版

aitryon

0.20元/张

AI试衣-Plus

aitryon-plus

0.50元/张

AI试衣-图片分割

aitryon-parsing-v1

0.004元/张

AI试衣-图片精修

aitryon-refiner

0.30元/张

生成数量 ≤ 25

0.275元/张

9.2

25张 < 生成数量 ≤ 125

0.25元/张

8.4

125张 < 生成数量 ≤ 250

0.225元/张

7.5

250张 < 生成数量 ≤ 1250

0.20元/张

6.7

1250张 < 生成数量 ≤ 2500

0.175元/张

5.8

2500张 < 生成数量 ≤ 2.5万张

0.15元/张

5

生成数量 > 2.5万张

图像生成-第三方模型

StableDiffusion文生图模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

stable-diffusion-3.5-large

目前仅供免费体验。

免费额度用完后不可调用,推荐参考文本生成图像获取替代方案

500

有效期:申请通过后90天内

stable-diffusion-3.5-large-turbo

stable-diffusion-xl

stable-diffusion-v1.5

FLUX文生图模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

flux-merged

目前仅供免费体验。

免费额度用完后不可调用,推荐参考文本生成图像获取替代方案

100

有效期:阿里云百炼开通后90天内

flux-dev

flux-schnell

语音合成(文本转语音)

Qwen-TTS

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

qwen3-tts系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-flash

0.8

不计费

202511130点前开通阿里云百炼:2000字符

202511130点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-11-27

0.8

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-09-18

0.8

不计费

202511130点前开通阿里云百炼:2000字符

202511130点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen-tts系列模型

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-tts-flash

1.6

10

100Token

有效期:阿里云百炼开通后90天内

qwen-tts-latest

1.6

10

qwen-tts-2025-05-22

1.6

10

qwen-tts-2025-04-10

1.6

10

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

qwen3-tts系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-flash

0.733924

qwen3-tts-flash-2025-11-27

0.733924

qwen3-tts-flash-2025-09-18

0.733924

Qwen-TTS-Realtime

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

qwen3-tts-vd realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vd-realtime-2026-01-15

1

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vd-realtime-2025-12-16

1

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vc realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-vc-realtime-2026-01-15

1

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vc-realtime-2025-11-27

qwen3-tts realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

免费额度(注)

qwen3-tts-flash-realtime

1

不计费

202511130点前开通阿里云百炼:2000字符

202511130点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-11-27

1

不计费

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-09-18

1

不计费

202511130点前开通阿里云百炼:2000字符

202511130点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen-tts realtime系列模型

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-tts-realtime

2.4

12

100Token

有效期:阿里云百炼开通后90天内

qwen-tts-realtime-latest

2.4

12

qwen-tts-realtime-2025-07-15

2.4

12

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

qwen3-tts-vd realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vd-realtime-2026-01-15

0.954101

qwen3-tts-vd-realtime-2025-12-16

0.954101

qwen3-tts-vc realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-vc-realtime-2026-01-15

0.954101

qwen3-tts-vc-realtime-2025-11-27

qwen3-tts realtime系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

qwen3-tts-flash-realtime

0.954101

qwen3-tts-flash-realtime-2025-11-27

0.954101

qwen3-tts-flash-realtime-2025-09-18

0.954101

Qwen-TTS声音复刻

计费规则:按新建音色个数计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-enrollment

0.01

1000个音色/账号

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-enrollment

0.01

Qwen-TTS声音设计

计费规则:按新建音色个数计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-design

0.2

10个音色/账号

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-design

0.2

CosyVoice

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

cosyvoice-v3-plus

2

202511150点前开通阿里云百炼:2000字符

202511150点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

cosyvoice-v3-flash

1

cosyvoice-v2

2

cosyvoice-v1

2

Sambert

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

参见模型列表

1

每主账号每模型每月3万字符。

语音识别(语音转文本)与翻译(语音转成指定语种的文本)

通义千问3-LiveTranslate-Flash-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费说明

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

64

8

64

240

100Token

有效期:阿里云百炼开通后90天内

qwen3-livetranslate-flash-realtime-2025-09-22

64

8

64

240

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万 Token)

输出单价 (每百万 Token)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

73.392

9.541

73.392

278.891

qwen3-livetranslate-flash-realtime-2025-09-22

73.392

9.541

73.392

278.891

通义千问ASR

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

免费额度(注)

qwen3-asr-flash-filetrans

0.00022元/秒

不计费

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

更多模型

计费规则:按输入和输出的总Token计费。

音频Token计算规则:每秒音频转换为25Token,不足1秒按1秒计算。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-audio-asr

目前仅供免费体验。

免费额度用完后不可调用,推荐使用 Qwen3 ASR。

10Token

有效期:阿里云百炼开通后90天内

qwen-audio-asr-latest

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

qwen3-asr-flash-filetrans

0.00026元/秒

不计费

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

输出单价

qwen3-asr-flash-us

0.000035元/秒

不计费

qwen3-asr-flash-2025-09-08-us

通义千问ASR-Realtime

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

qwen3-asr-flash-realtime

0.00033元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-realtime-2025-10-27

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

qwen3-asr-flash-realtime

0.00066元/秒

qwen3-asr-flash-realtime-2025-10-27

Gummy语音识别/翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

gummy-realtime-v1

0.00015元/秒

36,000秒(10小时)

20251170点前开通百炼:有效期至2025715

20251170点起至9811点前开通百炼:自开通日起90天有效

20259811点后开通百炼:自开通日起90天有效

gummy-chat-v1

Fun-ASR

录音文件识别

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

fun-asr

0.00022元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

fun-asr

0.00026元/秒

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

实时语音识别

计费规则:按输入音频的秒数计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价

免费额度(注)

fun-asr-realtime

0.00033元/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90

fun-asr-realtime-2025-11-07

fun-asr-realtime-2025-09-15

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价

fun-asr-realtime

0.00066元/秒

fun-asr-realtime-2025-11-07

Paraformer

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

paraformer-v2

0.00008元/秒

36,000秒(10小时)

每月10点自动发放

有效期1个月

paraformer-8k-v2

paraformer-v1

paraformer-8k-v1

paraformer-mtl-v1

实时语音识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

paraformer-realtime-v2

0.00024元/秒

36,000秒(10小时)

每月10点自动发放

有效期1个月

paraformer-realtime-v1

paraformer-realtime-8k-v2

paraformer-realtime-8k-v1

SenseVoice

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

sensevoice-v1

0.0007元/秒

36,000秒(10小时)

每月10点自动发放

有效期1个月

视频生成

计费规则:输入不计费,输出计费。输出按成功生成的 视频秒数 计费。

计费公式:费用 = 视频单价 × 输出的视频时长(单位:秒)

计费说明:

  • 部分模型按输出视频分辨率定价。不同分辨率(480P/720P/1080P)的计费价格有差异。

  • 部分模型按输出视频模式定价。不同视频模式(标准版/专业版)的计费价格有差异。

  • 部分模型按输出视频画幅定价。不同视频画幅(1:1/3:4)的计费价格有差异。

  • 部分模型采用统一定价,与分辨率、模式或画幅无关。

  • 请求失败不产生任何费用,也不会消耗免费额度。

通义万相-文生视频

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2v

720P

0.6元/秒

50

1080P

1元/秒

wan2.5-t2v-preview

480P

0.3元/秒

50

720P

0.6元/秒

1080P

1元/秒

wan2.2-t2v-plus

480P

0.14元/秒

50

1080P

0.70元/秒

wanx2.1-t2v-turbo

480P

0.24元/秒

200

720P

0.24元/秒

wanx2.1-t2v-plus

720P

0.70元/秒

200

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

0.733924元/秒

1080P

1.100886元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

0.733924元/秒

1080P

1.100886元/秒

wan2.5-t2v-preview

480P

0.366961元/秒

720P

0.733923元/秒

1080P

1.100885元/秒

wan2.2-t2v-plus

480P

0.146785元/秒

1080P

0.733924元/秒

wan2.1-t2v-turbo

480P

0.264213元/秒

720P

0.264213元/秒

wan2.1-t2v-plus

720P

0.733924元/秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v-us

720P

0.733924元/秒

1080P

1.100886元/秒

通义万相-图生视频-基于首帧

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频类型

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-i2v-flash

有声视频

audio=true

720P

0.3元/秒

50

1080P

0.5元/秒

无声视频

audio=false

720P

0.15元/秒

1080P

0.25元/秒

wan2.6-i2v

有声视频

720P

0.6元/秒

50

1080P

1元/秒

wan2.5-i2v-preview

有声视频

480P

0.3元/秒

50

720P

0.6元/秒

1080P

1元/秒

wan2.2-i2v-flash

无声视频

480P

0.10元/秒

50

720P

0.20元/秒

1080P

0.48元/秒

wan2.2-i2v-plus

无声视频

480P

0.14元/秒

50

1080P

0.70元/秒

wanx2.1-i2v-turbo

无声视频

480P

0.24元/秒

200

720P

0.24元/秒

wanx2.1-i2v-plus

无声视频

720P

0.70元/秒

200

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-flash

有声视频

audio=true

720P

0.366962元/秒

1080P

0.550443元/秒

无声视频

audio=false

720P

0.183481元/秒

1080P

0.275221元/秒

wan2.6-i2v

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

wan2.5-i2v-preview

有声视频

480P

0.366961元/秒

720P

0.733923元/秒

1080P

1.100885元/秒

wan2.2-i2v-flash

无声视频

480P

0.110089元/秒

720P

0.264213元/秒

wan2.2-i2v-plus

无声视频

480P

0.146785元/秒

1080P

0.733924元/秒

wan2.1-i2v-turbo

无声视频

480P

0.264213元/秒

720P

0.264213元/秒

wan2.1-i2v-plus

无声视频

720P

0.733924元/秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-us

有声视频

720P

0.733924元/秒

1080P

1.100886元/秒

通义万相-图生视频-基于首尾帧

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.2-kf2v-flash

480P

0.10元/秒

50

720P

0.20元/秒

1080P

0.48元/秒

wanx2.1-kf2v-plus

720P

0.70元/秒

200

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.1-kf2v-plus

720P

0.733924元/秒

通义万相-参考生视频

计费规则:输入视频和输出视频均计费,按视频秒数计费,失败不计费也不占用免费额度。

  • 输入视频的计费时长不超过 5 秒,具体规则参见计费与限流

  • 输出视频的计费时长为成功生成的视频秒数

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

视频分辨率

输入单价

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-r2v

720P

0.6元/秒

0.6元/秒

50

1080P

1元/秒

1元/秒

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

视频分辨率

输入单价

输出单价

wan2.6-r2v

720P

0.733924元/秒

0.733924元/秒

1080P

1.100886元/秒

1.100886元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

视频分辨率

输入单价

输出单价

wan2.6-r2v

720P

0.733924元/秒

0.733924元/秒

1080P

1.100886元/秒

1.100886元/秒

通义万相-通用视频编辑

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频分辨率

输出单价

免费额度(注)

wanx2.1-vace-plus

720P

0.70元/秒

50

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.1-vace-plus

720P

0.733924元/秒

通义万相-数字人

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • wan2.2-s2v-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • wan2.2-s2v:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

wan2.2-s2v-detect

输入图像:0.004元/张

200

视频生成

wan2.2-s2v

输出视频:

  • 480P:0.5元/秒

  • 720P:0.9元/秒

100

通义万相-图生动作

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-move

标准模式wan-std

0.4元/秒

50

有效期:阿里云百炼开通后90天内

专业模式wan-pro

0.6元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-move

标准模式wan-std

0.880709元/秒

专业模式wan-pro

1.321063元/秒

通义万相-视频换人

仅输出计费,计费规则请参见视频生成

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-mix

标准模式wan-std

0.6元/秒

50

有效期:阿里云百炼开通后90天内

专业模式wan-pro

0.9元/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-mix

标准模式wan-std

1.321063元/秒

专业模式wan-pro

1.908202元/秒

舞动人像AnimateAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • animate-anyone-detect-gen2:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • animate-anyone-template-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

  • animate-anyone-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

animate-anyone-detect-gen2

输入图像:0.004元/张

200

动作模板生成

animate-anyone-template-gen2

输出视频:0.08元/秒

1800秒(30分钟)

视频生成

animate-anyone-gen2

输出视频:0.08元/秒

1800秒(30分钟)

悦动人像EMO

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emo-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emo-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

emo-detect-v1

输入图像:0.004元/张

200

视频生成

emo-v1

输出视频:

  • 1:1画幅视频:0.08元/秒

  • 3:4画幅视频:0.16元/秒

1800秒(30分钟)

灵动人像LivePortrait

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • liveportrait-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • liveportrait:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

liveportrait-detect

输入图像:0.004元/张

200

视频生成

liveportrait

输出视频:0.02元/秒

1800秒(30分钟)

表情包Emoji

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emoji-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emoji-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

图像检测

emoji-detect-v1

输入图像:0.004元/张

200

视频生成

emoji-v1

输出视频:0.08元/秒

1800秒(30分钟)

声动人像VideoRetalk

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

videoretalk

0.08元/秒

1800秒(30分钟)

视频风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频分辨率

输出单价

免费额度(注)

video-style-transform

540P

0.2元/秒

600

有效期:阿里云百炼开通后90天内

720P

0.5元/秒

文本向量

计费规则:按输入Token计费,输出不计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

免费额度(注)

有效期:阿里云百炼开通后90天内

text-embedding-v4

Batch调用半价

0.5

100Token

text-embedding-v3

Batch调用半价

0.5

50Token

text-embedding-v2

Batch调用半价

0.7

50Token

text-embedding-v1

Batch调用半价

0.7

50Token

text-embedding-async-v2

0.7

2000Token

text-embedding-async-v1

0.7

2000Token

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

text-embedding-v4

0.514

text-embedding-v3

0.514

金融云

模型名称

输入单价(每百万Token)

text-embedding-v3

1.33

多模态向量

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token计费,输出不计费。

模型名称

输入单价(每百万Token)

免费额度(注)

文本

图片/视频

qwen3-vl-embedding

0.7

1.8

100Token

有效期:阿里云百炼开通后90天内

qwen2.5-vl-embedding

tongyi-embedding-vision-plus

0.5

0.5

tongyi-embedding-vision-flash

0.15

0.15

multimodal-embedding-v1

0.7

0.9

文本分类、抽取、排序

OpenNLU

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token计费,输出不计费。

模型名称

输入单价(每百万Token)

免费额度(注)

opennlu-v1

4.65

100Token

有效期:阿里云百炼开通后90天内

文本排序模型

计费规则:按输入Token计费,输出不计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-rerank

0.5

100Token

有效期:阿里云百炼开通后90天内

gte-rerank-v2

0.8

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-rerank

0.5

100Token

有效期:阿里云百炼开通后90天内

gte-rerank-v2

0.8

行业模型

通义法睿

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

farui-plus

20

20

无免费额度

意图理解

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

tongyi-intent-detect-v3

0.4

1

100Token

有效期:阿里云百炼开通后90天内

角色扮演

计费规则:按输入Token和输出Token计费。

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus-character

0.8

2

100Token

有效期:阿里云百炼开通后90天内

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

说明

国际部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-plus-character-ja

3.67

10.275

界面交互

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

gui-plus

1.5

4.5

100Token

有效期:阿里云百炼开通后90天内