AIpaas计费规则

更新时间:
复制为 MD 格式

本文介绍AIpaas模型服务和云资源计费方式

1、模型服务收费

1.收费标准
按实际消耗的Token数量计费,不同模型按输入和输出的Token分别定价,按实际调用量计费。

模型Code

计费阶梯

token模式

收费标准(元/千Token)

qwen-flash

0k-128k

输入

0.0002

输入(思考)

0.0002

输入(缓存命中)

0.0001

输入(思考模式缓存命中)

0.0001

输出

0.0015

输出(思考)

0.0015

128k-256k

输入

0.0006

输入(思考)

0.0006

输入(缓存命中)

0.0002

输入(思考模式缓存命中)

0.0002

输出

0.006

输出(思考)

0.006

256k-1m

输入

0.0012

输入(思考)

0.0012

输入(缓存命中)

0.0003

输入(思考模式缓存命中)

0.0003

输出

0.012

输出(思考)

0.012

qwen3-30b-a3b-instruct-2507

-

输入

0.0008

输出

0.003

qwen-plus

0k-128k

输入

0.0008

输入(思考)

0.0008

输入(缓存命中)

0.0002

输入(思考模式缓存命中)

0.0002

输出

0.002

输出(思考)

0.008

128k-256k

输入

0.0024

输入(思考)

0.0024

输入(缓存命中)

0.0005

输入(思考模式缓存命中)

0.0005

输出

0.02

输出(思考)

0.024

256k-1m

输入

0.0048

输入(思考)

0.0048

输入(缓存命中)

0.001

输入(思考模式缓存命中)

0.001

输出

0.048

输出(思考)

0.064

qwen3-235b-a22b

-

输入

0.002

输出

0.008

qwen3-32b

-

输入

0.002

输入(思考)

0.002

输出

0.008

输出(思考)

0.02

qwen3-30b-a3b-thinking-2507

-

输入(思考)

0.0008

输出(思考)

0.0075

qwen-turbo

-

输入

0.0003

输入(思考)

0.0003

输入(缓存命中)

0.0001

输入(思考模式缓存命中)

0.0001

输出

0.0006

输出(思考)

0.003

qwen-max-2025-01-25

-

输入

0.0024

输出

0.0096

qwen-max

-

输入

0.0024

输入(缓存命中)

0.0005

输出

0.0096

qwen-vl-plus

-

输入

0.0008

输入(缓存命中)

0.0002

输出

0.002

qwen-vl-max

-

输入

0.0016

输入(缓存命中)

0.0004

输出

0.004

qwen2.5-vl-72b-instruct

-

输入

0.016

输出

0.048

qwen3-next-80b-a3b-instruct

-

输入

0.001

输出

0.004

qwen3-235b-a22b-instruct-2507

-

输入

0.002

输出

0.008

qwen3-vl-235b-a22b-instruct

-

输入

0.002

输出

0.008

qwen3-vl-flash

0k-32k

输入

0.0002

输入(缓存命中)

0.0001

输出

0.0015

32k-128k

输入

0.0003

输入(缓存命中)

0.0001

输出

0.003

128k-256k

输入

0.0006

输入(缓存命中)

0.0002

输出

0.006

qwen3-vl-plus

0k-32k

输入

0.001

输入(缓存命中)

0.0002

输出

0.01

32k-128k

输入

0.0015

输入(缓存命中)

0.0003

输出

0.015

128k-256k

输入

0.003

输入(缓存命中)

0.0006

输出

0.03

qwen-plus-2025-12-01

0k-128k

输入

0.0008

输入(思考)

0.0008

输出

0.002

输出(思考)

0.008

128k-256k

输入

0.0024

输入(思考)

0.0024

输出

0.02

输出(思考)

0.024

256k-1m

输入

0.0048

输入(思考)

0.0048

输出

0.048

输出(思考)

0.064

qwen3-coder-plus

0k-32k

输入

0.004

输入(缓存命中)

0.0008

输出

0.016

32k-128k

输入

0.006

输入(缓存命中)

0.0012

输出

0.024

128k-256k

输入

0.01

输入(缓存命中)

0.002

输出

0.04

256k-1m

输入

0.02

输入(缓存命中)

0.004

输出

0.2

qwen3-max

0k-32k

输入

0.0032

输入(缓存命中)

0.0007

输出

0.0128

32k-128k

输入

0.0064

输入(缓存命中)

0.0013

输出

0.0256

128k-256k

输入

0.0096

输入(缓存命中)

0.002

输出

0.0384

qwen3-vl-plus-2025-12-19

0k-32k

输入

0.001

输出

0.01

32k-128k

输入

0.0015

输出

0.015

128k-256k

输入

0.003

输出

0.03

qwen-plus-2025-07-28

0k-128k

输入

0.0008

输入(思考)

0.0008

输出

0.002

输出(思考)

0.008

128k-256k

输入

0.0024

输入(思考)

0.0024

输出

0.02

输出(思考)

0.024

256k-1m

输入

0.0048

输入(思考)

0.0048

输出

0.048

输出(思考)

0.064

qwen3-0.6b

-

输入

0.0003

输入(思考)

0.0003

输出

0.0012

输出(思考)

0.003

qwen3-1.7b

-

输入

0.0003

输入(思考)

0.0003

输出

0.0012

输出(思考)

0.003

qwen3-4b

-

输入

0.0003

输入(思考)

0.0003

输出

0.0012

输出(思考)

0.003

qwen3-max-2026-01-23

0k-32k

输入

0.0025

输出

0.01

32k-128k

输入

0.004

输出

0.016

128k-256k

输入

0.007

输出

0.028

qwen3.5-plus

0k-128k

输入

0.0008

输出

0.0048

128k-256k

输入

0.002

输出

0.012

256k-1m

输入

0.004

输出

0.024

qwen3.5-flash

0k-128k

输入

0.0002

输出

0.002

128k-256k

输入

0.0008

输出

0.008

256k-1m

输入

0.0012

输出

0.012

二、云资源计费方式

SAE

产品计费

PAI

模型在线服务(EAS)计费说明

云消息队列 RabbitMQ 版

公网访问费用

云原生数据库 PolarDB

产品计费

云数据库 ClickHouse

计费方式

数据传输服务 DTS

计费方式

云解析PrivateZone

产品计费

ES

计费规则

rds

产品计费

tair

计费方式

slb

负载均衡产品计费

mse

开发版与专业版实例计费概述

sls

按使用功能计费

ack

集群管理费用

opensearch

计费方式和计费项

nat

NAT 网关计费

数据管理

计费项(DMS)

云监控

可观测链路 OpenTelemetry 版

ECS

实例规格计费

oss

计费项