AIpaas平台按不同模型的输入输出Token数量及缓存命中情况，采用阶梯定价模式对开发者调用百炼模型服务进行计费。-企业 Agent 应用平台(AgentOne)-阿里云帮助中心

本文介绍AIpaas模型服务和云资源计费方式

1、模型服务收费

1.收费标准
按实际消耗的Token数量计费，不同模型按输入和输出的Token分别定价，按实际调用量计费。

模型Code	计费阶梯	token模式	收费标准（元/千Token）
qwen-flash	0k-128k	输入	0.0002
		输入（思考）	0.0002
		输入（缓存命中）	0.0001
		输入（思考模式缓存命中）	0.0001
		输出	0.0015
		输出（思考）	0.0015
	128k-256k	输入	0.0006
		输入（思考）	0.0006
		输入（缓存命中）	0.0002
		输入（思考模式缓存命中）	0.0002
		输出	0.006
		输出（思考）	0.006
	256k-1m	输入	0.0012
		输入（思考）	0.0012
		输入（缓存命中）	0.0003
		输入（思考模式缓存命中）	0.0003
		输出	0.012
		输出（思考）	0.012
qwen3-30b-a3b-instruct-2507	-	输入	0.0008
qwen3-30b-a3b-instruct-2507	-	输出	0.003
qwen-plus	0k-128k	输入	0.0008
		输入（思考）	0.0008
		输入（缓存命中）	0.0002
		输入（思考模式缓存命中）	0.0002
		输出	0.002
		输出（思考）	0.008
	128k-256k	输入	0.0024
		输入（思考）	0.0024
		输入（缓存命中）	0.0005
		输入（思考模式缓存命中）	0.0005
		输出	0.02
		输出（思考）	0.024
	256k-1m	输入	0.0048
		输入（思考）	0.0048
		输入（缓存命中）	0.001
		输入（思考模式缓存命中）	0.001
		输出	0.048
		输出（思考）	0.064
qwen3-235b-a22b	-	输入	0.002
qwen3-235b-a22b	-	输出	0.008
qwen3-32b	-	输入	0.002
		输入（思考）	0.002
		输出	0.008
		输出（思考）	0.02
qwen3-30b-a3b-thinking-2507	-	输入（思考）	0.0008
qwen3-30b-a3b-thinking-2507	-	输出（思考）	0.0075
qwen-turbo	-	输入	0.0003
		输入（思考）	0.0003
		输入（缓存命中）	0.0001
		输入（思考模式缓存命中）	0.0001
		输出	0.0006
		输出（思考）	0.003
qwen-max-2025-01-25	-	输入	0.0024
qwen-max-2025-01-25	-	输出	0.0096
qwen-max	-	输入	0.0024
		输入（缓存命中）	0.0005
		输出	0.0096
qwen-vl-plus	-	输入	0.0008
		输入（缓存命中）	0.0002
		输出	0.002
qwen-vl-max	-	输入	0.0016
		输入（缓存命中）	0.0004
		输出	0.004
qwen2.5-vl-72b-instruct	-	输入	0.016
qwen2.5-vl-72b-instruct	-	输出	0.048
qwen3-next-80b-a3b-instruct	-	输入	0.001
qwen3-next-80b-a3b-instruct	-	输出	0.004
qwen3-235b-a22b-instruct-2507	-	输入	0.002
qwen3-235b-a22b-instruct-2507	-	输出	0.008
qwen3-vl-235b-a22b-instruct	-	输入	0.002
qwen3-vl-235b-a22b-instruct	-	输出	0.008
qwen3-vl-flash	0k-32k	输入	0.0002
		输入（缓存命中）	0.0001
		输出	0.0015
	32k-128k	输入	0.0003
		输入（缓存命中）	0.0001
		输出	0.003
	128k-256k	输入	0.0006
		输入（缓存命中）	0.0002
		输出	0.006
qwen3-vl-plus	0k-32k	输入	0.001
		输入（缓存命中）	0.0002
		输出	0.01
	32k-128k	输入	0.0015
		输入（缓存命中）	0.0003
		输出	0.015
	128k-256k	输入	0.003
		输入（缓存命中）	0.0006
		输出	0.03
qwen-plus-2025-12-01	0k-128k	输入	0.0008
		输入（思考）	0.0008
		输出	0.002
		输出（思考）	0.008
	128k-256k	输入	0.0024
		输入（思考）	0.0024
		输出	0.02
		输出（思考）	0.024
	256k-1m	输入	0.0048
		输入（思考）	0.0048
		输出	0.048
		输出（思考）	0.064
qwen3-coder-plus	0k-32k	输入	0.004
		输入（缓存命中）	0.0008
		输出	0.016
	32k-128k	输入	0.006
		输入（缓存命中）	0.0012
		输出	0.024
	128k-256k	输入	0.01
		输入（缓存命中）	0.002
		输出	0.04
	256k-1m	输入	0.02
		输入（缓存命中）	0.004
		输出	0.2
qwen3-max	0k-32k	输入	0.0032
		输入（缓存命中）	0.0007
		输出	0.0128
	32k-128k	输入	0.0064
		输入（缓存命中）	0.0013
		输出	0.0256
	128k-256k	输入	0.0096
		输入（缓存命中）	0.002
		输出	0.0384
qwen3-vl-plus-2025-12-19	0k-32k	输入	0.001
	0k-32k	输出	0.01
	32k-128k	输入	0.0015
	32k-128k	输出	0.015
	128k-256k	输入	0.003
	128k-256k	输出	0.03
qwen-plus-2025-07-28	0k-128k	输入	0.0008
		输入（思考）	0.0008
		输出	0.002
		输出（思考）	0.008
	128k-256k	输入	0.0024
		输入（思考）	0.0024
		输出	0.02
		输出（思考）	0.024
	256k-1m	输入	0.0048
		输入（思考）	0.0048
		输出	0.048
		输出（思考）	0.064
qwen3-0.6b	-	输入	0.0003
		输入（思考）	0.0003
		输出	0.0012
		输出（思考）	0.003
qwen3-1.7b	-	输入	0.0003
		输入（思考）	0.0003
		输出	0.0012
		输出（思考）	0.003
qwen3-4b	-	输入	0.0003
		输入（思考）	0.0003
		输出	0.0012
		输出（思考）	0.003
qwen3-max-2026-01-23	0k-32k	输入	0.0025
	0k-32k	输出	0.01
	32k-128k	输入	0.004
	32k-128k	输出	0.016
	128k-256k	输入	0.007
	128k-256k	输出	0.028
qwen3.5-plus	0k-128k	输入	0.0008
	0k-128k	输出	0.0048
	128k-256k	输入	0.002
	128k-256k	输出	0.012
	256k-1m	输入	0.004
	256k-1m	输出	0.024
qwen3.5-flash	0k-128k	输入	0.0002
	0k-128k	输出	0.002
	128k-256k	输入	0.0008
	128k-256k	输出	0.008
	256k-1m	输入	0.0012
	256k-1m	输出	0.012

二、云资源计费方式

SAE	产品计费
PAI	模型在线服务（EAS）计费说明
云消息队列 RabbitMQ 版	公网访问费用
云原生数据库 PolarDB	产品计费
云数据库 ClickHouse	计费方式
数据传输服务 DTS	计费方式
云解析PrivateZone	产品计费
ES	计费规则
rds	产品计费
tair	计费方式
slb	负载均衡产品计费
mse	开发版与专业版实例计费概述
sls	按使用功能计费
ack	集群管理费用
opensearch	计费方式和计费项
nat	NAT 网关计费
数据管理	计费项（DMS）
云监控	可观测链路 OpenTelemetry 版
ECS	实例规格计费
oss	计费项