文档

计量计费

更新时间:

计量方式

专属服务按照算力单元的使用时长计算费用。时间单位为小时。

专属服务

计量单位

算力单元

小时,不足1小时按照1小时计算。

计费价格

专属服务

计费单价

算力单元

在邀测期间,获得资格的用户可以免费使用2个算力单元。

算力单元

算力单元是专属服务使用计算资源的基本单位,模型专属服务按照算力单元的数量和使用时长进行计量计费。您可以根据实际需要的处理能力部署合适的算力单元。

模型专属服务使用的算力单元必须是模型基础算力单元的整数倍,例如qwen-turbo模型的基础算力单元为2,使用了qwen-turbo模型的专属服务的算力单元必须是2的倍数。

模型列表

以下为专属服务支持的预置模型列表:

模型名称

基础算力单元

参考处理能力

qwen-plus

8

70 QPM

qwen-turbo

2

25 QPM

llama2-7b-chat-v2

1

4 QPM

llama2-13b-chat-v2

2

6 QPM

chatglm-6b-v2

1

6 QPM

说明
  • 文档更新可能存在延迟,实际支持的模型列表以API返回为准;

  • 基础算力单元和参考处理能力在同一个模型的不同版本会有差异,表格中提供的数据基于最新版本测试获得;

  • 参考处理能力的单位是每分钟处理请求数(QPM),是在常规数据集上测试获得,实际处理能力会因输入数据不同而有差异。