计量方式
专属服务按照算力单元的使用时长计算费用。时间单位为小时。
专属服务 | 计量单位 |
算力单元 | 小时,不足1小时按照1小时计算。 |
计费价格
专属服务 | 计费单价 |
算力单元 | 在邀测期间,获得资格的用户可以免费使用2个算力单元。 |
算力单元
算力单元是专属服务使用计算资源的基本单位,模型专属服务按照算力单元的数量和使用时长进行计量计费。您可以根据实际需要的处理能力部署合适的算力单元。
模型专属服务使用的算力单元必须是模型基础算力单元的整数倍,例如qwen-turbo
模型的基础算力单元为2
,使用了qwen-turbo
模型的专属服务的算力单元必须是2
的倍数。
模型列表
以下为专属服务支持的预置模型列表:
模型名称 | 基础算力单元 | 参考处理能力 |
qwen-plus | 8 | 70 QPM |
qwen-turbo | 2 | 25 QPM |
llama2-7b-chat-v2 | 1 | 4 QPM |
llama2-13b-chat-v2 | 2 | 6 QPM |
chatglm-6b-v2 | 1 | 6 QPM |
说明
文档更新可能存在延迟,实际支持的模型列表以API返回为准;
基础算力单元和参考处理能力在同一个模型的不同版本会有差异,表格中提供的数据基于最新版本测试获得;
参考处理能力的单位是每分钟处理请求数(QPM),是在常规数据集上测试获得,实际处理能力会因输入数据不同而有差异。
文档内容是否对您有帮助?