文档

LLM智能问答版计费概述

LLM智能问答版计费相关说明。

计费方式

计费方式

说明

按量付费

也称为后付费,即每小时生成一个收费帐单,所有的分时帐单是归属于一个订单的,并按照生成订单时的账单从阿里云账号扣费

计算资源抵扣包

"计算资源抵扣包"是一种LLM智能问答版提供的优惠措施,它可以让用户预先支付一定的费用来购买一包含了一定量的计算资源的套餐。通过购买抵扣包,用户可以以更低的价格获取计算资源

计费项

LLM版本

计费项

单位

选购区间

步长

说明

标准版

存储

GB

[1 , 100]

1GB

固定存储费用,按照选购时的配额付费

标准版

计算资源

CU

[0 , 3600]

-

根据每小时实际使用量付费,调用量越大,QPS越高,相应的计算资源消耗越大

专业版

存储

GB

[1 , 100]

1GB

固定存储费用,按照选购时的配额付费

专业版

GPU租用

[1 , 10]

1

固定租用费用,按照不同GPU规格的单价付费

价格

存储价格(标准版/专业版)

区域

价格(元/GB/小时)

费用示例

上海

0.232

实例A在购买时预购了10GB的存储配额,则每小时需付费 10*0.232=2.32 元

新加坡

0.207

实例A在购买时预购了10GB的存储配额,则每小时需付费 10*0.207=2.07 元

CU计算资源价格(标准版)

区域

价格(元/CU/小时)

费用示例

上海

0.53

实例A在11-12时使用了100CU的计算资源进行搜索问答,则当前小时需付费 100*0.53=53 元

新加坡

0.592

实例A在11-12时使用了100CU的计算资源进行搜索问答,则当前小时需付费 100*0.592=59.2 元

计算资源包

标准版实例商品类型为计算资源抵扣包时按以下价格计算:

区域

计算资源包规格(CU)

价格(元)

上海

100

52.5

1000

419

10000

4770

新加坡

100

58.6

1000

580

10000

5330

说明

假设用户购买了100CU的资源包,某段时间调用量比较大,消耗了110CU,首先会抵扣资源包中的100CU,当资源包的CU消耗完后,之后的调用则按原先的按量付费的价格进行CU计费。

GPU租用价格(专业版)

区域

GPU规格

价格(元/个/小时)

费用示例

上海

gpu.v100.32g.x4

5.633

上海区域实例A在购买时预购了2个gpu.v100.32g.x4规格的GPU,则每小时需付费 5.633*2=11.266 元

gpu.v100.32g.x8

11.263

新加坡

gpu.v100.32g.x4

8.433

gpu.v100.32g.x8

16.863

重要
  • 计算资源按照实际使用情况弹性计费,包含控制台、API中的问答调用所消耗的计算资源

  • 每1CU的计算资源平均能够支持10次问答调用(实际消耗会根据对话复杂程度浮动)

  • 每个实例的最高访问限流为10QPS,超过10QPS无法保障SLA,如需增大访问限流请提前申请

  • 专业版购买GPU后,无需再支付计算资源费用。

  • GPU规格无法进行变更且暂不支持降配,如需变更规格或减少GPU数量请重新购买实例。

模型训练价格(专业版)

定制LLM训练为专业版特有的功能,实际训练时,将按照每次训练所消耗的实际训练资源按次收费。

模型类型

模型训练价格(元/计算时)

预估模型训练消耗计算时

定制LLM

3.87

按照最小化训练数据,需消耗250计算时;如需增加训练资源,请联系技术支持

费用计算示例

标准版

用户A购买了一个OpenSearch LLM智能问答版标准版实例,购买时选择的存储容量为2GB。

在6-7时,用户A没有进行问答调用,没有消耗计算资源;

则6-7时的费用为:2*0.232 = 0.464元

在7-8时,用户A进行了100次调用,消耗计算资源10CU;

则7-8时的费用为:2*0.232 + 10*0.53 = 5.764 元

在8-9时,用户A进行了1000次调用,消耗计算资源100CU;

则8-9时的费用为:2*0.232 + 100*0.53 = 53.46 元

专业版

用户A购买了一个OpenSearch LLM智能问答版上海区域的实例,购买时选择的存储容量为2GB,选择了2个gpu.v100.32g.x4规格的GPU。 则每小时当前实例的费用为: 2*0.232 + 2*5.633 = 11.73 元。

  • 本页导读 (0)
文档反馈