文档

产品计费

更新时间:

在百炼平台,调用预置模型实现文本生成、图片生成、语音合成等任务时,会产生模型推理费用。此外,如果训练新模型或将模型部署到独占实例也会产生费用。

计费项

计费项

计费说明

计费方式

计费公式

模型推理费用

调用预置模型的费用。

调用预置模型,场景包括:直接调用模型调试或调用应用评测模型

模型推理费用 = 模型用量 × 单价

免费额度内,不会产生费用。查看免费额度请参见新人免费额度

模型训练费用

预置模型自定义模型不能满足需求时,训练新模型的费用。

模型训练又叫模型调优或模型微调。

按量后付费

模型训练费用 = (训练数据Token总数 + 混合训练数据Token总数) × 循环次数 × 训练单价

您可以查看模型训练页面底部的预估训练费用,并单击计算详情,查看训练Token总数、循环次数和训练单价

模型部署费用

部署预置模型训练后的自定义模型独占实例的费用。

按量后付费

模型部署每小时的费用 = 算力单元数量 × 算力单元单价

开始部署前,您可以在模型部署页面查看模型所需的算力单元数量,以及模型部署每小时的预估费用。

包月预付费

模型部署包月费用 = 实例单价 × 购买时长 × 实例数量

预置模型是指百炼默认提供的模型,例如通义系列模型和第三方模型等。自定义模型是指对预置模型进行训练后得到的模型。

单价

特别提醒:产品定价可能会随时发生变动,最终以阿里云账单为准。

模型推理单价

所有模型的单价,请参见模型列表

模型训练单价

模型服务

模型规格

价格

通义千问-开源版-72B

qwen-72b-chat

0.15元/千Token

通义千问2-开源版-72B

qwen2-72b-instruct

通义千问1.5-开源版-72B

qwen1.5-72b-chat

通义千问-Plus-0723

qwen-plus-0723

通义千问-Turbo-0624

qwen-turbo-0624

0.03元/千Token

通义千问Turbo

qwen-turbo

通义千问-开源版-14B

qwen-14b-chat

通义千问-Plus

qwen-plus

通义千问VL-Plus

qwen-vl-plus

通义千问1.5-开源版-14B

qwen1.5-14b-chat

通义千问-开源版-7B

qwen-7b-chat

0.006元/千Token

通义千问2-开源版-7B

qwen2-7b-instruct

通义千问1.5-开源版-7B

qwen1.5-7b-chat

模型部署单价

模型部署的费用取决于模型需要多少算力单元,以及运行的时长。算力单元的单价固定为20元/小时。

模型服务

模型规格

独占实例资源规格

预付费价格

后付费价格

悦动人像EMO-detect

emo-detectemo-detect

轻量版

10,000元/月

20元/实例/小时

悦动人像EMO

emo

舞动人像AnimateAnyone-detect

animate-anyone-detect

舞动人像AnimateAnyone

animate-anyone

通义万相-文本生成图像-0521

wanx-v1-0521

通义千问-turbo

qwen-turbo

基础版

20,000元/月

40元/实例/小时

通义千问1.5-开源版-7B

qwen1.5-7b-chat

通义千问1.5-开源版-14B

qwen1.5-14b-chat

基于通义千问2-开源版-7B训练出来的模型

qwen2-7b-instruct

基础版v2-Qwen2

20,000元/月

-

通义千问-Plus

qwen-plus

标准版

80,000元/月

160元/实例/小时

通义千问1.5-开源版-72B

qwen1.5-72b-chat

通义千问1.5-开源版-110B

qwen1.5-110b-chat

基于通义千问2-开源版-72B训练出来的模型

qwen2-72b-instruct

标准版v2-Qwen2

80,000元/月

-

通义千问-max

qwen-max

高级版

160,000元/月

320元/实例/小时

常见问题

模型推理与评测

模型推理如何预付费?

您可以购买节省计划(预付费),用于抵扣模型推理超出免费额度后产生的推理费用。节省计划用完后,系统会按照后付费的方式结算,您也可以购买多个节省计划进行抵扣。单击此处购买大语言模型推理节省计划

本次节省计划无折扣优惠,更多折扣活动敬请期待。
  • 适用范围:部分文本生成模型(通义千问、通义法睿、第三方模型中的百川-开源版和ChatGLM)以及OpenNLU模型。请在模型列表中查模型详情。

  • 使用说明:如果购买了多个节省计划,抵扣时将按节省计划到期时间的先后顺序抵扣。如果到期时间相同,先购买的节省计划先抵扣。

  • 退订规则:退订规则请提交工单进行咨询。

  • 查询节省计划账单:请参见如何查询节省计划账单

Token和字符串之间怎么换算?

Token是模型用来表示自然语言文本的基本单位,可以直观地理解为“字”或“词”。

  • 对于中文文本,1个Token通常对应一个汉字或词语。例如,“你好,我是通义千问”会被转换成['你好', ',', '我是', '通', '义', '千', '问']。

  • 对于英文文本,1个Token通常对应3至4个字母或1个单词。例如,"Nice to meet you."会被转换成['Nice', ' to', ' meet', ' you', '.']。

不同的大模型切分Token的方法可能不同。您可以使用SDK在本地查看经过通义千问模型切分后的Token数据。

查看经过通义千问模型切分后的Token数据

# 运行前请 pip install tiktoken
from dashscope import get_tokenizer  # dashscope版本 >= 1.14.0

# 获取tokenizer对象,目前只支持通义千问系列模型
tokenizer = get_tokenizer('qwen-turbo')

input_str = '通义千问具有强大的能力。'

# 将字符串切分成token并转换为token id
tokens = tokenizer.encode(input_str)
print(f"经过切分后的token id为:{tokens}。")
print(f"经过切分后共有{len(tokens)}个token")

# 将token id转化为字符串并打印出来
for i in range(len(tokens)):
    print(f"token id为{tokens[i]}对应的字符串为:{tokenizer.decode(tokens[i])}")
// Copyright (c) Alibaba, Inc. and its affiliates.
// dashscope SDK版本 >= 2.13.0
import java.util.List;
import com.alibaba.dashscope.exception.NoSpecialTokenExists;
import com.alibaba.dashscope.exception.UnSupportedSpecialTokenMode;
import com.alibaba.dashscope.tokenizers.Tokenizer;
import com.alibaba.dashscope.tokenizers.TokenizerFactory;

public class Main {
  public static void testEncodeOrdinary(){
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt ="如果现在要你走十万八千里路,需要多长的时间才能到达? ";
    // encode string with no special tokens
    List<Integer> ids = tokenizer.encodeOrdinary(prompt);
    System.out.println(ids);
    String decodedString = tokenizer.decode(ids);
    assert decodedString == prompt;
  }

  public static void testEncode() throws NoSpecialTokenExists, UnSupportedSpecialTokenMode{
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt = "<|im_start|>system\nYour are a helpful assistant.<|im_end|>\n<|im_start|>user\nSanFrancisco is a<|im_end|>\n<|im_start|>assistant\n";
    // encode string with special tokens <|im_start|> and <|im_end|>
    List<Integer> ids = tokenizer.encode(prompt, "all");
    // 24 tokens [151644, 8948, 198, 7771, 525, 264, 10950, 17847, 13, 151645, 198, 151644, 872, 198, 23729, 80328, 9464, 374, 264, 151645, 198, 151644, 77091, 198]
    String decodedString = tokenizer.decode(ids);
    System.out.println(ids);
    assert decodedString == prompt;

  }

  public static void main(String[] args) {
      try {
        testEncodeOrdinary();
        testEncode();
      } catch (NoSpecialTokenExists | UnSupportedSpecialTokenMode e) {
        e.printStackTrace();
      }
  }
}

本地运行的tokenizer可以用来估计文本的Token量,但是得到的结果不保证与模型服务端完全一致,仅供参考。如果您对通义千问的tokenizer细节感兴趣,请参见: tokenizer参考

多轮对话怎么计费?

多轮对话中,历史对话也会作为输入进行计费。

怎么增加并发量?以及大概怎么收费?

  • 按Token调用模式(即模型推理计费模式,仅适用于预置模型):目前暂不支持增加并发量。如果业务实际需要增加并发量,请先联系对接的商务同学反馈给产品团队。

  • 按独占实例部署模式:如果希望独立部署模型调用,每实例当前的并发量约为1.5。客户可以按照并发量计算,购买对应数量的独占实例。例如,客户需要3并发,则购买2个独占实例即可。目前独占实例只支持训练之后的模型以及预置模型。

创建了一个大模型应用,会收费吗?

只创建应用不会收费。但如果调用应用进行了问答,则会收取模型推理费用。

模型评测是否收费?

模型的维度管理不收费。模型评测是否产生费用取决于评测方式:

  • 对独立部署的自定义模型进行评测:不收费。

  • 对预置模型进行评测:产生模型推理费用。

模型训练

模型训练过程中因为等待时间太久,主动取消训练会产生计费么?

会,如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,百炼平台不会向您收取训练费用。

模型部署

模型部署(大模型独占实例)后,什么时候开始计费?

如果是包月预付费,购买独占实例时,就需要根据购买时长支付模型部署的费用。

如果是按量后付费,当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中欠费部署失败时,均不会计费。

如果不再继续调用独占实例部署的模型,是否可以暂停计费?

如果是包月预付费的独占实例,您只能在退订管理页面,退订独占实例。退订时,将从实付金额中扣除已消费金额,退回剩余金额。具体说明请参见退订说明

如果是按量后付费的独占实例,您可以下线模型服务。模型服务下线后,将不再产生模型部署费用。

小A在阿里云百炼平台部署了1个小时的qwen-plus模型,账单显示了一笔320元的费用。请问小A应该怎么理解费用明细?

  1. 首先,qwen-plus的1个实例部署的费用为160元/小时,正常情况下应该收费160元,但实际收取了320元。

  2. 其次,已知1个算力单元的费用为20元/小时,qwen-plus的实例部署费用为160元/小时,则qwen-plus的1个实例需要8个算力单元(160元 ÷ 20元/小时 = 8个算力单元)。

  3. 最后,实际消费320元,那么320元 ÷ 20元/小时 = 16个算力单元。由此推测,小A在部署模型时可能选择了2个实例(每个实例8个算力单元),所以导致最终收费金额为320元。

因此,小A的账单显示的320元是因为部署了2个qwen-plus实例,每个实例的费用是160元/小时。

查看账单

怎样查看上个月百炼的成本支出?

成本分析页面,成本类型选择应付金额,时间粒度选择月,时间范围选择上个月(假设为2024年08月),产品选择大模型服务平台百炼,即可查看上个月百炼的成本支出。

image

怎样查看调用模型一共花了多少钱?

成本分析页面,成本类型选择应付金额,选择时间粒度和范围(假设为2024年03月~08月),产品明细选择百炼大模型推理

image

怎样查看调用qwen-max模型花了多少钱?

明细账单页面,选择账期,选择产品明细为百炼大模型推理,然后单击搜索。在实例ID列可以找到qwen-max的input_tokens和output_tokens两个实例。将这两个实例对应的应付金额相加,即为所选账期内调用qwen-max模型所支付的费用。

image

其他

如果有抵扣券或者优惠券,产生的费用如何扣费?

阿里云扣费顺序请前往阿里云后付费账单扣款顺序查询。