大模型产品计费

开通百炼不会产生费用,调用大模型实现文本生成、图片生成、语音合成等任务时,会产生模型推理(调用)费用。此外,如果训练(调优)新模型或将模型部署到独占实例也会产生费用。

计费项

计费项

计费说明

计费方式

计费公式

大模型推理(调用)

所有模型的调用单价和免费额度,请参考模型列表

调用场景包括:模型调用应用调用模型评测Prompt 自动优化(内置为 Qwen-Plus)。

适合按使用量购买大模型推理服务的需求。

按使用量(后付费)

预付费预付费折扣信息

模型推理(调用)费用 = 模型调用消耗 × 模型推理(调用)单价

在免费额度内,实时调用不会产生费用。查看免费额度请参考新人免费额度

大模型部署

对部署后的模型进行调用和评测将不再额外收取“大模型推理(调用)”费用。

适合对大模型推理服务有低延迟、高SLA需求的场景。如果只想要增加并发量,请前往怎么增加并发量?

按时间(后付费/预付费)

模型部署费用 = 使用时长 × 实例数量 × 实例单价

支持模型丰富

按使用量(后付费)

部署费用 = 模型调用消耗 × 部署后调用单价

单价与大模型推理(调用)单价相同

大模型训练

模型调优

模型训练完成后获得的新模型必须进行大模型部署(额外收费)后才能评测和调用。

按使用量(后付费)

模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最低为 0.006元/千Token)

在开始训练前会显示预估费用和计费详情。

模型推理(调用计费

完整的模型调用价格和免费额度,请参考模型列表。详细的 RPM、TPM 等性能信息请参考限流

计费公式:

文本

文本生成费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最低为 0.0003元/千Token)

图像转成Token:每28×28像素对应一个Token;一张图最少4Token。

文本向量、多模态向量、文本分类、文本抽取、文本排序费用 = 模型输出 Token 数 × 模型单价(最低为 0.0007元/千Token)

图像

图像生成费用 = 模型输出图片张数 × 单价(最低为 0.06元/张

语音

语音合成费用 = 输入字符数 × 单价(最低为 1元/万字符

根据待合成字符数计费(其中1个汉字算2个字符,英文、标点符号、空格均按照1个字符计费)。

语音识别(实时)费用 = 语音时间 × 单价(最低为 0.00008元/秒

视频

视频合成大模型调用需要进行模型部署,部署后调用不收费,仅收取部署费用。详情请参考模型部署计费(最低为20元/实例/小时)

免费额度

如何获取免费额度以及如何查看剩余免费额度请参考新人免费额度

预付费(节省计划)

您可以购买节省计划(预付费),用于抵扣模型推理超出免费额度后产生的推理费用。节省计划用完后,系统会按照后付费的方式结算,您也可以购买多个节省计划进行抵扣。

image

  • 适用范围:通义千问、通义法睿、百川-开源版、ChatGLM以及OpenNLU模型。请前往模型列表获取完整的模型的调用价格和免费额度。

  • 使用说明:如果购买了多个节省计划,抵扣时将按节省计划到期时间的先后顺序抵扣。如果到期时间相同,先购买的节省计划先抵扣。

  • 退订规则:退订规则请提交工单进行咨询。

  • 查询节省计划账单:请参考如何查询节省计划账单

旗舰模型

其他模型的调用价格和免费额度,请参考模型列表

旗舰模型

通义new 通义千问-Max

适合复杂任务,推理能力最强

通义new 通义千问-Plus

效果、速度、成本均衡

通义new 通义千问-Turbo

适合简单任务,速度快、成本低

通义new Qwen-Long

支持长达千万字文档,成本低

API调用模型名

(稳定版本)

qwen-max

qwen-plus

qwen-turbo

qwen-long

最大上下文长度

(Token数)

32,768

131,072

1,000,000

10,000,000

最低输入价格

(每千Token)

0.02

0.0008

0.0003

0.0005

最低输出价格

(每千Token)

0.06

0.002

0.0006

0.002

Batch 调用减免

通义千问模型qwen-max、qwen-plus、qwen-turbo、qwen-long、qwen-vl-max、qwen-vl-plus,qwq-32b-preview支持 Batch调用,调用费用为实时调用的 50%。免费额度不支持抵扣Batch调用产生的费用。

您可以通过文件方式提交批量任务,任务将异步执行,系统将在任务执行完成或设置的最长等待时间到达后返回任务执行结果。在任务运行结束前,您可以通过API进行任务状态查询,当任务结束后,可以通过API获取结果。使用详情请参考OpenAI Batch 接口调用

模型评测计费

模型评测是否产生费用取决于评测的对象:

  • 对已经部署的模型进行评测:只收取模型部署费用,评测不额外收费。

  • 对其他模型进行评测:按照 Token 消耗量计费。

模型部署计费

按时间

按时间计费方式都支持手动扩缩容,灵活调整并发量。

  • 按使用时长计费的计费粒度更小(小时),使用灵活。

  • 包月计费的计费周期长(天),但更加便宜(7折)。

计费方式

计费公式

按使用时长计费/后付费

费用 = 使用时长(小时)× 实例数量 × 模型对应的实例单价(不满1小时按1小时计费)

部署前可以在模型部署控制台查看不同模型的预估每小时费用。

包月计费/预付费

费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价

购买实例:请前往模型部署控制台(点击右上角的资源池管理)购买。

退订实例:请前往退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费)

模型服务

独占实例资源规格

实例单价(后付费,按量)

实例单价(预付费,包月)

悦动人像EMO-detect-deployment

轻量版

20元/实例/小时

10,000元/月

悦动人像EMO-deployment

舞动人像AnimateAnyone-detect

舞动人像AnimateAnyone

通义万相-文本生成图像-0521

通义千问-Turbo

基础版

40元/实例/小时

20,000元/月

通义千问1.5-开源版-7B

通义千问1.5-开源版-14B

基于通义千问2-开源版-7B训练出来的模型

基础版v2-Qwen2

-

20,000元/月

通义千问-Plus

标准版

160元/实例/小时

80,000元/月

通义千问1.5-开源版-72B

通义千问1.5-开源版-110B

基于通义千问2-开源版-72B训练出来的模型

标准版v2-Qwen2

-

80,000元/月

通义千问-Max

高级版

320元/实例/小时

160,000元/月

基于通义千问VL-Plus训练出来的模型

-

40元/实例/小时

-

基于通义千问VL-Max-0201训练出来的模型

-

160元/实例/小时

-

当模型完成部署,即状态为“运行中”时,开始收取模型部署的费用。模型状态为“部署中”、“欠费”、“部署失败”时,均不会计费。

如果是包月预付费,模型状态为“运行中”后,开始消耗包月时间。

模型部署后性能参考

(由于 QPM 受调用的 Token 长度影响较大,仅供参考)

模型名称

每实例参考处理能力

qwen-plus

70 QPM

按调用量

根据模型推理产生的 Token 量计费(后付费)调用价格很低。而如果需要进一步增加并发量,需要部署后在模型部署控制台手动申请,平台会进行人工审批。

计费方式

计费公式

Token 调用计费/后付费(按 Token 调用量)

费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价

image

支持的自定义模型

重要

一个模型是可以在百炼的“模型调优”中进行重复训练的。

只有在基于以下基础模型,且只进行一次“SFT高效训练”后获得的自定义模型,才支持按调用量计费。

基础模型

输入单价

输出单价

通义千问 2.5-开源版-72B

0.004元/千Token

0.012元/千Token

通义千问 2.5-开源版-32B

0.0035元/千Token

0.007元/千Token

通义千问 2.5-开源版-14B

0.002元/千Token

0.006元/千Token

通义千问 2.5-开源版-7B

0.001元/千Token

0.002元/千Token

通义千问 2-开源版-7B

0.001元/千Token

0.002元/千Token

模型训练计费(模型调优)

计费方式

计费公式

后付费(按量)

模型训练费用 = (训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价

您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价

模型服务

模型规格

价格

通义千问2.5-开源版-72B

qwen2.5-72b-instruct

0.15元/千Token

通义千问2-开源版-72B

qwen2-72b-instruct

通义千问1.5-开源版-72B

qwen1.5-72b-chat

通义千问-开源版-72B

qwen-72b-chat

通义千问-Plus-0723

qwen-plus-0723

通义千问VL-Max-0201

qwen-vl-max-0201

通义千问2.5-开源版-32B

qwen2.5-32b-instruct

0.03元/千Token

通义千问2.5-开源版-14B

qwen2.5-14b-instruct

通义千问1.5-开源版-14B

qwen1.5-14b-chat

通义千问-开源版-14B

qwen-14b-chat

通义千问-Plus

qwen-plus

通义千问Turbo

qwen-turbo

通义千问-Turbo-0624

qwen-turbo-0624

通义千问VL-Plus

qwen-vl-plus

通义千问2.5-开源版-7B

qwen2.5-7b-instruct

0.006元/千Token

通义千问2-开源版-7B

qwen2-7b-instruct

通义千问1.5-开源版-7B

qwen1.5-7b-chat

通义千问-开源版-7B

qwen-7b-chat

计费常见问题

如何付费?

使用时发生余额不足、欠费等情况请直接前往费用与成本页面充值需要的金额。

预付费方法:

如何计算 Token 数?

Token是模型用来表示自然语言文本的基本单位,可以直观地理解为“字”或“词”。

  • 对于中文文本,1Token通常对应一个汉字或词语。例如,“你好,我是通义千问”会被转换成['你好', ',', '我是', '通', '义', '千', '问']。

  • 对于英文文本,1Token通常对应34个字母或1个单词。例如,"Nice to meet you."会被转换成['Nice', ' to', ' meet', ' you', '.']。

不同的大模型切分Token的方法可能不同。您可以使用SDK在本地查看经过通义千问模型切分后的Token数据。

查看经过通义千问模型切分后的Token数据

# 运行前请 pip install tiktoken
from dashscope import get_tokenizer  # dashscope版本 >= 1.14.0

# 获取tokenizer对象,目前只支持通义千问系列模型
tokenizer = get_tokenizer('qwen-turbo')

input_str = '通义千问具有强大的能力。'

# 将字符串切分成token并转换为token id
tokens = tokenizer.encode(input_str)
print(f"经过切分后的token id为:{tokens}。")
print(f"经过切分后共有{len(tokens)}个token")

# 将token id转化为字符串并打印出来
for i in range(len(tokens)):
    print(f"token id为{tokens[i]}对应的字符串为:{tokenizer.decode(tokens[i])}")
// Copyright (c) Alibaba, Inc. and its affiliates.
// dashscope SDK版本 >= 2.13.0
import java.util.List;
import com.alibaba.dashscope.exception.NoSpecialTokenExists;
import com.alibaba.dashscope.exception.UnSupportedSpecialTokenMode;
import com.alibaba.dashscope.tokenizers.Tokenizer;
import com.alibaba.dashscope.tokenizers.TokenizerFactory;

public class Main {
  public static void testEncodeOrdinary(){
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt ="如果现在要你走十万八千里路,需要多长的时间才能到达? ";
    // encode string with no special tokens
    List<Integer> ids = tokenizer.encodeOrdinary(prompt);
    System.out.println(ids);
    String decodedString = tokenizer.decode(ids);
    assert decodedString == prompt;
  }

  public static void testEncode() throws NoSpecialTokenExists, UnSupportedSpecialTokenMode{
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt = "<|im_start|>system\nYour are a helpful assistant.<|im_end|>\n<|im_start|>user\nSanFrancisco is a<|im_end|>\n<|im_start|>assistant\n";
    // encode string with special tokens <|im_start|> and <|im_end|>
    List<Integer> ids = tokenizer.encode(prompt, "all");
    // 24 tokens [151644, 8948, 198, 7771, 525, 264, 10950, 17847, 13, 151645, 198, 151644, 872, 198, 23729, 80328, 9464, 374, 264, 151645, 198, 151644, 77091, 198]
    String decodedString = tokenizer.decode(ids);
    System.out.println(ids);
    assert decodedString == prompt;

  }

  public static void main(String[] args) {
      try {
        testEncodeOrdinary();
        testEncode();
      } catch (NoSpecialTokenExists | UnSupportedSpecialTokenMode e) {
        e.printStackTrace();
      }
  }
}

本地运行的tokenizer可以用来估计文本的Token量,但是得到的结果不保证与模型服务端完全一致,仅供参考。如果您对通义千问的tokenizer细节感兴趣,请参考: tokenizer参考

多轮对话怎么计费?

在多轮对话中,历史对话的输入输出都会作为新一轮的模型输入 token 进行计费。

怎么增加并发量?

如果您需要进一步提高模型的RPMTPM,请通过邮箱申请,告知uid、期望申请的模型和RPMTPM,请邮件联系:modelstudio@service.aliyun.com。

如果是独立部署的模型,部署完成后控制台有按钮可以操作扩容,详情请查看模型部署

大模型应用会收费吗?

只创建应用不会收费。但如果调用应用进行了问答,则会根据调用的模型类型收取模型调用费用。

取消模型训练会收费么?

,如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,百炼平台不会向您收取训练费用。

模型部署什么时候开始计费?

当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中欠费部署失败时,均不会计费。

如果是包月预付费,模型状态为运行中后,开始消耗包月时间。

模型部署是否可以暂停计费?

没有暂停计费的方法,但你可以通过以下方式终止计费:

包月预付费实例,在退订管理页面,退订实例。退订时,将从实付金额中扣除已消费金额,退回剩余金额。具体说明请参考退订说明

按小时、按调用量后付费的实例,您可以下线模型服务。模型服务下线后,将不再产生模型部署费用。

账单常见问题

查看百炼的成本支出

成本分析页面,成本类型选择应付金额,时间粒度选择月,时间范围选择上个月(假设为202408月),产品选择大模型服务平台百炼,即可查看上个月百炼的成本支出。

image

查看模型推理总花费

成本分析页面,成本类型选择应付金额,选择时间粒度和范围(假设为202403月~08月),产品明细选择大模型推理

image

查看具体模型的推理花费

以模型 qwen-max 为例。在费用与成本页面,选择账期,选择产品明细为大模型推理,然后单击搜索。在实例ID列可以找到qwen-maxinput_tokensoutput_tokens两个实例。将这两个实例对应的应付金额相加,即为所选账期内调用qwen-max模型所支付的费用。

实例ID字段内容依次为:ApiKeyId,WorkspaceId,ModelName,AmountTypeSource。

image

如何根据明细账单进行分账?

比如可以通过业务空间、apikeyid、模型名称等内容,进行分账。

您可以前往百炼API Key管理查看API KeyApiKeyId的对应关系。

202497日以后产生的账单,可通过实例ID信息进行分账,其中实例ID中包含的信息是:ApiKeyId、业务空间ID、模型名称、输入/输出类型、调用渠道。可以通过下载账单表格,按照类型分账进行数据分析和汇总。

如果您的实例ID中没有包含ApiKeyId,则表示该收费项是通过控制台调用产生的。

image

抵扣券或者优惠券相关

如果有抵扣券或者优惠券,产生的费用如何扣费?

阿里云扣费顺序请前往阿里云后付费账单扣款顺序查询。

相关文档

如何获取免费额度、如何查看免费额度用量,请参考新人免费额度