产品计费
本文档介绍阿里云百炼大模型服务平台的计费模式、类型和整体计费报价单。
计量计费规则
阿里云百炼大模型服务平台在调用API后将产生计量和计费。各个领域的模型采用不同的计量单元,不同模型单独制定各自的计费单价和免费额度等规则。
模型调用API的计量单元和计费单价是根据所调用的模型具体决定的。不同的模型会根据模型的特性采用不同的计量单元,比如大语言类模型大多采用输入输出的token数进行计量,语音识别类模型采用输入语音文件时长进行计量。
阿里云百炼计费项分为三大类:
模型推理计费项
模型训练计费项
模型部署计费项
免费额度说明
阿里云百炼大模型服务平台面向新用户根据不同的模型实行不同的免费额度规则。
开通即赠送限时限量免费推理资源:适用于不同类型模型,详情请点击模型广场查看。
定价清单
模型推理计费
通义千问系列
定价对象 | 规格 | 详情 | 价格(单位:元) | 计费模式 | 上线时间 |
大模型调用节省计划 | qwen-turbo qwen-plus | 节省计划可抵扣 qwen-turbo、qwen-plus的推理费用。享受最低9折的优惠。具体折扣见购买页,点击购买页面查看节省计划。 | ¥100、¥1000、¥5000、¥20000 (不同金额对应的折扣不同,具体以购买页为准) | 预付费 | 已上线 |
大模型调用 | qwen-turbo | 提供 qwen-turbo的推理服务 | ¥0.008/1,000 tokens | 后付费 | 已上线 |
qwen-plus | 提供qwen-plus的推理服务 | ¥0.02/1,000 tokens | 后付费 | 已上线 | |
qwen-max | 提供qwen-max的推理服务 | ¥0.12/1,000 tokens | 后付费 | 已上线 | |
qwen-max-0403 | 已上线 | ||||
qwen-max-0107 | 已上线 | ||||
qwen-max-longcontext | 已上线 | ||||
qwen-vl-plus | 提供qwen-plus的推理服务 | 0.008元/1,000 tokens | 后付费 | 已上线 | |
qwen-vl-max | 提供qwen-max的推理服务 | 0.02元/1,000 tokens | 后付费 | 已上线 |
通义千问开源系列
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
通义千问VL | qwen-vl-v1 | 限时免费中 | 后付费 | 已上线 |
qwen-vl-chat-v1 | ||||
通义千问72B | qwen-72b-chat | 0.02元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-72b-chat | ||||
通义千问32B | qwen1.5-32b-chat | 限时免费中 | 后付费 | 已上线 |
通义千问14B | qwen-14b-chat | 0.008元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-14b-chat | ||||
通义千问7B | qwen-7b-chat | 0.006元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-7b-chat | ||||
通义千问1.8B | qwen-1.8b-chat | 限时免费中 | 后付费 | 已上线 |
通义万相
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
通义万相-文本生成图像 | wanx-v1 | 0.16元/张 | 后付费 | 已上线 |
通义万相-人像风格重绘 | wanx-style-repaint-v1 | 0.12元/张 | ||
通义万相-图像背景生成 | wanx-background-generation-v2 | 0.08元/张 | ||
通义万相-涂鸦作画 | wanx-sketch-to-image-lite | 0.06元/张 |
语音合成
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
Sambert系列模型 | 1元/万字 | 后付费 | 已上线 |
语音识别
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
录音文件识别 | paraformer-v1 | 0.00008元/秒 | 后付费 | 已上线 |
paraformer-8k-v1 | ||||
paraformer-mtl-v1 | ||||
实时语音识别 | paraformer-realtime-v1 | 0.00024元/秒 | 后付费 | 已上线 |
paraformer-realtime-8k-v1 |
通用文本向量模型
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
通用文本向量 | text-embedding-v1 | 0.0007元/1000 tokens | 后付费 | 已上线 |
text-embedding-async-v1 | ||||
text-embedding-v2 | ||||
text-embedding-async-v2 |
文本理解模型
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
OpenNLU开放域文本理解模型 | opennlu-v1 | 0.00465元/1000 tokens | 后付费 | 已上线 |
多模态文生图
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
StableDiffusion文生图模型 | stable-diffusion-xl | 限时免费中 | 后付费 | 已上线 |
stable-diffusion-v1.5 | ||||
Wordart文字纹理生成API | wordart-texture | 0.08元/张 | 后付费 | |
Wordart文字变形API | wordart-semantic | 0.24元/张 | ||
FaceChain人物图像检测 | facechain-facedetect | 限时免费中 | 后付费 | |
FaceChain人物形象训练 | facechain-finetune | 2.5元/次 | 后付费 | |
FaceChain人物写真生成 | facechain-generation | 0.18元/张 | 后付费 |
多模态向量表征模型
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
ONE-PEACE多模态向量表征 | multimodal-embedding-one-peace-v1 | 限时免费中 | 限时免费中 | 已上线 |
三方开源大语言模型
模型服务 | 规格 | 价格(单位:元) | 计费模式 | 上线时间 |
LLaMa3 大语言模型 | llama3-8b-instruct | 限时免费中 | ||
llama3-70b-instruct | ||||
LLaMa2 大语言模型 | llama2-7b-chat-v2 | 后付费 | 已上线 | |
llama2-13b-chat-v2 | ||||
百川模型2-13B对话版 | baichuan2-13b-chat-v1 | 0.008元/1,000 tokens | 后付费 | 已上线 |
百川模型2-7B对话版 | baichuan2-7b-chat-v1 | 0.006元/1,000 tokens | ||
百川模型1 | baichuan-7b-v1 | 限时免费中 | 后付费 | 已上线 |
ChatGLM2开源双语对话语言模型 | chatglm-6b-v2 | 0.006元/1,000 tokens | 后付费 | 已上线 |
ChatGLM3开源双语对话语言模型 | chatglm3-6b | 限时免费中 | 后付费 | 已上线 |
姜子牙通用大模型V1 | ziya-llama-13b-v1 | 限时免费中 | 后付费 | 已上线 |
Dolly开源大语言模型 | dolly-12b-v2 | 限时免费中 | 后付费 | 已上线 |
BELLE开源中文对话大模型 | belle-llama-13b-2m-v1 | 限时免费中 | 后付费 | 已上线 |
MOSS开源对话语言模型 | moss-moon-003-sft | 限时免费中 | 后付费 | 已上线 |
moss-moon-003-base | 限时免费中 | 后付费 | ||
元语功能型对话大模型V2 | chatyuan-large-v2 | 限时免费中 | 后付费 | 已上线 |
BiLLa开源推理能力增强模型 | billa-7b-sft-v1 | 限时免费中 | 后付费 | 已上线 |
通义千问大模型训练计费
定价对象 | 规格 | 详情 | 价格(单位:元) | 计费模式 | 上线时间 |
大模型训练 | qwen-turbo | 自助训练&定制费用 (Finetune &Continue Pre-training) | ¥0.03/1,000 tokens | 后付费 | 已上线 |
通义千问大模型部署计费
模型部署实例时,支持选择独占实例数进行实例部署。实例是由算力单元组成。不同模型的实例对应的算力单元不同。其中1个算力单元的价格是20元/小时。
qwen-turbo:1个实例=2个算力单元=20*2=40元/小时。
qwen-plus:1个实例=8个算力单元=20*8=160元/小时。
qwen-max:1个实例=16个算力单元=20*16=320元/小时
不同模型对应的算力单元数不同,详细内容请在模型部署控制台页面查看。
定价对象 | 规格 | 详情 | 价格(单位:元) | 计费模式 | 上线时间 |
大模型独占实例 | qwen-turbo | 基础大模型支持选择独占实例;训练出来的专属大模型必须独占实例。 | ¥20,000.00/月 | 预付费 | 已上线 |
¥40/实例/小时 | 后付费 | 已上线 | |||
qwen-plus | 基础大模型支持选择独占实例;训练出来的专属大模型必须独占实例。 | ¥80,000.00/月 | 预付费 | 已上线 | |
¥160/实例/小时 | 后付费 | 已上线 | |||
qwen-max | 基础大模型支持选择独占实例;训练出来的专属大模型必须独占实例。 | ¥160,000.00/月 | 预付费 | 已上线 | |
¥320/实例/小时 | 后付费 | 已上线 |
问题示例:
小A在阿里云百炼平台部署了1个小时的qwen-plus模型,其中账单显示花费了320元,请问小A应该怎么理解费用明细?
解答:
(1)首先qwen-plus一个实例部署的费用为160元/小时,正常情况下应该收费160元,但实际收取了320元;
(2)其次我们知道1个算力单元为20元/小时,并且qwen-plus的实例部署费用为160元/小时,则qwen-plus的1个实例=8个算力单元。
(3)最后实际消费320元,那么320/20=16个算力单元,此时可能是小A在部署模型时勾选了实例数为2,所以导致最终收费金额为320元。
1.“通义千问-Max”更名为“qwen-max”、“通义千问-Turbo”更名为“qwen-turbo”、“通义千问-Plus”更名为“qwen-plus”、“通义千问-摘要增强版”更名为“bailian-summary”、“通义千问-开源版-72B”更名为“qwen-72b-chat”、“通义千问-开源版-14B”更名为“qwen-14b-chat”、“通义千问-开源版-7B”更名为“qwen-7b-chat”、“通义千问-开源版-1.8B-长文本”更名为“qwen-1.8b-longcontext-chat”、“通义千问-Max-长文本”更名为“qwen-max-longcontext”、“通义千问-开源版-1.8B”更名为“qwen-1.8b-chat”。
2.调整后的单价将于2024年3月18日生效,请届时关注账单情况。
通义千问大模型推理调用节省计划
节省计划:面向通义千问系列大模型Turbo和Plus规格推出的预付费推理资源包。
优惠力度:选择不同的预付费金额享受不同的折扣力度。目前共提供4档折扣分别对应:
对应折扣 | 预付费金额区间 |
98折 | 100~900元 |
95折 | 1000~4000元 |
92折 | 5000~19000元 |
9折 | 20000~30000元 |
适用范围:通义千问大模型qwen-turbo、qwen-plus。
生效时间:下单后立即生效。
有效期时长:默认1年,有效期从订购生效开始计算。
适用对象:所有新老用户都可以参与。
以上内容是大模型调用节省计划的说明,如有问题您可以通过提交工单反馈,会有对应专员为您处理。
常见问题
当前如何开通开单?
模型训练过程中因为等待时间太久,主动取消训练会产生计费么?
会的,模型训练主动取消已经发生的费用还是会推送账单给您,如果是因为训练失败终止,不会产生计费。
发起模型部署(大模型独占实例)时,一般会有几种状态,分别代表什么意思?
状态
操作
计费情况
部署中
查看
此状态不计费
运行中
查看、扩缩容、下线
此状态持续计费,点击下线后部署任务消失,停止计费
欠费停服
查看、删除
此状态不计费,欠费状态不会持续计费,但充值后,模型将恢复服务,自动恢复后将开始计费,点击删除后部署任务消失,不再计费
欠费恢复中
查看
此状态不计费,表示账户已充值,系统自动恢复服务中,服务恢复后,状态变换为运行中将恢复计费
部署失败
查看、删除、重新部署
此状态不计费,重新部署成功后变为运行中状态将进行计费,点击删除后部署任务消失,不再计费
部署环节过程中,如果您不想继续部署服务,是否可以暂停?是否有页面引导?
当状态为部署中时,可以点击下线/删除按钮,下线=删除。
模型评测是否会产生计费?
模型的维度管理不收费,模型评测如果是通过独立部署完成,不收费;如果是基础大模型,会产生计费。
Token是怎么计算的?
Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字/词语;对于英文文本来说,1个token通常对应3至4个字母或1个单词。例如,中文文本“你好,我是通义千问”会被转换成序列['你好', ',', '我是' , '通', '义', '千', '问'],而英文文本"Nice to meet you."则会被转换成['Nice', ' to', ' meet', ' you', '.']。
通义千问模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从response中获取。
模型训练过程中如果调整过Epoch参数值,训练过程中的计费逻辑是怎么算的?
设置Epoch参数后训练Tokens量预估计算口径:训练数据量xEpoch参数x0.1/1000,由于训练过程有一定代码参与,会额外增加少量toknes(预估不到10%)。Epoch为模型学习全量数据次数,设置越大,训练总Tokens量越大,实际训练Tokens总量在训练完成后会体现。
怎么扩并发量?以及大概怎么收费?
按tokens调用模式:
目前暂不支持扩并发,如果业务实际需要扩并发,请先联系对接商务同学反馈产品团队。
按独占实例部署模式:
如果客户希望独立部署模型调用,每实例当前的并发约1.5,客户可以按照并发量进行计算,并购买对应数量的独占实例。目前独占实例只支持训练之后的模型以及基础版模型。比如客户需要3并发,那购买2个独占实例即可。
如果有抵扣券或者优惠券,产生的费用如何扣费?
阿里云扣费顺序请前往阿里云后付费账单扣款顺序查询。
怎么查看后付费的账单?
有关账单详情请前往阿里云用户中心查询。
什么是节省计划?
节省计划可抵扣 qwen-turbo、qwen-plus的推理费用。享受最低9折的优惠。具体折扣见购买页,点击购买页面查看节省计划。
怎么查看已开通的节省计划?
点击阿里云账号的用户中心-节省计划可以查看开通及使用情况。
- 本页导读 (1)