产品计费
介绍通义星尘产品计费的规则。
产品计费
角色效果调试
通义星尘的网页端支持用户自主创建角色,通过聊天页面进行角色对话的效果调试。
目前网页端的对话调试功能为免费使用,不会收取任何费用。
API服务开通
服务开通入口:【星尘商品开通】
经过对话效果的调试后,您可以将对应角色能力API接入自己的应用中。通过API调用角色对话接口时,将按照计量计费规则进行计费。
您可以在角色聊天窗口里点击“API接入”按钮,查看当前角色的接入代码。
在“API接入”页面中,点击“我要开通“即可进入API服务开通页面。
开通服务后,您可以在通义星尘管控台里创建API-KEY,将示例代码中的API-KEY替换为您的API-KEY,即可进行调用。
创建API-KEY
通义星尘通过API-KEY进行调用鉴权和计量计费,可以在通义星尘官网管控台创建API-KEY。 目前仅支持阿里云主账号进行API-KEY的管理,每个主账号最多同时可拥有3个有效的API-KEY,详情可参考文档API-KEY管理。
计量计费规则
用户在通义星尘的官网页面进行角色创建及对话调试目前不会产生费用。 如需通过API接入,则开通API服务调用后将产生计量和计费,按量付费(后付费)会按照您的实际用量结算,在每个结算周期生成账单并从账户中扣除相应费用。
模型概览
模型服务 | 计费单元 | 模型简介 |
xingchen-base | Token | 通义星尘大语言模型,模型支持8k tokens上下文,限定用户输入为6.5k tokens。 |
xingchen-plus | Token | 通义星尘大语言模型增强版,模型支持8k tokens上下文,限定用户输入为6.5k tokens。 |
xingchen-plus-v2 | Token | 通义星尘大语言模型增强版,模型支持32k tokens上下文,限定用户输入为30k tokens。 |
xingchen-max | Token | 通义星尘超大规模语言模型,模型支持8k tokens上下文,限定用户输入为6.5k tokens。 |
xingchen-longcontext(开通需要走单独的白名单申请流程,通过管理员审核) | Token | 通义星尘超大规模语言模型,模型支持32k tokens上下文。 |
白名单申请:请添加通义星尘官方钉钉群找管理员进行申请。
Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个Token通常对应一个汉字;对于英文文本来说,1个Token通常对应3至4个字母。 通义星尘模型服务根据模型输入和输出的总Token数量进行计量计费。每一次模型调用产生的实际Token数量可以从 response 中获取。
计费单价
模型服务 | 计费单价 | 计费说明 |
xingchen-lite | 输入 0.002元/1000Tokens 输出 0.006元/1000 Tokens | 2024年6月7日上新 |
xingchen-base | 输入 0.004元/1000Tokens 输出 0.012元/1000 Tokens | 2024年6月7日起降价,执行新计费标准 |
xingchen-plus | 输入 0.004元/1000Tokens 输出 0.012元/1000 Tokens | 2024年6月7日起降价执行新计费标准 |
xingchen-plus-v2 | 输入 0.004元/1000Tokens 输出 0.012元/1000 Tokens | 2024年9月18日上新 |
xingchen-max | 输入 0.04元/1000Tokens 输出 0.12元/1000 Tokens | 2024年6月7日起降价,执行新计费标准 |
xingchen-longcontext | 输入/输出 0.02元/1000 Tokens | 需添加白名单后使用 |
平台服务 | 计费单价 | 计费说明 |
数字人和语音 | 限时免费 | / |
function call | 限时免费 | / |
真实信息检索 | 限时免费 | / |
知识库检索 | 限时免费 | / |
卡牌库插件 | 限时免费 | / |
长期记忆 | 限时免费 | / |
拒识插件 | 限时免费 | / |
文生图插件 | 0.16元/张 | 2024年4月23日起正式执行新计费标准 |
inputTokens输入到大模型,包含角色设置、对话历史、长期记忆检索、web检索。
免费额度
模型服务 | 免费额度 |
通义星尘 | 输入和输出共计 100万 tokens |
模型默认速率
类别 | 速率 |
每秒处理查询次数(QPS) | 1次/秒 |
每分钟处理请求数(QPM) | 60次/分 |
每分钟处理tokens数(TPM) | 1000tokens |
1、星尘目前TPM是input+output的总体。
2、星尘目前的限流是针对主账号的限制,和模型无关。
3、星尘目前模型单次发送的内容tokens限制为32000tokens。
4、星尘模型默认速率不代表上限能力,可根据您的根据实际业务需求进行调整,可向星尘官方同学了解详情。
欢迎加入「通义星尘交流钉钉群」。
调用统计和计费账单
调用统计和计量周期
通义星尘支持在管理控制台查看API调用量的计量统计信息。有关的计量以小时为周期进行汇总统计。 有关计量信息请前往管理控制台查询。
账单周期
通义星尘遵循阿里云统一出账周期和扣费规则按小时结算出账扣费,请预先保证账户余额充足,以免账户欠费影响业务。 有关账单详情请前往费用与成本查询。
合并API-KEY计费
通义星尘API服务在结算时,以主账号为账单推送对象,同一个主账号下创建的API-KEY将合并为同一个账单计费。
欠费说明
账号的可用额度(含阿里云账户余额和代金券)小于待结算的账单,即被判定为账号欠费。一旦您的账号被判定为欠费,您将无法使用通义星尘API服务,直至账号完成充值恢复正常使用状态。