ChatGLM开源双语对话语言模型
计费单元
模型服务 | 计费单元 |
ChatGLM2开源双语对话语言模型 | token |
ChatGLM3开源双语对话语言模型 |
Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。
ChatGLM2模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。
计费单价
模型服务 | 模型名 | 输入(input)价格 | 输出(output)价格 |
ChatGLM2开源双语对话语言模型 | chatglm-6b-v2 | 0.006元/1,000 tokens | 0.006元/1,000 tokens |
ChatGLM3开源双语对话语言模型 | chatglm3-6b | 限时免费中 | 限时免费中 |
免费额度
模型服务 | 模型名 | 免费额度 |
ChatGLM2开源双语对话语言模型 | chatglm-6b-v2 | / |
ChatGLM3开源双语对话语言模型 | chatglm3-6b | 限时免费中 |
基础限流
为了保证用户调用模型的公平性,默认对于普通用户设置了基础限流。如果超出限流指定的调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。
限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。
模型服务 | 模型名 | 基础限流 |
ChatGLM2开源双语对话语言模型 | chatglm-6b-v2 | 以下条件任何一个超出都会触发限流:
|
ChatGLM3开源双语对话语言模型 | chatglm3-6b | 以下条件任何一个超出都会触发限流:
|
查看账单
有关DashScope的账单时效信息请参阅产品计费。
有关账单详情请前往阿里云费用与成本查询。