Tair KVCache 支持百炼模型算子或KVCache缓存加速后的自部署模型算子,根据模型类别区分价格。
具体计费规则如下:
模型类别 | 未命中缓存的输入价格(元/千Token) | 命中缓存的输入价格(元/千Token) | 输出价格(元/千Token) |
kvcache.model.t1 | 0.00036 | 0.000072 | 0.00144 |
kvcache.model.t2 | 0.0006 | 0.00012 | 0.0024 |
kvcache.model.t3 | 0.0012 | 0.00024 | 0.0048 |
kvcache.model.t4 | 0.0024 | 0.00048 | 0.0096 |
kvcache.model.t5 | 0.0036 | 0.00072 | 0.0168 |
kvcache.model.t6 | 0.0048 | 0.00096 | 0.0192 |
该文章对您有帮助吗?