Mooncake镜像ReleaseNotes

更新时间:
复制为 MD 格式

Mooncake是一款高性能的分布式KV缓存系统,专为大规模LLM推理优化。本系列镜像集成了Mooncake Transfer Engine、SGLangvLLM等核心推理组件,支持高效的模型服务部署。

镜像列表

发布日期

镜像地址

2026 年 1 月

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/mooncake:0.3.8-sglang0.5.7-vllm0.13.0-pytorch2.9.1-cuda12.9.1-py312-ubuntu24.04

2025 年 12 月

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/mooncake:0.3.7.post2-sglang0.5.5.post3-vllm0.11.0-pytorch2.8.0-cuda12.9.1-py312-ubuntu24.04

版本发布纪要

Mooncake 0.3.8(202601月度镜像)

  • 发布日期:20261

  • 镜像地址:ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/mooncake:0.3.8-sglang0.5.7-vllm0.13.0-pytorch2.9.1-cuda12.9.1-py312-ubuntu24.04

核心更新

核心组件更新至上游最新版本。新增etcd集成,方便开发者使用Mooncake。

  • 组件更新

    • Mooncake:0.3.7.post2 → 0.3.8

    • SGLang:0.5.5.post3 → 0.5.7

    • vLLM:0.11.0 → 0.13.0

    • PyTorch:2.8.0 → 2.9.1

    • ERDMA:51.2 → 56.2

  • 新增组件

    • etcd:3.6.7

组件版本

组件

版本

Mooncake Transfer Engine

0.3.8

SGLang

0.5.7

sgl-kernel

0.3.20

sgl-model-gateway

0.3.0

vLLM

0.13.0

PyTorch

2.9.1

CUDA

12.9.1

NVSHMEM

3.4.5-1

ERDMA

56.2-1.0.1

DeepEP

9af0e0d

etcd

3.6.7

Python

3.12

Base OS

Ubuntu 24.04

Mooncake 0.3.7.post2(202512月度镜像)

  • 发布日期:202512

  • 镜像地址:ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/mooncake:0.3.7.post2-sglang0.5.5.post3-vllm0.11.0-pytorch2.8.0-cuda12.9.1-py312-ubuntu24.04

核心更新

首版Mooncake月度镜像,支持SGLang、vLLM推理引擎,并使能阿里云eRDMA能力。核心组件跟随上游最新版本。

组件版本

组件

版本

Mooncake Transfer Engine

0.3.7.post2

SGLang

0.5.5.post3

sgl-kernel

0.3.17.post1

vLLM

0.11.0

PyTorch

2.8.0

CUDA

12.9.1

NVSHMEM

3.4.5-1

ERDMA

51.2-1.0.1

DeepEP

9af0e0d

Python

3.12

Base OS

Ubuntu 24.04

镜像声明

  1. Mooncake镜像按月更新,组件使用上游社区最新兼容版本;

  2. Mooncake镜像组件均来自上游社区,AC2不承诺组件功能与性能保障。