文档

ChatGLM3镜像ReleaseNotes

更新时间:

ChatGLM3系列大模型镜像是AC2推出的开箱即用容器部署服务。容器镜像包含了运行ChatGLM3系列大模型所需的所有依赖,包括Python运行环境、深度学习框架以及依赖库。确保ChatGLM3系列大模型能够高效、稳定地在不同环境下部署和服务。本系列镜像不包含大模型权重文件,需用户自行下载,或使用镜像提供的下载能力下载。ChatGLM3系列大模型镜像通过Web Demo的形式对外提供服务,也可以通过将本系列镜像作为基础镜像,定制不同形式的服务提供方式。

镜像列表

ChatGLM3系列大模型镜像分为「一键部署镜像」和「运行环境镜像」,具体区别如下:

  • 运行环境镜像:仅包含运行该模型所需要的所有软件环境,包括系统组件以及Python依赖。

  • 一键部署镜像:包含运行环境、启动脚本以及Web Demo脚本。

镜像类型

支持大模型

CPU/GPU

镜像地址

运行环境镜像

ChatGLM3-6B

GPU

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/chatglm3:runtime-pytorch2.2.0.1-cuda12.1.1-alinux3.2304

ChatGLM3-6B

CPU

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/chatglm3:runtime-pytorch2.2.0.1-alinux3.2304

一键部署镜像

ChatGLM3-6B

GPU

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/chatglm3:6b-pytorch2.2.0.1-cuda12.1.1-alinux3.2304

CPU

ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/chatglm3:6b-pytorch2.2.0.1-alinux3.2304

镜像内容

  • chatglm3:runtime-pytorch2.2.0.1-cuda12.1.1-alinux3.2304

    • gradio: 3.41.0

    • sentencepiece: 0.1.99

    • safetensors: 0.4.0

    • accelerate: 0.26.1

    • transformers: 4.36.2

    • PyTorch: 2.2.0.1

    • CUDA:12.1.1

    • Python: 3.10.13

    • BaseOS: Alinux 3.2304

  • chatglm3:runtime-pytorch2.2.0.1-alinux3.2304

    • gradio: 3.41.0

    • sentencepiece: 0.1.99

    • safetensors: 0.4.0

    • accelerate: 0.26.1

    • transformers: 4.36.2

    • PyTorch: 2.2.0.1

    • Python: 3.10.13

    • BaseOS: Alinux 3.2304

  • chatglm3:6b-pytorch2.2.0.1-cuda12.1.1-alinux3.2304

    组件继承chatglm3:runtime-pytorch2.2.0.1-cuda12.1.1-alinux3.2304

  • chatglm3:6b-pytorch2.2.0.1-alinux3.2304

    组件继承chatglm3:runtime-pytorch2.2.0.1-alinux3.2304

镜像运行要求

  • chatglm3:runtime-pytorch2.2.0.1-alinux3.2304以及chatglm3:6b-pytorch2.2.0.1-alinux3.2304为CPU镜像,对驱动无要求。

  • chatglm3:runtime-pytorch2.2.0.1-cuda12.1.1-alinux3.2304以及chatglm3:6b-pytorch2.2.0.1-cuda12.1.1-alinux3.2304为GPU镜像,包含CUDA 12.1.1,需要nvidia-driver >= 530,兼容nvidia-driver R470和R525。

重要特性

部署镜像提供一键部署能力,内置运行脚本(脚本来源)。

更新记录

  • 2024.07

    发布chatglm3镜像运行环境镜像。

  • 2024.08

    发布chatglm3镜像一键部署镜像。