模型在线服务PAI-EAS挂载NAS存储

本文以使用模型在线服务PAI-EAS部署Stable-Diffusion-WebUI为例,为您介绍如何将NAS挂载至阿里云模型在线服务(PAI-EAS)上,并存储WebUI进行AI绘画后生成的各类结果。

背景信息

阿里云模型在线服务PAI-EAS(Elastic Algorithm Service)是一种模型在线服务平台,可支持您一键部署模型为在线推理服务或AI-Web应用。它提供的弹性扩缩容和蓝绿部署等功能,可以支撑您以较低的资源成本获取高并发且稳定的在线算法模型服务。

阿里云文件存储NAS是一种分布式的网络文件存储,为ECS、HPC、Docker、BatchCompute等提供安全、无限容量、高性能、高可靠、简单易用的文件存储服务。阿里云NAS支持与阿里云模型在线服务PAI-EAS无缝集成。这使您的模型服务可以像访问本地文件系统一样访问存储在其中一个NAS文件系统上的文件。您需要配置NAS的地域、挂载点等信息。配置成功后,模型服务就可以像访问本地文件系统一样访问指定的NAS文件系统。

Stable Diffusion(简称SD)是一个可通过文本生成图像的扩散模型,基于CLIP模型从文字中提取隐变量,并通过UNet模型生成图片;最后通过逐步扩散、逐步处理图像,优化图像质量。

重要
  • 阿里云不对第三方模型的合法性、安全性、准确性进行任何保证,阿里云不对由此引发的任何损害承担责任。

  • 您应自觉遵守第三方模型的用户协议、使用规范和相关法律法规,并就使用第三方模型的合法性、合规性自行承担相关责任。

费用说明

  • 使用PAI-EAS服务,将根据资源组类型及系统盘收取费用。更多信息,请参见模型在线服务(EAS)计费说明

  • 使用NAS文件系统,将根据文件系统类型、存储容量及时长收取文件存储费用,建议搭配NAS资源包使用。更多计费信息,请参见计费概述

前提条件

步骤一:创建文件系统

本文以创建容量型文件系统为例。

  1. 登录NAS控制台

  2. 概览页面的文件系统选型指南表格中,单击通用型NAS下方的创建

  3. 创建面板,配置以下参数。

    参数

    说明

    地域

    必须与待挂载文件系统的服务在同一地域。本教程以新加坡地域为例。

    可用区

    请务必选择交换机所在的可用区,避免跨可用区产生时延。

    存储规格

    容量型

    协议类型

    NFS

    回收站

    建议启用,开启回收站后,被删除的文件或目录将暂存在回收站中,有效避免误删。

    生命周期管理

    请根据业务场景按需配置。建议不启用。

    加密类型

    不加密。

    数据备份

    不启用。

    挂载点类型

    专有网络。

    专有网络VPC

    在下拉框中选择已创建的VPC。

    虚拟交换机

    选择VPC下创建的交换机。

  4. 单击立即购买,根据页面提示,完成购买。

步骤二:在PAI服务中挂载NAS

  1. 登录PAI控制台

  2. 在顶部菜单栏,选择新加坡地域。

  3. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击任意一个工作空间名称,进入对应工作空间内。如果没有可用的工作空间,请创建工作空间

  4. 在工作空间页面的左侧导航栏选择模型部署 > 模型在线服务(EAS),进入模型在线服务(EAS)页面。

  5. 推理服务页签下单击部署服务,选择自定义部署,在新建服务模式下配置以下关键参数,其余参数取默认:

    参数

    示例值

    说明

    模型服务信息

    服务名称

    sd_nas

    自定义服务名称,在同一个地域下,全局唯一。

    部署方式

    镜像部署AI-Web应用

    服务的部署方式。

    镜像选择

    • 镜像类型:PAI平台镜像

    • 镜像名称:stable-diffusion-webui

    • 镜像版本:选择最新集群版本

    选择SD WebUI的镜像,本方案以部署集群版模型服务为例。

    选中阅读并同意PAI服务专用协议

    模型配置

    • 挂载类型:NAS挂载

    • NAS 挂载点:选择步骤一创建的文件系统

    • NAS 源路径:/

    • 挂载路径:/code/stable-diffusion-webui/data-nas

    单击填写模型配置,选择挂载的共享存储、挂载点和挂载路径。

    运行命令

    • 运行命令:./webui.sh --listen --port 8000 --skip-version-check --no-hashing --no-download-sd-model --skip-install --api --filebrowser --cluster-status --sd-dynamic-cache --data-dir /code/stable-diffusion-webui/data-nas

    • 端口号:8000

    完成上述配置后,系统将自动生成相应的运行命令。

    • 使用NAS挂载后,需要在运行命令中增加命令:--data-dir /code/stable-diffusion-webui/data-nas

    • (可选)您也可以在运行命令中增加参数--blade来开启blade加速,以提升出图速度。更多参数说明,请参见附录

    资源部署信息

    资源组种类

    公共资源组

    选择用于部署和运行服务的资源。

    实例数

    1

    服务实例数。

    资源配置方法

    常规资源配置

    本方案选择常规资源配置

    资源配置选择

    • 资源类型:GPU

    • 实例规格:ecs.gn6i-c16g1.4xlarge

    建议使用GPU类型,例如选择规格为ecs.gn6i-c16g1.4xlarge

    专有网络配置(自动匹配)

    VPC

    选择与NAS相同的VPC和交换机。

    交换机

    安全组名称

    系统将自动匹配与NAS一致的安全组,无需额外配置。

    完成上述配置后,在对应配置编辑区域会自动生成对应的JSON文件。

  6. 单击部署,大约等待5~10分钟后即可完成模型部署。

步骤三:启动WebUI,切换不同的模型进行模型推理

  1. 找到您刚创建的服务,单击服务方式列的查看Web应用

  2. WebUI页面,进行模型推理验证。

    在文生图页签提示词(Prompt)区域,自定义输入内容,单击生成,即可开启您的AIGC之旅。

    例如,在提示词(Prompt)区域输入cute dog,pink,单击生成,推理结果类似如图所示。

    image.png

后续操作

  • 释放PAI-EAS资源

    如果无需继续使用EAS服务,您可以按照以下操作步骤删除模型服务。

    1. 登录PAI控制台

    2. 在顶部菜单栏,选择地域。

    3. 在左侧导航栏,选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面。

    4. 推理服务页面,单击目标服务操作列下的删除,删除模型服务。

  • 释放NAS资源

    如果无需继续使用NAS服务,您可以按照以下操作步骤删除文件系统。

    重要

    删除文件系统后,存储在文件系统中的数据将被删除且无法恢复,请在删除前确认数据已不再使用。如果需要继续使用文件系统中的数据,请提前迁移数据。关于迁移数据的更多信息,请参见迁移说明

    1. 登录NAS控制台

    2. 在顶部菜单栏,选择地域。

    3. 在左侧导航栏,选择文件系统>文件系统列表

    4. 在文件系统列表页面,单击目标服务操作列下的icon-扩展.png图标 > 删除

    5. 删除文件系统对话框,确认待删除的文件系统名称,单击确定

      当通用型NAS文件系统有关联资源或配置时(例如,挂载点、生命周期策略、日志转储任务、生命周期取回任务、回收站),需要在删除文件系统对话框中先清除这些资源和配置,然后单击删除

      重要

      删除文件系统后,存储在文件系统中的数据将被删除且无法恢复,请在删除前确认数据已不再使用。如果需要继续使用文件系统中的数据,请提前迁移数据。关于迁移数据的更多信息,请参见迁移说明

      删除文件系统实例成功后,即表示下一个账期不产生扣费。