阿里云系统运维管理(OOS)的公共扩展功能为您提供了一键部署OpenWebUI+Ollama的便捷方案,在ECS上成功部署OpenWebUI+Ollama后,您可以更加便捷地部署QwQ-32B模型。
背景信息
QwQ-32B模型:阿里云发布的QwQ-32B模型通过强化学习大幅提升了模型的推理能力,该模型数学代码等核心指标(例如AIME 24/25和livecodebench)、部分通用指标(例如IFEval和LiveBench等)均达到了DeepSeek-R1满血版水平,同时,各指标均显著超过了基于Qwen2.5-32B 的DeepSeek-R1-Distill-Qwen-32B。
Open WebUI:是一个开源的用户界面(UI)工具,通常用于与大型语言模型(LLM)进行交互。其提供了一个图形化的前端界面,支持多种后端模型,允许您通过简单的配置文件或命令行参数来切换不同的模型。
Ollama:是一个专为大语言模型服务设计的开源工具,方便您在本地快速部署大模型。通过简单的安装过程,您可以用一条命令启动和操作这些开源的大语言模型。
前提条件
已创建ECS实例,且ECS实例需满足以下条件:
ECS实例处于运行中状态。
ECS实例具有公网访问能力。
-
如果选择本地部署qwq-32b模型方式,建议ECS满足CPU 16核以上、内存64 GB以上、硬盘30 GB以上以及显卡24 GB以上的性能要求。
如果选择阿里云百炼qwq-32b在线模型方式,对ECS性能没有要求,普通ECS实例即可。
已创建安全组,且安全组入方向需开放3000端口。
您可以添加安全组规则来开放3000端口。
操作步骤
步骤一:安装Open WebUI+Ollama
扩展程序内的Open WebUI已经完成了与Ollama的集成,借助Open WebUI提供的图形化用户界面,使得其与Ollama的交互变得更加直观和便捷。
进入OOS控制台>扩展程序页面。
在公共扩展程序页签下,找到OpenWebUI程序,单击安装扩展程序。
在新建批量管理软件任务页面,根据页面提示配置相关参数,单击创建。
其中,在选择实例区域,请选择待安装Open WebUI+Ollama的目标ECS实例,本示例以手动选择实例方式为例,其他参数保持默认。
在弹出的参数确认对话框中,单击确定。
在执行步骤和结果区域,选择
,查看已安装好的Open WebUI的URL。Open WebUI的URL格式为
http://{ECS的公网ip}:3000
。单击URL链接,根据提示创建账号并登录使用Open WebUI。
步骤二:基于Open WebUI+Ollama部署QwQ-32B模型
进入Open WebUI管理界面,根据QwQ-32B模型来源不同,选择不同的部署方式。
在Open WebUI管理界面,下载QWQ-32b模型时,其实是执行Ollama的命令来下载和部署模型,大大简化了操作流程,并提升了开发效率。
如需了解更多信息,请参见OpenWebUI官方文档。
进入ollama官网页面。
搜索
qwq
,选择从Ollama.com拉取''qwq''。待模型下载部署完成,选择对应模型并开始对话。
您也可以配置连接阿里云百炼上的在线模型,百炼现在对于新用户还有最长达半年的免费额度,请参见新人免费额度。
进入Open WebUI的URL(例如
http://{ECS的公网ip}:3000
)。在页面右上角,选择
。在编辑连接对话框中,添加阿里云百炼的URL、密钥和模型信息,然后单击保存。
您可以登录阿里云百炼控制台获取阿里云百炼的URL、API KEY以及模型信息等。
参数说明如下:
URL:填写阿里云百炼的URL,例如
https://dashscope.aliyuncs.com/compatible-mode/v1
。密钥:填写您百炼账号API KEY。
模型ID:添加qwq-32b模型名称。
保存完成后回到对话页面,查看已部署的QwQ-32B模型。
选择QwQ-32B模型并开始对话。
附录
- 本页导读 (1)
- 背景信息
- 前提条件
- 操作步骤
- 步骤一:安装Open WebUI+Ollama
- 步骤二:基于Open WebUI+Ollama部署QwQ-32B模型
- 附录