使用ModelScope模板搭建低成本LLM智能问答应用-函数计算-阿里云

LLM（Large Language Model）是指大型语言模型，是一种采用深度学习技术训练的具有大量参数的自然语言处理模型。您可以基于ModelScope模型库和函数计算的浅休眠（原闲置）弹性实例低成本快速搭建LLM应用实现智能问答。

操作步骤

本教程使用的LLM模型为ChatGLM3-6B。更多开源LLM，请参见ModelScope官网。

在创建应用页面，设置以下配置项，然后单击创建应用。

主要配置项说明如下，其余配置项保持默认值即可。

配置项	说明	示例值
项目基础配置
角色名	默认使用AliyunFCServerlessDevsRole，首次创建应用的用户，需要根据界面提示，单击前往授权跳转至快速授权页面，完成授权并创建该角色。	AliyunFCServerlessDevsRole
模型平台配置
模型ID	ModelScope的模型ID。	ZhipuAI/chatglm3-6b
模型版本	ModelScope的模型版本。	v1.0.2
资源创建配置
地域	选择部署应用的地域。重要如果部署异常，例如AIGC公共镜像拉取耗时长，拉取失败，请切换到其他地域重试。	华东2（上海）
模型任务类型	ModelScope的模型任务类型。	chat
Access Token	ModelScope的访问令牌。ModelScope账号与阿里云账号绑定后，在ModelScope官网首页获取。	57cc1b0a-08e8-4224-******
模型运行实例类型	函数实例所使用的GPU卡型。	fc.gpu.tesla.1
显存大小	函数实例的显存大小（MB）。	16384
内存大小	函数实例的内存大小（MB）。	32768

为应用配置最小实例数。
1. 应用部署完成后，在资源信息区域单击后缀为model-app-func的函数名称跳转至函数详情页。
2. 在目标函数详情页面，选择弹性配置页签，在下方弹性策略区域，单击目标策略行的配置。
3. 在配置弹性策略页面，设置最小实例数为≥1的值，然后单击确定。

如您暂时不需要使用此应用，请及时删除对应资源。如您需要长期使用此应用，请忽略此步骤。

返回函数计算控制台概览页面，在左侧导航栏，单击更多功能 > 应用。
单击目标应用右侧操作列的删除应用，在弹出的删除应用对话框，勾选我已确定资源删除的风险，依旧要删除上面已选择的资源，然后单击删除应用及所选资源。

由于当前社区以及多种层出不穷的微调模型，本表格仅列举了当前热度较高的常用LLM基础模型，在其之上的微调模型同样是可以部署至函数计算平台，并开启浅休眠（原闲置）预留模式。

如果您有任何反馈或疑问，欢迎加入钉钉用户群（钉钉群号：64970014484）与函数计算工程师即时沟通。

家族	LLM模型
通义千问	Qwen-14B Qwen-14B-Chat Qwen-14B-Chat-Int8 Qwen-14B-Chat-Int4
	Qwen-7B Qwen-7B-Chat Qwen-7B-Chat-Int8 Qwen-7B-Chat-Int4
	Qwen-1.8B Qwen-1.8B-Chat Qwen-1.8B-Chat-Int4
百川智能	Baichuan2-13B-Base Baichuan2-13B-Chat Baichuan2-13B-Chat-4bits
	Baichuan2-7B-Base Baichuan2-7B-Chat Baichuan2-7B-Chat-4bits
	Baichuan-13B-Chat
	Baichuan-7B
智谱.AI	ChatGLM3-6B
智谱.AI	ChatGLM3-6B
更多开源LLM模型请参考ModelScope。