通过托管模型到函数计算实现Serverless GPU服务管理_云原生应用开发平台(CAP)-阿里云帮助中心

您可以通过托管模型构建AI应用的核心底座，由云原生应用开发平台 CAP基于函数计算封装模型体验，提供Serverless GPU运行时服务。

什么是模型服务

模型服务能力是一项全面托管的模型服务，通过Serverless GPU计算，托管开源与微调模型实现统一的模型构建，为您提供构建生成式AI应用所需的一系列模型能力。

模型服务底层依赖函数计算的GPU作为底层算力，您可以无需关心底层基础设施的管理，只需专注于AI应用的开发，一键拉取大模型，并自动生成开发所需的调用API。

使用模型服务，您可以轻松试验和评估适合您的大模型，通过微调（SFT）和检索增强生成（RAG）等技术利用您的数据对大模型进行私人定制，构建仅服务于您的专属大模型。

模型服务来源

ModelScope
从ModelScope官网拉取模型。
对象存储 OSS
从您创建的OSS Bucket中获取存放的模型。
自定义模型镜像
选择您托管到容器镜像服务 ACR中的镜像模型。

模型服务将自动从对应来源拉取模型并部署，不同的来源下载速率不一致，可关注部署日志来观测下载速率。以Qwen7B为例，通常下载时间为分钟级。

模型执行框架

目前模型支持ModelScope Library作为底层模型执行框架，请确保自定义模型来源可被ModelScope Library执行并部署。更多信息，请参见Library介绍。

目前ModelScope Library支持的模型服务列表，请参见ModelScope Library支持的模型服务列表。

前提条件

已创建项目，具体操作，请参见管理项目。

创建模型服务

使用控制台模板列表中的模板创建项目时，部分模板默认会创建模型服务，您也可以手动添加模型服务。

登录云原生应用开发平台 CAP控制台，单击目标项目，在项目详情页面，单击左上角的新建服务，选择模型服务类型并单击跳转至创建服务页面。
在创建服务页面，选择开源模型（图示中①）以及所需的资源信息，然后单击预览&部署。如果没有特殊需求，其他配置项保持默认值即可。
您也可以单击更多模型来源（图示中②），手动添加模型，详见步骤3。
说明
- 模型服务底层使用函数计算的GPU实例作为算力，推荐您保持开启闲置模式来降低使用成本，详情请参见计费组成。
- 资源配置区域的配置项实例数是指函数计算的预留实例数，建议您将其设置为非0。Tesla 系列卡型支持将其设置为0，函数计算的弹性伸缩功能会根据请求量分配相应的实例数，但在模型场景下会存在冷启动问题。更多信息，请参见配置预留实例。
（可选）单击更多模型来源，在选择模型对话框手动添加模型。
ModelScope
- 支持从ModelScope官网获取模型ID，版本号。
- Token为ModelScope令牌。
- 更多ModelScope模型详见ModelScope Library支持的模型服务列表。
对象存储 OSS
如图所示，需选择您的Bucket，并填写模型存储路径。
自定义模型镜像
如图所示，选择您托管在容器镜像服务 ACR中的模型镜像，详情请见镜像使用说明。
在弹出的服务资源预览对话框，确认信息后单击确认部署。

访问模型服务

模型服务创建成功后，您可以在服务详情页面，单击API 地址跳转至API调用示例页面，单击测试进行相关模型试用。

更新模型服务

服务部署成功后，您可以在已部署模型详情页面编辑基础配置的模型信息，也可以编辑底层资源配置信息。如下图所示，依次单击编辑修改配置并保存。

您也可以查看函数相关指标和运行日志，以及项目部署记录。更多信息，请参见监控指标和日志。

删除服务

选中要删除的服务，点击删除。进入删除服务确认弹窗。

勾选我已知晓：删除该项目及选中的服务将立刻中断其所服务的线上业务，并且不可恢复，同时将彻底删除其所依赖的云产品资源，然后单击确定删除。

ModelScope Library支持的模型服务列表

模型ID

模型Task

模型大小（GB）

模型版本

thomas/text2vec-base-chinese

sentence-embedding

0.38

v1.0.0

iic/speech_sambert-hifigan_tts_andy_en-us_16k

text-to-speech

0.29

v1.0.1

AI-ModelScope/stable-diffusion-v1.5-no-safetensor

text-to-image-synthesis

11.15

v1.0.0

iic/speech_sambert-hifigan_tts_zhizhe_emo_zh-cn_16k

text-to-speech

0.29

v1.0.3

iic/nlp_bert_document-segmentation_english-base

document-segmentation

0.41

v1.0.1

iic/speech_sambert-hifigan_tts_en-us_16k

text-to-speech

0.35

v1.0.1

iic/ofa_ocr-recognition_document_base_zh

ocr-recognition

0.66

v1.0.1

iic/nlp_lstm_named-entity-recognition_chinese-social_media

named-entity-recognition

0.02

v1.0.0

iic/nlp_seqgpt-560m

text-generation

1.06

v1.0.1

iic/nlp_palm2.0_text-generation_chinese-large

text-generation

2.34

v1.1.0

iic/nlp_raner_named-entity-recognition_english-large-ecom

named-entity-recognition

2.11

v1.0.0

lskhh/flower_classification14

image-classification

1.28

v1.0.3

iic/speech_sambert-hifigan_tts_indah_Indonesian_16k

text-to-speech

0.24

v1.0.2

iic/speech_eres2net_large_mej_lre_16k_common

speech-language-recognition

0.11

v1.0.4

Stefanieliang/cv_vit-base_image-classification_Dailylife-labels_flowers

image-classification

1.28

v1.0.0

iic/cv_segformer-b2_image_semantic-segmentation_coco-stuff164k

image-segmentation

0.31

v2.0.0

iic/speech_eres2net_base_mej_lre_16k_common

speech-language-recognition

0.04

v1.0.1

iic/nlp_structbert_fact-checking_chinese-base

nli

0.38

v1.0.1

AI-ModelScope/opt-125

text-generation

0.7

v1.0.0

iic/nlp_structbert_emotion-classification_chinese-tiny

text-classification

0.03

v1.0.0

Fengshenbang/Taiyi-Stable-Diffusion-1B-Chinese-v0.1

text-to-image-synthesis

3.89

v1.0.0

Fengshenbang/Erlangshen-RoBERTa-110M-NLI

text-classification

0.38

v1.0.0

iic/nlp_ponet_extractive-summarization_doc-level_chinese-base

extractive-summarization

0.44

v1.0.0

chaoscodes/TinyLlama-1.1B-step-50K-105b

text-generation

8.2

v1.0.0

xiaolv/ocr_big

ocr-recognition

0.07

v1.0.0

dienstag/chinese-bert-wwm

fill-mask

1.15

v1.0.0

Fengshenbang/Wenzhong-GPT2-3.5B

text-generation

6.69

v1.0.0

ccyh123/Qwen-VL-Chat-Int4

chat

9.08

v1.0.0

dienstag/chinese-macbert-large

fill-mask

3.73

v1.0.0

Fengshenbang/Erlangshen-TCBert-330M-Sentence-Embedding-Chinese

fill-mask

1.3

v1.0.1

iic/nlp_masts_backbone_clue_chinese-large

fill-mask

1.21

v1.4.1

Fengshenbang/Erlangshen-BERT-120M-IE-Chinese

fill-mask

0.39

v1.0.0

iic/cv_resnet152_open-vocabulary-detection_vild

open-vocabulary-detection

0.31

v1.0.4

iic/nlp_debertav2_fill-mask_chinese-base

fill-mask

0.7

v1.0.1

Fengshenbang/Erlangshen-UniMC-RoBERTa-110M-Chinese

fill-mask

0.38

v1.0.0

dienstag/chinese-xlnet-mid

fill-mask

1.65

v1.0.0

Fengshenbang/Erlangshen-TCBert-1.3B-Sentence-Embedding-Chinese

fill-mask

4.77

v1.0.1

dienstag/Analog-Diffusion

text-to-image-synthesis

3.97

v1.0

iic/multi-modal_rleg-vit-large-patch14

generative-multi-modal-embedding

1.59

v0.0.1

dienstag/portraitplus

text-to-image-synthesis

3.97

v1.0

iic/zero-shot-classify-SSTuning-base

zero-shot-classify-sstuning

0.47

v1.0.2

dienstag/vintedois-diffusion-v0-1

text-to-image-synthesis

3.98

v0.1

dienstag/cino-large-v2

fill-mask

3.82

v1.0.0

dienstag/rbt4-h312

fill-mask

0.11

v1.0.0

Fengshenbang/Erlangshen-DeBERTa-v2-97M-CWS-Chinese

fill-mask

0.36

v1.0.3

Fengshenbang/Erlangshen-TCBert-1.3B-Classification-Chinese

fill-mask

4.77

v1.0.1

zydfx1111/flower

image-classification

1.28

v1.0.0

Fengshenbang/Erlangshen-UniMC-DeBERTa-v2-330M-Chinese

fill-mask

1.19

v1.0.0

dienstag/chinese-electra-180g-base-discriminator

fill-mask

0.76

v1.0.0

dienstag/chinese-electra-small-ex-generator

fill-mask

0.07

v1.0.1

zyqlight/plants_classification

image-classification

5.12

v1.0.3

yonggreen/product_ner

named-entity-recognition

0.38

1.0.0

lawup2/my_test_model

image-captioning

0.83

1.1.4

MoEE3910/moee_xl

text-classification

0.38

v1.0

ValeriaWong/flower_classification14

image-classification

1.28

v1.0.1

asd1821154213/flower_recog

image-classification

1.28

v1.0.1

Liiiiiii/Vit_Flower_Classification

image-classification

1.28

v1.0.0

playmake/LRBV1_qwen_350_1738

chat

3.42

V1.0.0

lskhh/flower_newrecog

image-classification

1.28

V1.0,0

lskhh/flowers_classification-Dreamwing

image-classification

1.28

v1.0.0

iic/cv_resnet50_face-detection_retinaface

face-detection

0.1

v2.0.2

iic/cv_resnet18_ocr-detection-db-line-level_damo

ocr-detection

0.15

v1.3.0

iic/cv_resnest101_animal_recognition

animal-recognition

0.47

v1.0.0

iic/nlp_structbert_faq-question-answering_chinese-base

faq-question-answering

0.42

v1.0.2

iic/nlp_raner_named-entity-recognition_chinese-base-ecom-50cls

named-entity-recognition

0.38

v1.0.0

什么是模型服务

模型服务来源

模型执行框架

前提条件

创建模型服务

ModelScope

对象存储 OSS

自定义模型镜像

访问模型服务

更新模型服务

删除服务

ModelScope Library支持的模型服务列表