【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867。
场景简介
阿里云不对第三方模型的合法性、安全性、准确性进行任何保证,阿里云不对由此引发的任何损害承担责任。
您应自觉遵守第三方模型的用户协议、使用规范和相关法律法规,并就使用第三方模型的合法性、合规性自行承担相关责任。
高手进阶请体验这一实验版本【自由换模型】基于函数计算一键部署 Stable Diffusion ,可以自主更换基础模型,增加Lora模型,可玩性更强。
人工智能生成内容(Artificial Intelligence Generated Content,简称 AIGC)是当下最火的概念之一。AIGC被认为是继专业生成内容(Professional Generated Content, PGC)和用户生成内容(User Generated Content, UGC)之后,利用人工智能技术自动生成内容的新型生产方式。
AI生成内容的形式相当丰富,除了文字外,还可以进行绘画、作曲、演唱、编剧、设计等。最近热度非常高的Text to Image就是AI加持下非常时髦的一种图片创造方式。看看下面这些图片,你一定很难想象它们都是AI生成的吧。
许多人可能觉得,使用AIGC有很高的门槛,普通人是很难入门的。其实不然,随着AI技术的快速发展以及众多开源项目的诞生,我们每个人都可以很轻松且廉价的使用到AIGC。谁能想到,在2018年,人工智能生成的画作在佳士得拍卖价还高达43.25万美元,而时隔才数年,让AI为我们创作绘画已经成了人人触手可及的事情。
在这些开源项目中,Stable Diffusion无疑是优秀生之一。Stable Diffusion是一种扩散模型(Diffusion Model)的变体,称为“潜在扩散模型”(Latent Diffusion Model),由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它。Stable Diffusion能够根据我们提供的一些提示词以及可以调整的部分参数,通过模型计算生成一张不错的图片。
在本实验场景中,我们将向大家介绍如何基于Stable Diffusion实现文字到图片的生成。这是一项接近零基础的教程,其中并不会包含复杂的概念或者深奥的算法。换句话说,只要你稍有计算机基础,了解如何敲入命令,知道怎么使用浏览器打开网页,你就能很轻松的完成这个实验。
背景知识
本场景主要涉及以下云产品和服务:
函数计算(Function Compute)是一个事件驱动的全托管 Serverless 计算服务,您无需管理服务器等基础设施,只需编写代码并上传,函数计算会为您准备好计算资源,并以弹性、可靠的方式运行您的代码。
云起实验室使用指南
云起实验室页面操作介绍
您好,本实验手册将会辅助您进行云上操作,请您严格按照手册的建议进行实验,非常感谢。
首次开通函数计算的用户可以领取免费试用额度进行体验,领取方式请查看第三页内容。
云起实验室页面主要分两个部分,左侧为实验手册,右侧为实验操作面板。根据实验手册中的步骤描述,在实验操作面板中进行操作,完成实验。
在实验手册中的右下角,单击下一页查看后续步骤。
如何开始体验
在实验页面,勾选我已阅读并同意《阿里云云起实践平台服务协议》和我已授权阿里云云起实践平台创建、读取及释放实操相关资源后,单击开始实操。
创建资源需要1分钟左右的时间,请您耐心等待。
费用说明及领取免费额度
费用说明
本实验涉及到一个云产品的付费:阿里云函数计算。
函数计算费用。
重要无论是否生成图片,进入Stable Diffusion WebUI使用界面就会耗费GPU资源。所以在不需要使用Stable Diffusion WebUI生成图片的时候,请及时关闭Stable Diffusion WebUI使用界面。
以下计费示例中的资源用量、费用金额、预估可生成图片数量等均为测试数据,仅供参考。实际使用中,因为图片像素不同,插件安装耗时等情况费用均有不同。更多计费概况参考 计费概述。
生成首张图费用约0.179元,第二张图之后每张图单价约0.013元,如您需要连续生成100张图,预计将产生函数计算费用约1.466元。
免费试用额度。
按量付费。
部署Stable Diffusion需要使用的函数计算配置:16GB GPU+8GB CPU+32GB 内存。
以默认512px*512px尺寸图片为例,首次生图需要额外冷启动消耗60秒,后续每张图生成预计耗时5秒。
首次生成一张图所消耗的资源。
GPU费用:16GB * (60s+5s) *0.00011元/秒=0.114元
CPU费用:8GB * (60s+5s) *0.00009元/秒=0.0468元
内存费用:32GB * (60s+5s) *0.000009元/秒=0.018元
总计:0.179元
后续每生成一张图所消耗的资源。
GPU费用:16GB * 5s *0.00011元/秒=0.008元
CPU费用:8GB * 5s *0.00009元/秒=0.0036元
内存费用:32GB * 5s *0.000009元/秒=0.00144元
总计:0.013元
公网出流量和磁盘使用量。
公网出流量:0.50元/GB
磁盘使用量:超出512 MB的部分0.00000175元/GB*秒
首次开通函数计算用户,可先领取免费额度
前往函数计算控制台。
在推荐您创建 AliyunFcDefaultRole默认角色对话框中,单击创建。
在角色快捷创建页面,单击同意授权。
在实验操作面板顶部,单击
图标打开新的标签页,然后在地址栏中输入如下地址并回车,访问免费试用页面。
https://free.aliyun.com/?spm=a2c6h.29426672.J_5391097900.2.5965729bb9DtAC&productCode=fc
在免费试用页面,找到函数计算FC卡片,单击立即试用。
在函数计算FC面板,勾选服务协议,单击立即试用。
说明函数计算为首次开通服务的用户提供相应的试用额度,阿里云账户与RAM用户共享此试用额度。试用额度以月为周期,连续提供12个周期,每个周期超出试用额度的部分均会计入按量付费。
创建应用
前往函数计算控制台。
请您在函数计算控制台的左上角,确认访问的是函数计算3.0,否则您需要在右上角单击体验函数计算3.0。
在左侧导航栏中,单击应用。
(可选)在应用页面,单击创建应用。
说明如果您之前未使用过应用中心,请跳过本步骤,可直接进入下一步。
在应用页面的人工智能分类中,搜索并选择AI数字绘画stable-diffusion,单击立即创建。
说明如果您在应用页面找不到AI数字绘画stable-diffusion,您可能登录的是函数计算2.0控制台。您可在页面右上角,单击体验函数计算3.0,根据手册操作找到应用。
在创建应用页面,角色名称请确认所需要的权限均已获取(若缺失权限请按照页面引导进行操作)。
地域选择可以选择距离自己较近的地域,目前支持仅华东1(杭州)和华东2(上海)地域。
说明由于Hugging Face网站访问不稳定,部分Stable Diffusion插件存在检查模型更新的逻辑,在国内使用受影响的插件可能会遇到启动、出图时间变慢、无法出图等问题。如果您遇到上述问题,可以考虑在海外集群部署Stable Diffusion。
根据实际需要,可以选择不同的绘图类型,本实验以动漫风格为例。
其他参数保持默认配置即可,确认以上信息无误后,单击创建应用。
说明本次实验提供的镜像由Serverless Devs开源项目贡献者贡献,仅供您体验使用。您也可以使用自己的构建的镜像,构建方法详情请参见项目代码内的README文档。
在活动应用创建提醒对话框中,选中函数计算收费项,选中我已经了解上面的内容,并同意上述描述,单击同意并进行部署。
返回如下结果,请您耐心等待应用部署,大约需要2分钟。
在应用详情页签,当部署状态变为部署成功,表示应用部署成功,并生成WebUI域名,单击WebUI域名后的链接,进入Stable Diffusion页面。
重要请注意保护域名的安全,不要泄露给其他人,防止产生额外费用。
***.devsapp.net域名是CNCF SandBox项目Serverless Devs社区所提供,仅供学习和测试使用,不可用于任何生产使用;社区会对该域名进行不定期地拨测,并在域名下发30天后进行回收,强烈建议您绑定自定义域名以获得更好的使用体验。
首次打开Stable Diffusion,遇到无法访问此网站情况,表示Stable Diffusion正在冷启动中,等待10 秒左右单击重新加载。
在Stable Diffusion中,您可以输入提示词,单击生成,即可开始生图。
Stable Diffusion 提示词案例。
风格
提示词:a realistic San-Francisco cityscape, from the roof, tall terrace, hills, Golden Gate, houses, parks, and hell bursting in style of Wayne Thiebaud and Bosch
提示词:chaotic hand drawing colored sketch illustration retro of dolores park san francisco, birds eye view, illustrated by hergé and Tardi, style of tin tin comics, pen and ink
提示词:"floral astronaut" hand-drawn watercolor, muted tones, flowers everywhere, REALISTIC
提示词:Vintage 90's anime style. cluttered starship interior; captain piloting a starship; by hajime sorayama, greg tocchini, virgil finlay, sci-fi, colors, neon lights. line art.
提示词:maximalist chaotic San Francisco, birds eye view, illustrated by Hergé, style of tin tin comics, pen and ink
提示词:isomorphic pixel art farmville in 2d
提示词:peasant and dragon combat, wood cutting style , viking era, bevel with rune
室内
提示词:interior design, open plan, kitchen and living room, modular furniture with cotton textiles, wooden floor, high ceiling, large steel windows viewing a city
提示词:environment living room interior, mid century modern, indoor garden with fountain, retro,m vintage, designer furniture made of wood and plastic, concrete table, wood walls, indoor potted tree, large window, outdoor forest landscape, beautiful sunset, cinematic, concept art, sunstainable architecture, octane render, utopia, ethereal, cinematic light
动物
提示词:A painting of a cute goldendoodle in the sky, wearing a suit, natural light, with bright colors, by Studio Ghibli
提示词:a mix between Cinnamoroll and My Melody from Sanrio, anime 2D style
人物
提示词:portrait of Lucy, Cyberpunk anime, clean skin, hazel eyes, intricate artwork by Joaquin Sorolla, soft natural light, 85mm, sunshine on her face, lights and shadows
风景
提示词:a painting of a beyond-dimensional fantasy world,a world of under the sea,Atlantis,science fiction,uplighting,studio Ghibli,unreal engine,epic composition,CG digital render,Ultra HD,technique highly detailed,triadic color scheme
提示词:a painting of a beyond-dimensional fantasy world,reality infused with dreams,the mountian tops were hidden beneath a veil of mist,a cherry blossom with gentle breeze,uplight,atmospheric,epic composition,unreal engine,a screenshot from science fiction anime film by makoto shinkai
提示词:in a screenshot from the science fiction anime film by makoto,sunset and sunset clouds over the sea,james Gurney,cgsociety,vary
提示词:wave,nightsky,nebula,colorful stars,animation,CG digital rendering,whale,vary,technique highly detailed,ultrawide shot,no clouds,Ultra HD
提示词:Arches National Park,under the rock,in the evening,nightsky,reality infused with dreams,upscaled,triadic color scheme,epic composition,CG digital rendering,Studio Ghibli,unreal engine,atmospheric,omit the people
使用文字生成图片
生成图片的操作方式非常简单,只需要在WebUI页面,左侧的Prompt输入框中填入提示词,之后单击右侧的生成即可。
提示词就是生成图片的依据,既可以是描述需要生成内容的词,例如girl, sunset, forest等;也可以是用于是描述图像属性的词,例如best quality, beautiful, masterpiece等。我们甚至可以通过提示词选择图片生成的视角、光线、画风;人物的姿势、着装、表情、背景的内容等。
我们建议您加上画风描述词,让您的图片更加美观,如:Cyberpunk(赛博朋克),shinkai makoto(新海诚),Ghibli Studio(吉卜力),Paul Gauguin(梵高)等等。
在图片生成的过程中,我们可以在页面上看到生成过程的中间图片逐渐变得清晰。同时,也可以通过进度条直观的了解图片生成的进度和预估剩余时间。
示例:
在Prompt输入框中,填入如下正向提示词,然后单击生成。
portrait of Lucy, Cyberpunk anime, clean skin, hazel eyes, intricate artwork by Joaquin Sorolla, soft natural light, 85mm, sunshine on her face, lights and shadows
您可以组合各类模型、Lara等玩法,解锁AI生图的更多乐趣。
(选做)Stable Diffusion 进阶技能-换模型
如果您需要上传自己的模型,可以体验【自由换模型】基于函数计算一键部署 Stable Diffusion。
清理资源
在完成实验后,如果无需继续使用资源,请根据以下步骤,先删除函数计算部署的应用,再结束实操。
重要如果无需继续使用资源,请一定要先删除函数计算后再结束实操,否则函数计算还会继续进行计费。
删除函数计算部署的应用。
前往函数计算控制台。
在左侧导航栏中,单击应用。
在应用页面,找到您部署的应用,单击右侧操作列下的删除。
在删除应用对话框中,选中我已确定资源删除的风险,依旧要删除上面已选择的资源,然后单击删除应用及所选资源。
删除函数计算应用后,选择不保留资源,单击结束实操。在结束实操对话框中,单击确定。
在完成实验后,如果需要继续使用资源,选择付费保留资源,单击结束实操。在结束实操对话框中,单击确定。请随时关注账户扣费情况,避免发生欠费。