Cosy Voice智能语音生成
学习在阿里云函数计算上部署智能语音生成功能
实验介绍
本实验带领您体验如何使用阿里云函数计算部署智能语音模型。
实验资源简介
云起实验室将在您的账号下开通本次实操资源,资源按量付费,本实验产生的费用优先使用300元优惠券,优惠券使用完毕后需您自行承担
函数计算 8GB Vcpu+ 32GB 内存+16GB GPU资源配置,预估 预置语音生成、定制语音生成(声音克隆)、高级语音生成(自然语言控制)三种使用场景费用情况:
预置语音生成:每分钟生成 400字符,费用约 1.46元
定制语音生成(声音克隆):每分钟生成153字符,费用约 1.27元
高级语音生成(自然语言控制):每分钟生成 480字符,费用约 1.16元。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。
实操结束后,您可以选择继续付费保留资源,否则资源将自动释放。
在开始实验之前,请先点击右侧屏幕的“进入实操”再进行后续操作
请确保阿里云账号满足以下条件:已通过实名认证且已领取阿里云云工开物学生专属300元优惠券
如未领取请先点击领取(若已领取请跳过)
实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。
资源开通与部署
应用操作
按照界面提示,点击不同Tab(任选其一即可),
预置语音生成:可以通过内置的语音,实现文本合成音频;
定制语音生成:通过录制个人声音,可以用个人声音与输入的文本,合成音频;
重要注意:复刻录制声音需要通过浏览器采集您的声音,请注意安全隐私,此外,由于浏览器安全限制对于非https域名默认不会开启声音录入的能力,您使用serverless devs部署后分配的域名不会添加http证书,此时如果您想使用复刻录音的功能,请按照以下操作,增加域名的限制解除,之后按照流程复制声音
Chrome 开发者模式:
您可以在 Chrome 中启用实验性标志来允许 HTTP 访问摄像头和麦克风。
步骤:
打开 Chrome 浏览器。
输入 chrome://flags/#unsafely-treat-insecure-origin-as-secure 并回车。
将 Unsafely treat insecure origin as secure 设置为 Enabled。
在 Origin to treat as secure 中输入访问域名(例如https://fcnext.console.aliyun.com/applications/create?template=cosyvoice)。
重启 Chrome 浏览器。
Firefox 开发者模式:
Firefox 也允许您在开发模式下绕过 HTTPS 限制。
步骤:
打开 Firefox 浏览器。
输入 about:config 并回车。
搜索 media.getusermedia.insecure-origins.enabled。
将此设置为 true。
搜索 media.getusermedia.insecure-origins。
添加您的 IP 地址作为值之一(例如http://127.0.0.1)。
高级语音生成:在文本生成音频的基础上,可以通过文字控制生成音频的效果。
删除资源
为避免产生费用,后续如无需使用,请务必删除对应资源与当前应用。即返回函数计算控制台(阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台),删除相关应用。直接关闭应用窗口,也可以结束服务,资源将不再计费。
关闭实验
在完成实验后,点击 结束实操
点击 取消 回到实验页面,点击 确定 跳转实验评分
请为本次实验评分,并给出您的建议,点击 确认,结束本次实验