通过控制台或OpenAPI定制人声克隆-智能媒体服务-阿里云

备案控制台

输入文档关键字查找

通过阅读本文，您可以了解如何进行人声克隆定制。

方法一：通过控制台进行人声克隆

登录智能媒体服务控制台。
在顶部左上角根据实际情况选择地域。
在左侧导航栏选择智能生产制作 > 人声克隆，开始定制声音。
- 定制基础版人声克隆
  在基础版页签下单击定制声音，根据提示完成定制人声操作。
- 定制大众版人声克隆
  在大众版页签下单击定制声音，根据提示完成定制人声操作。

方法二：通过OpenAPI进行人声克隆

定制基础版人声克隆

调用接口CreateCustomizedVoiceJob，配置参数VoiceId，创建人声克隆任务。
调用接口GetDemonstrationForCustomizedVoiceJob，根据实际场景配置参数Scenario，获取需要朗读的20条示范文本及音频。
根据步骤 2获取到的示范文本及音频进行训练并录制，并将录制的语音上传至OSS。上传方式，请参见上传文件。
调用接口DetectAudioForCustomizedVoiceJob，提交已经训练好的音频，进行音频检测。
重要
需要调用20次该接口，每次调用时提交对应的音频，共20条音频。
调用接口SubmitCustomizedVoiceJob，提交人声克隆训练任务，系统开始进行语音训练。
调用接口GetCustomizedVoiceJob，查询人声克隆训练任务状态。

定制大众版（轻量定制）人声克隆

调用接口SubmitStandardCustomizedVoiceJob ，提交声音名称、性别、训练语料及安全验证语料。
调用接口GetCustomizedVoiceJob，查询人声克隆训练任务状态。

API参考

人声克隆相关接口

上一篇：人声克隆概述下一篇：录音指导

该文章对您有帮助吗？