人声克隆定制

通过阅读本文,您可以了解如何进行人声克隆定制。

方法一:通过控制台进行人声克隆

  1. 登录智能媒体服务控制台

  2. 在顶部左上角根据实际情况选择地域。

  3. 在左侧导航栏选择智能生产制作 > 人声克隆,开始定制声音。

    • 定制基础版人声克隆

      基础版页签下单击定制声音, 根据提示完成定制人声操作。image.png

    • 定制大众版人声克隆

      大众版页签下单击定制声音,根据提示完成定制人声操作。image.png

方法二:通过OpenAPI进行人声克隆

  • 定制基础版人声克隆

  1. 调用接口CreateCustomizedVoiceJob,配置参数VoiceId,创建人声克隆任务。

  2. 调用接口GetDemonstrationForCustomizedVoiceJob,根据实际场景配置参数Scenario,获取需要朗读的20条示范文本及音频。

  3. 根据步骤 2获取到的示范文本及音频进行训练并录制,并将录制的语音上传至OSS。上传方式,请参见上传文件

  4. 调用接口DetectAudioForCustomizedVoiceJob,提交已经训练好的音频,进行音频检测。

    重要

    需要调用20次该接口,每次调用时提交对应的音频,共20条音频。

  5. 调用接口SubmitCustomizedVoiceJob,提交人声克隆训练任务,系统开始进行语音训练。

  6. 调用接口GetCustomizedVoiceJob,查询人声克隆训练任务状态。

  • 定制大众版(轻量定制)人声克隆

  1. 调用接口SubmitStandardCustomizedVoiceJob ,提交声音名称、性别、训练语料及安全验证语料。

  2. 调用接口GetCustomizedVoiceJob,查询人声克隆训练任务状态。

API参考

人声克隆相关接口