数字人音色定制

仅需实时录制一段文本或上传一段音频文件,就能高质量还原声音本色,生成自己的定制音色,用于数字人的对话、播报等内容生产音色。

说明

数字人音色定制,当前限时免费中

定制流程

实时录制音频复刻

克隆方式选择录音时,可以基于灵眸平台给出的文案,在指定语境内朗读录制

录制要求

  • 录制时无环境背景噪声、无明显回声和混响

  • 录制期间话筒距离嘴部的距离稳定,避免声音忽大忽小

  • 录制过程中保持姿态稳定,减少人为噪声,如肢体碰撞声、服装摩擦声、桌椅移动声、鼠标键盘声等

image

上传音频文件复刻

克隆方式选择上传时,可以上传音频文件进行克隆

文件要求

  • 音频格式:wav、mp3、m4a

  • 采样率:大于等于16000Hz

  • 文件大小:10MB 以内

  • 音频时长:10s~300s

image