个性化音色

个性化音色通过采集目标人物的语音样本,结合大模型的深度学习能力,模拟特定个体的声音特征(如音色、语调、节奏等)生成高度拟真的个性化语音,使得呼叫系统的语音交互更具个性化和真实感。本文为您介绍个性化音色的创建流程和使用流程。

创建流程

  1. 登录智能联络中心控制台

  2. 在左侧导航栏,选择大模型通信擎 > 智能通信引擎 > 个性化音色,单击创建音色

    image

  3. 根据页面提示,选择语音文件相关信息,单击创建完成创建。

    说明
    • 您需对所提供声音的所有权及合法使用权负责,同时不支持使用名人音色。

    • 可上传单/双声道,16bit采样位数,采样率大于16000Hz,音频时长10-20s,至少包含一段超过5s的连续语音。

    • 支持WAV、MP3、M4A格式,文件不大于10M。

    image

  4. 完成创建后,在个性化音色页面单击试听

    image

  5. 确认效果满意符合您的要求后,在个性化音色页面单击上线

    image

  6. 在弹出的对话框中单击上线。

    image

使用流程

前提条件:已完成个性化音色创建并已上线。

  1. 登录智能联络中心控制台

  2. 在左侧导航栏,选择大模型通信 > 通信智能引擎 > 大模型应用管理

  3. 在大模型应用管理页面单击创建大模型应用编辑已创建的大模型应用。

    image

  4. 在弹出的大模型应用管理编辑或创建页面,单击选择呼叫音色。在弹出的对话框中选择个性化音色。下拉声音风格选择已创建的个性化音色。单击确定完成添加。

    image