个性化音色

更新时间:
复制为 MD 格式

个性化音色通过采集目标人物的语音样本,结合大模型的深度学习能力,模拟特定个体的声音特征(如音色、语调、节奏等)生成高度拟真的个性化语音,使得呼叫系统的语音交互更具个性化和真实感。本文介绍个性化音色的创建流程和使用流程。

创建流程

重要

如您使用个性化音色功能,您需对所提供的声音素材所有权及合法使用权负责。您作为数据处理者,需遵守《个人信息保护法》等相关法律法规要求,就已采集的声音素材获得本人授权同意。阿里云作为受托方,根据您的指令处理该声音素材信息不会侵犯任何第三方的合法权益。本功能不支持使用名人声音素材。阿里云不承担因您上传的语音文本存在权益争议而产生的任何损失。其他未尽事宜按照您已签署的《通信能力技术服务协议》以及协议中智能联络中心系统服务条款之规定执行。

  1. 登录智能联络中心控制台

  2. 在左侧导航栏,选择大模型通信 > 个性化音色 > 阿里云Cosyvoice音色,单击创建音色

    image

  3. 根据页面提示,选择语音文件相关信息,单击创建完成创建。

    说明
    • 您需对所提供声音的所有权及合法使用权负责,同时不支持使用名人音色。

    • 可上传单/双声道,16bit采样位数,采样率大于16000Hz,音频时长10-20s,至少包含一段超过5s的连续语音。

    • 支持WAV、MP3、M4A格式,文件不大于10M。

    • 您需对所提供的声音素材所有权及合法使用权负责。您作为数据处理者,需遵守《个人信息保护法》等相关法律法规要求,就已采集的声音素材获得本人授权同意。阿里云作为受托方,根据您的指令处理该声音素材信息不会侵犯任何第三方的合法权益。本功能不支持使用名人声音素材。

    image

  4. 完成创建后,在个性化音色页面单击试听

    image

  5. 确认效果满意符合要求后,在个性化音色页面单击上线

    image

  6. 在弹出的对话框中单击上线。

    image

使用流程

前提条件:已完成个性化音色创建并已上线。

  1. 登录智能联络中心控制台

  2. 在左侧导航栏,选择大模型通信 > 通信智能引擎 > 大模型应用管理

  3. 在大模型应用管理页面单击创建大模型应用编辑已创建的大模型应用。

    image

  4. 在弹出的大模型应用管理编辑或创建页面,单击选择呼叫音色。在弹出的对话框中选择阿里云Cosyvoice个性化音色。下拉声音风格选择已创建的个性化音色。单击确定完成添加。

    image