个性化音色(含三方音色)

更新时间:
复制为 MD 格式

个性化音色通过采集目标人物的语音样本,结合大模型的深度学习能力,模拟特定个体的声音特征(如音色、语调、节奏等)生成高度拟真的个性化语音,使得呼叫系统的语音交互更具个性化和真实感。本文介绍个性化音色的创建流程和使用流程。

重要

声明1:如您使用个性化音色功能,您需对自行上传的语音样本的所有权和使用权负责,且确保您的使用不得侵害第三方合法权益。您作为数据处理者,需遵守《个人信息保护法》等相关法律法规要求,就已采集的声音素材获得本人授权同意。阿里云作为受托方,根据您的指令处理该声音素材信息不会侵犯任何第三方的合法权益。本功能不支持使用名人声音素材。阿里云不承担因您上传的语音文本存在权益争议而产生的任何损失。其他未尽事宜按照您已签署的《通信能力技术服务协议》以及协议中智能联络中心系统服务条款之规定执行。

声明2:您使用的服务涉及第三方网站或服务(“第三方服务”,如MiniMax),该页面显示仅为方便您了解相关信息,不代表阿里云对该第三方服务的内容、质量和安全性进行认可或保证。请您在使用第三方服务时,自行承担相关风险,阿里云不承担因使用第三方服务而产生的任何损失或损害,亦不会对第三方的数据处理和保护措施负责。

阿里云Cosyvoice音色

详情参见:个性化音色

豆包音色

创建流程

  1. 登录智能联络中心控制台

  2. 创建账号

    1. 在左侧导航栏,选择个性化音色 > 豆包音色 > 账号管理,单击创建账号

      image.png

    2. 根据页面提示,配置账号相关信息,单击确认完成创建。

      image.png

      配置项说明:

      配置项

      说明

      账号名称

      自定义的豆包账号名称。

      APP ID

      豆包APP ID

      Access Token

      豆包Access Token

  1. 创建豆包音色

    1. 在左侧导航栏,选择个性化音色 > 豆包音色 > 音色管理,单击创建豆包音色

      image.png

    2. 根据页面提示,配置豆包音色相关信息,单击确认完成创建。

      image.png

      配置项说明:

      配置项

      说明

      音色名称

      自定义的音色名称。

      账号名称

      选择已创建的豆包账号。

      声音风格

      豆包voice_type音色类型。

      Resource ID

      豆包Resource ID(资源ID)。

      备注

      自定义备注信息

  1. 完成创建后,在豆包音色页面单击试听

    image.png

  2. 确认效果满意符合您的要求后,即可在大模型应用管理 > 创建大模型应用 > 呼叫音色中使用该音色。

MiniMax音色

创建流程

  1. 登录智能联络中心控制台

  2. 创建账号

    1. 在左侧导航栏,选择个性化音色 > MiniMax音色 > 账号管理,单击创建账号

      image.png

    2. 根据页面提示,配置账号相关信息,单击确认完成创建。

      image.png

      配置项说明:

      配置项

      说明

      账号名称

      自定义的MiniMax账号名称。

      Group ID

      MiniMaxGroup ID。

      Access Token

      MiniMaxAccess Token。

      模型地址

      默认为/v1/t2a_v2可根据实际使用自定义修改。

  3. 创建MiniMax音色

    1. 在左侧导航栏,选择个性化音色>MiniMax音色>音色管理,单击创建MiniMax音色

      image.png

    2. 根据页面提示,配置MiniMax音色相关信息,单击确认完成创建。

      image.png

      配置项说明:

      配置项

      说明

      音色名称

      自定义的音色名称。

      账号名称

      选择已创建的MiniMax账号。

      声音风格

      MiniMaxvoice_id音色ID。

      模型名称

      MiniMax的模型名称。

      备注

      自定义备注信息。

  4. 完成创建后,在MiniMax音色页面单击试听

    image.png

  5. 确认效果满意符合您的要求后,即可在大模型应用管理 > 创建大模型应用 > 呼叫音色中使用该音色。

Cosyvoice开放TTS音色

创建流程

  1. 登录智能联络中心控制台

  2. 创建账号

    1. 在左侧导航栏,选择个性化音色 > Cosyvoice开放TTS音色 > 账号管理,单击创建账号

      image.png

    2. 根据页面提示,配置账号相关信息,单击确认完成创建。

      image.png配置项说明:

      配置项

      说明

      账号名称

      自定义的账号名称。

      APP ID

      Cosyvoice开放TTS音色的APP ID。

      Access Token

      Cosyvoice开放TTSAccess Token。

      模型地址

      Cosyvoice开放TTS的模型地址。

  3. 创建Cosyvoice开放TTS音色

    1. 在左侧导航栏,选择个性化音色 > Cosyvoice开放TTS音色 > 音色管理,单击创建Cosyvoice开放TTS音色

      image.png

    2. 根据页面提示,配置Cosyvoice开放TTS音色相关信息,单击确认完成创建。

      image.png

      配置项说明:

      配置项

      说明

      音色名称

      自定义的音色名称。

      账号名称

      选择已创建的Cosyvoice开放TTS账号。

      声音风格

      指百炼voice_id音色ID。

      备注

      自定义备注信息。

  4. 完成创建后,在Cosyvoice开放TTS音色页面单击试听

    image.png

  5. 确认效果满意符合您的要求后,即可在大模型应用管理 > 创建大模型应用 > 呼叫音色中使用该音色。

使用流程

说明

前提条件:已完成创建流程并确认效果满足您的要求。

  1. 登录智能联络中心控制台

  2. 在左侧导航栏,选择大模型通信 > 通信智能引擎 > 大模型应用管理

  3. 在大模型应用管理页面单击创建大模型应用编辑已创建的大模型应用。

    image.png

  4. 在弹出的大模型应用管理编辑或创建页面,单击选择呼叫音色。在弹出的对话框中选择需要使用的音色类型。下拉选择已创建的个性化音色。单击确定完成添加。

    说明

    声明:如果您使用的是第三方音色,如:豆包、MiniMax等,语速、音量参数阿里云按比例与第三方平台进行映射,同时暂不支持使用MSML标签以及开场白录音等功能请在使用前先进行试听和拨测,确认是否符合业务需求。

    image