文档

产品简介

更新时间:

产品介绍

生成式语音大模型(CosyVoice)服务是依托大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。

产品优势

  • 高度拟人化:采用阿里通义语音实验室自研的CosyVoice 生成式神经网络语音大模型算法,使生成的语音在语调、韵律、情感表达等方面达到与真人难以区分的程度。

  • 多样化音色选择:提供海量优质的音库资源,包括不同性别、年龄、方言以及各种特色声音,满足用户在不同场景下的个性化需求。无论是新闻播报的庄重严肃,还是故事讲述的情感丰富,都能轻松驾驭。

  • 实时高效合成:系统具有出色的响应速度和流式语音合成处理能力,无论是长篇文档还是短句指令,都能实现快速、准确的实时语音合成。

  • 支持富语言声音事件以及多情感的高拟人语音生成,例如笑声、语气词等,以及不同情感表现的高拟人语音生成。

  • 灵活应用广泛:适用于多种应用场景,如智能客服、有声读物、车载导航、教育辅导等,极大地拓宽了语音交互的可能性,提升用户体验的同时,也为企业智能化转型提供了强大支持。

产品音色

场景

音色名称

(voice参数值)

音色类型

支持语言

支持采样率

支持时间戳功能

智能客服

longshuo

普通话男声

中文及中英文混合

8k/16k/24k

loongstella

普通话女声

中文及中英文混合

8k/16k/24k

对话闲聊

longxiaocheng

普通话男声

中文及中英文混合

8k/16k/24k

longxiaoxia

普通话女声

中文及中英文混合

8k/16k/24k

longxiaochun

普通话女声

中文及中英文混合

8k/16k/24k

longxiaobai

普通话女声

中文及中英文混合

8k/16k/24k

longlaotie

东北普通话男声

中文及中英文混合

8k/16k/24k

有声读物

longyue

普通话女声

中文及中英文混合

8k/16k/24k

loongbella

普通话女声

中文及中英文混合

8k/16k/24k

longyuan

普通话女声

中文及中英文混合

8k/16k/24k

新闻播报

longshu

普通话男声

中文及中英文混合

8k/16k/24k

longjing

普通话女声

中文及中英文混合

8k/16k/24k

车载导航

longmiao

普通话女声

中文及中英文混合

8k/16k/24k

  • 本页导读 (1)