产品介绍
生成式语音大模型(CosyVoice)服务是依托大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。
产品优势
高度拟人化:采用阿里通义语音实验室自研的CosyVoice 生成式神经网络语音大模型算法,使生成的语音在语调、韵律、情感表达等方面达到与真人难以区分的程度。
多样化音色选择:提供海量优质的音库资源,包括不同性别、年龄、方言以及各种特色声音,满足用户在不同场景下的个性化需求。无论是新闻播报的庄重严肃,还是故事讲述的情感丰富,都能轻松驾驭。
实时高效合成:系统具有出色的响应速度和流式语音合成处理能力,无论是长篇文档还是短句指令,都能实现快速、准确的实时语音合成。
支持富语言声音事件以及多情感的高拟人语音生成,例如笑声、语气词等,以及不同情感表现的高拟人语音生成。
灵活应用广泛:适用于多种应用场景,如智能客服、有声读物、车载导航、教育辅导等,极大地拓宽了语音交互的可能性,提升用户体验的同时,也为企业智能化转型提供了强大支持。
产品音色
场景 | 音色名称 (voice参数值) | 音色类型 | 支持语言 | 支持采样率 | 支持时间戳功能 |
智能客服 | longshuo | 普通话男声 | 中文及中英文混合 | 8k/16k/24k | 否 |
loongstella | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
对话闲聊 | longxiaocheng | 普通话男声 | 中文及中英文混合 | 8k/16k/24k | 否 |
longxiaoxia | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
longxiaochun | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
longxiaobai | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
longlaotie | 东北普通话男声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
有声读物 | longyue | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 |
loongbella | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
longyuan | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
新闻播报 | longshu | 普通话男声 | 中文及中英文混合 | 8k/16k/24k | 否 |
longjing | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 | |
车载导航 | longmiao | 普通话女声 | 中文及中英文混合 | 8k/16k/24k | 否 |
- 本页导读 (1)