计费说明

本文为您介绍智能语音交互的计费详细说明和附加产品计费说明。

计费详细说明

智能语音交互支持后付费的付费方式。其中,资源包可对后付费用量进行抵扣,但资源包不支持续费升级,支持叠加购买抵扣;后付费按天结算,随调用量增加梯度报价。

  • 按量付费(后付费):按照各计费项的实际用量结算费用,先使用,后付费,适用于业务用量经常有变化的场景。

  • 资源包(抵扣后付费):预先购买针对不同的计费项推出的优惠资源包,在费用结算时,优先从资源包抵扣用量,先购买,后抵扣,适用于业务用量相对稳定的场景。

重要
  • 相较于按量付费,资源包具有一定的优惠折扣。

  • 超出资源包抵扣额度的用量,计入按量计费,会产生后付费账单,请根据您的所需服务、业务量,购买适合业务额度的资源包。

  • 开通商用后,产生后付费用量后,才可使用资源包抵扣。

  • 资源包的有效期为购买之日起1年以内,如您有更大规模的购买需求,请联系阿里云商务经理。

  • 预付费资源包需开通商业版后方可生效。更多信息,请参见服务升级与购买

资源包规格

商品规格

资源包规格

资源包价格

单价

录音文件识别

40小时

100元

2.50元/小时

1,000小时

1,200元

1.20元/小时

20,000小时

20,000元

1.00元/小时

100,000小时

90,000元

0.90元/小时

250,000小时

200,000元

0.80元/小时

录音文件识别极速版

40小时

100元

2.50元/小时

1,000小时

1,560元

1.56元/小时

20,000小时

26,000元

1.30元/小时

100,000小时

117,000元

1.17元/小时

250,000小时

260,000元

1.04元/小时

录音文件识别闲时版

10,000小时

6,000元

0.60元/小时

50,000小时

25,000元

0.50元/小时

100,000小时

45,000元

0.45元/小时

实时语音识别

30小时

100元

3.33元/小时

1,000小时

1,800元

1.80元/小时

10,000小时

15,000元

1.50元/小时

84,000小时

100,000元

1.20元/小时

182,000小时

200,000元

1.10元/小时

300,000小时

300,000元

1.00元/小时

一句话识别

30千次

100元

3.33元/千次

1,000千次

1,800元

1.80元/千次

10,000千次

15,000元

1.50元/千次

84,000千次

100,000元

1.20元/千次

182,000千次

200,000元

1.10元/千次

300,000千次

300,000元

1.00元/千次

语音合成

30千次

100元

3.33元/千次

1,000千次

1,800元

1.80元/千次

10,000千次

15,000元

1.50元/千次

84,000千次

100,000元

1.20元/千次

182,000千次

200,000元

1.10元/千次

300,000千次

300,000元

1.00元/千次

长文本语音合成

100万字

220元

2.20元/万字

500万字

1,000元

2.00元/万字

2,000万字

3,600元

1.80元/万字

5,000万字

8,000元

1.60元/万字

8,000万字

11,200元

1.40元/万字

声音事件检测

40小时

50元

1.25元/小时

1,000小时

600元

0.60元/小时

20,000小时

10,000元

0.50元/小时

100,000小时

45,000元

0.45元/小时

250,000小时

100,000元

0.40元/小时

说话人识别

30千次

100元

3.33元/千次

1,000千次

1,800元

1.80元/千次

10,000千次

15,000元

1.50元/千次

84,000千次

100,000元

1.20元/千次

182,000千次

200,000元

1.10元/千次

300,000千次

300,000元

1.00元/千次

性别识别

30千次

50元

1.66元/千次

1,000千次

900元

0.90元/千次

10,000千次

7,500元

0.75元/千次

84,000千次

50,000元

0.60元/千次

182,000千次

100,000元

0.55元/千次

300,000千次

150,000元

0.50元/千次

语种识别

30千次

50元

1.66元/千次

1,000千次

900元

0.90元/千次

10,000千次

7,500元

0.75元/千次

84,000千次

50,000元

0.60元/千次

182,000千次

100,000元

0.55元/千次

300,000千次

150,000元

0.50元/千次

重要

定制后,使用文字转语音的价格:

  • 控制台使用,请参见下方【语音合成】的价格说明。

  • 代码接入,请参见接入的接口能力价格。

  • 若您有更大规模购买需求,请提交工单

商品规格

规格数量

单价(元)

备注

标准版离线语音合成SDK

1~10000个

5

可使用标准版离线语音合成语音包

10001~50000个

4

50001~100000个

3

100001~200000个

2.5

200001-500000个

2

精品版离线语音合成SDK

1~10000个

10

可使用精品版离线语音合成语音包

10001~50000个

8

50001~100000个

6

100001~200000个

5

200001-500000个

4

后付费方式

商品规格

标准价

每日用量

梯度折扣价

实时语音识别

3.50元/小时

0~299小时

3.50元/小时

300~999小时

3.00元/小时

1000~2999小时

2.40元/小时

3000~4999小时

1.60元/小时

5000小时以上

1.20元/小时

一句话识别

3.50元/千次

0~299千次

3.50元/千次

300~999千次

3.00元/千次

1000~2999千次

2.40元/千次

3000~4999千次

1.60元/千次

5000千次以上

1.20元/千次

录音文件识别

2.50元/小时

0~299小时

2.50元/小时

300~999小时

2.20元/小时

1000~2999小时

1.80元/小时

3000~4999小时

1.50元/小时

5000小时以上

1.00元/小时

录音文件识别极速版

3.30元/小时

0~299小时

3.30元/小时

300~999小时

2.90元/小时

1000~2999小时

2.34元/小时

3000~4999小时

1.95元/小时

5000小时以上

1.30元/小时

录音文件识别闲时版

1元/小时

0~10000小时

1元/小时

10,000~50,000小时

0.8元/小时

50,000小时以上

0.6元/小时

灵积语音模型服务Paraformer语音识别

0.288元/小时

不限

无梯度

语音合成

3.50元/千次

0~299千次

3.50元/千次

300~999千次

3.00元/千次

1000~2999千次

2.40元/千次

3000~4999千次

1.60元/千次

5000千次以上

1.20元/千次

语音合成CosyVoice大模型

2.00元/万字符

重要

1个汉字算作2个字符;1个英文字母、1个标点或1个句子中间空格均算作1个字符。

不限

无梯度

长文本语音合成

3元/万字

0~19万字

3.00元/万字

20~99万字

2.80元/万字

100~999万字

2.60元/万字

1000~3999万字

2.40元/万字

4000万字以上

2.20元/万字

流式文本语音合成

1.00元/万字

不限

无梯度

声音事件检测

1.25元/小时

0~299小时

1.25元/小时

300~999小时

1.10元/小时

1000~2999小时

0.90元/小时

3000~4999小时

0.75元/小时

5000小时以上

0.50元/小时

说话人识别

3.50元/千次

0~299千次

3.50元/千次

300~999千次

3.00元/千次

1000~2999千次

2.40元/千次

3000~4999千次

1.60元/千次

5000千次以上

1.20元/千次

性别识别

1.80元/千次

0~299千次

1.80元/千次

300~999千次

1.50元/千次

1000~2999千次

1.20元/千次

3000~4999千次

0.80元/千次

5000千次以上

0.60元/千次

语种识别

1.80元/千次

0~299千次

1.80元/千次

300~999千次

1.50元/千次

1000~2999千次

1.20元/千次

3000~4999千次

0.80元/千次

5000千次以上

0.60元/千次

重要
  • 试用版

    自2020年03月01日起,免费试用版规则调整为如下内容:

    • 试用版不计费,如有变化,请关注官网通知。

    • 一句话识别、实时语音识别、语音合成每自然日内支持2个并发调用,每自然日用量不限,免费试用期限为三个月。

    • 新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。

    • 长文本语音合成、录音文件识别极速版、录音文件识别闲时版、语音合成CosyVoice大模型和流式文本语音合成(CosyVoice大模型)均不支持试用版,如需使用请开通商用版本。

  • 商用版

    2019年06月10日零时后自动调整为如上新规计费方式。

    • 对于录音文件识别,若您需要超过2个小时或更长的接口使用时长,请开通商用版。

    • 开通商用版默认为后付费方式。有后付费账单后,才可进行资源包抵扣。购买资源包后,优先消耗资源包资源,资源包用完后变为后付费价格。

    • 商用版按每自然日使用量计费,无免费额度,不使用则不产生费用。北京时间每日24时,系统将自动对当日用量进行全量计算并计费,账单生成将稍有延迟。

    • 开通商用版后,不建议再次降配为试用版。商用版降配试用版后,可用并发数将置为0,服务将无法继续使用。

计费规则

智能语音交互产品计费规则如下:

  • 按时长计费的,累加每次调用的语音时长(按秒向下取整。如本次发送的语音长度为22.8秒,则记为22秒)。

  • 按次数计费的,返回失败的调用不计入次数。

  • 计费总额按照当日24时前总用量对应的梯度折扣价进行全量计费。如一句话识别,当日达到500千次调用量,则当日扣费500*3.0元(300~999千次阶梯价格)=1500.0元。

  • 语音合成的计费调用次数按照每次请求传入的字符数(UTF-8编码。1个汉字、英文字母、全半角标点符号均算1个有效字符。SSML标签不算作字符。)作为统计依据:100个字符内(含100个)记为1次计费调用;每超过100个字符增加1次计费调用,且1次请求最多传入300个字符。如,102个字符记为2次计费调用,201个字符记为3次计费调用,依此类推。

  • 当调用量不足最小计价单位时,计费=(使用量/最小计价单位)*单价。如:使用录音文件识别处理了30分钟的音频,则计费=0.5小时*2.5元/小时=1.25元;使用长文本语音合成处理了1千字,则计费=0.1万字*3元/万字=0.3元。

  • 多声道计费模式:

    • 8k处理双声道,按单声道计费,即音频时长进行计费。

    • 16k处理多声道,按多声道计费,即声道数×音频时长进行计费。例如有左右2个声道,则为2×时长进行计费。

附加产品计费明细

  • 超额并发线路租赁费

    商品规格

    收费说明

    计价单位(只支持预付费预先设置)

    一句话识别/实时语音识别

    对于有并发要求的商品规格,超过200路并发的部分。

    100元/路/月

    1200元/路/年

    录音文件识别极速版

    对于有并发要求的商品规格,超过10路并发的部分。

    200元/路/月

    2400元/路/年

    说明

    并发数计算:并发数指同一个账号同时在处理的请求数。一般语音请求的处理都会延续一段时间。例如,您新建一个语音识别请求,持续发送语音数据给服务端,这时并发数就是1;在该请求处理的同时,又新建了一个请求发送语音数据,这时服务端同时处理该账号的2个请求,并发数就变为2。

  • 语言模型定制

    由于技术升级,语言模型定制现已免费开放给所有用户。每位用户最多支持创建10个模型。

    您可以借助语言模型定制工具对垂直领域的识别效果进行优化,从而提升语音识别率。

  • 语音合成声音定制

    由于目前语音合成声音定制产品对于不同场景、不同数据量、是否IP独占及录音风格等维度均需要与您详细沟通,所以语音合成定制没有统一报价。

    如果您有相关需求,可发邮件至nls_support@service.aliyun.com,将有相关负责人与您联系。

  • 离线语音合成

    由于目前离线语音合成声音产品对于不同硬件、不同模型声音等维度需要与您详细沟通,所以报价需要详询商务。

    如果您有相关需求,可发邮件至nls_support@service.aliyun.com,将有相关负责人与您联系。

相关文档

更多关于并发数的详细说明,请参见并发与监控FAQ