语音审核增强版服务通过升级内容安全核心引擎,提供面向图文分享、游戏连麦、直播课程等业务场景的审核服务,识别违反网络内容传播规定、影响平台秩序和用户体验的内容或元素,提供丰富的内容风险标签。本文介绍如何使用语音审核增强版。
相比较语音审核1.0版本,语音审核增强版支持更多的功能特性,为您提供更高效的内容安全保障。
对比项 | 语音审核1.0版本 | 语音审核增强版 |
业务匹配 | 默认配置适用于通用场景,不具备业务特性,正式使用需要先沟通标准,与策略适配。 | 匹配多种业务场景,包括社交直播语音、综合音视频、语聊房间等,简化业务接入和选型的过程,提升合规风险覆盖范围。 |
语音切片 | 采用语义断句的切片方案,语音切片时长分布在几秒至几十秒以内。 | 采用可调节的切片方案,语音切片为固定时长。固定切片时长能够提高人工复审的效率。 |
审核能力 |
|
|
接口功能 |
|
|
功能特性
匹配业务场景
语音审核增强版服务目前支持社交直播语音流和音视频媒体文件两种业务场景,您可根据需要选择对应的服务。
服务名称 | service | 场景特性说明 |
社交娱乐直播检测 | live_stream_detection |
|
音视频媒体检测 | audio_media_detection |
|
音视频媒体多语言检测 | audio_multilingual_cb |
|
丰富审核标签
语音审核增强版能够支持更丰富的审核标签。如果语音中存在多种风险,将同时返回多个标签。具体说明如下所示:
标签类型 | 分类 |
风险标签(labels) |
|
提升审核性能
语音审核增强版采用高性能的核心引擎,能够高并发调度几十种模型和策略,为语音直播和语音聊天等场景,提供更高时效性的服务保障。
服务性能 | 说明 |
文件大小 | 增强版支持音频文件的大小限制从200 MB提高到500 MB。 |
请求频率(QPS) | 提交任务请求频率(QPS)从50次/秒提升至100次/秒。 |
并发路数 | 增强版支持的默认并发路数限制从20路提高至50路。 |
语音审核的QPS是指API每秒响应的请求数;并发路数是指系统中同时检测的语音文件或语音流数量。
计费说明
语音审核增强版服务支持按量后付费和资源包抵扣两种付费方式。
按量后付费
当您开通语音审核增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。更多内容,请参见开通内容审核增强版服务。
审核类型 | 计费单价 |
语音审核通用(audio_standard) | 225元/万分钟,相当于1.35元/小时。 |
资源包抵扣
如果您的审核量较大,或有相对固定的审核需求,建议预先购买资源包的方式。购买资源包规格越大,享受越低折扣,支持叠加购买和使用。更多内容,请参见购买内容审核增强版抵扣资源包。
该资源包用于语音审核增强版用量的抵扣,无法与内容安全流量包共享,具体的抵扣系数如下:
审核类型 | 抵扣系数 |
语音审核通用(audio_standard) | 抵扣系数为30,表示每成功调用服务单位分钟,抵扣资源包的容量规格30次。 例如,购买的资源包的流量包容量规格为100次,当您需要审核的语音时长为1分钟,调用成功后抵扣流量包容量规格消耗30次,剩余70次。 |
步骤一:开通服务
在正式使用语音审核增强版功能之前,需要先开通服务。
步骤二:配置审核规则
语音审核增强版为您内置了一套语音审核的标签,主要包含涉政、特定声音、特定歌曲、色情、呻吟、暴恐、违禁、广告、宗教、辱骂、不良场景、静音音频。如果内置标签无法满足您的业务需求,可以自定义词库,设置有风险的违规关键词或者在检测语音前需要过滤掉的关键词,然后配置匹配关键词的规则。
登录内容安全控制台。
在左侧导航栏,选择
。配置词库。
在词库管理页签,单击创建词库。
在创建词库面板,填写词库名称、批量添加词或者上传文件批量导入词库。
您也可以选择先建库,后面再添加词方式,即暂不添加关键词,之后根据业务需要在词库中添加关键词。同一个账号下总共支持添加10万个关键词,最多可创建20个词库。单个关键词不允许超过20字,不支持输入特殊字符。
单击创建词库。
如果词库创建失败,会有具体的提示信息,您可以根据提示重新创建。
单击操作列管理或者清空,可以修改关键词或者一键清除所有关键词。
配置规则。
在规则管理页签,选择目标服务,单击右侧操作列设置词库。
在设置面板,选择用于忽略的词库。然后单击下一步。
忽略词库的任何一个关键词只要与待审核语音转为的文本匹配成功后,先进行忽略再检测。该场景主要对一些关键词加入白名单,不需要检测。
例如,设置的忽略词库中的关键词为房管、粉丝。此时,待审核语音转文本为欢迎来到直播间,双击点赞,粉丝牌加房管得主播好友位,那么房管、粉丝先被忽略掉,只对欢迎来到直播间,双击点赞,牌加得主播好友位进行风险检测。
选择用于命中的词库,然后单击确定。
命中词库的任何一个关键词只要与待审核语音转为的文本匹配成功后,使用API调用语音审核增强版时
labels
会返回C_customized
(用户库命中,表示命中您创建的词库)。该场景主要是检测待审核语音转为文本中是否存在违规风险。例如,设置的命中词库中的关键词为房管、粉丝。此时,待审核语音转文本为欢迎来到直播间,双击点赞,粉丝牌加房管得主播好友位,那么进行语音风险检测时,会匹配到房管和粉丝关键词。使用API调用语音审核增强版时返回参数
labels
的值除了返回内置的标签外(如果匹配到会返回,否则不返回),还会返回C_customized
。
规则配置完成后,会在3分钟后生效,请您耐心等待。
步骤三:接入语音审核增强版
目前,语音审核增强版支持以下三种接入方式。
调用API接入服务。具体操作,请参见语音审核增强版API。
使用SDK接入服务。具体操作,请参见SDK接入指南。
使用HTTP接入服务。具体操作,请参见HTTP接入指南。
步骤四:查看审核结果
你可以通过查看审核的结果,分析审核语音中高频的违规类型。
登录内容安全控制台。
在左侧导航栏,选择
。在结果查询页面,查看审核的语音、命中的标签及请求时间。
您可以设置查询时间范围、请求ID、文本(待审核语音转为的文本)、标签搜索待查询的信息。支持查询30天以内的数据,结果查询页面最多可以保存5万条数据,如果您有更高的存储需求,在调用API后需要您自行保存返回结果。
按照标签搜索查询信息时,标签的筛选方式如下:
包含:表示返回结果标签中包含输入的标签值。
不包含:表示返回结果标签中不包含输入的标签值。
空:表示返回结果没有命中任何标签。
非空:表示返回结果命中了任意标签的(无需输入标签值)。
定位到某条语音转文本的内容,单击右侧操作列的查看。
在查看详情面板,查看该条语音转文本内容被审核的详细信息。
步骤五:统计用量
统计调用量数据,帮助您了解当前阿里云账号(主账号)及其RAM用户(子账号)近期的语音审核增强版的调用量。
在左侧导航栏,选择
。在用量统计页面,查看语音审核的调用量。
您可以自定义查询时间范围,支持最近的365天内的调用量。支持按天、按月查询,按天默认显示最近的30天内每天的调用量,按月默认显示最近12个月内每个月的调用量。支持按阿里云账号及其RAM用户的维度查看调用量。
单击图标,下载用量统计数据。