本文介绍如何配置存量扫描任务,对指定OSS Bucket中的已有图片或视频文件进行一次性违规检测,并在检测完成后查看扫描结果和统计数据。
背景信息
关于OSS违规检测的使用限制(例如支持的OSS Bucket、检测场景、文件格式等),请参见使用限制。
前提条件
- 已经开通OSS对象存储服务并授权内容安全读取您的OSS Bucket。具体操作,请参见授权内容安全访问OSS存储空间。
- 已完成配置回调通知。具体操作,请参见配置消息通知。
步骤一:创建存量扫描任务
- 登录内容安全控制台。
- 在左侧导航栏,选择OSS违规检测 > 存量扫描。
- 单击创建扫描任务,配置存量扫描任务。
- 在存量扫描任务-创建向导对话框,完成以下配置。
- 选择Bucket。
从左侧待选择框,选中需要检测的Bucket,添加到右侧的已选择框,然后单击下一步。
- 设置过滤条件。配置说明:
- 过滤或排除:默认扫描已选Bucket中的所有文件,如果您需要指定扫描Bucket中的哪些文件或者不要扫描哪些文件,则可以单击Bucket右侧的设置过滤条件,并在过滤条件对话框,按照页面提示完成过滤条件配置,然后单击确定。
表 1. 过滤条件参数说明 配置项 说明 过滤条件 支持包含(表示扫描指定的路径)或排除(表示扫描时排除指定的路径)。 必须且只能选择一种方式。
路径 输入要包含或排除的路径。 单击添加可以添加多个路径。最多允许添加10个。
配置示例(以包含条件为例):- 添加
img/test_
,表示只扫描Bucket中以img/test_为前缀的文件。 - 如果要扫描的文件在特定目录下,您可以在文件名前加上目录路径,以整体作为前缀。例如,您要扫描的文件在img/202011目录下,且前缀为test_,您可以添加
img/202011/test_
作为路径。
- 添加
- 时间范围:必填。设置文件上传时间范围。内容安全只扫描在指定时间范围内上传的文件。
然后单击下一步。
- 过滤或排除:默认扫描已选Bucket中的所有文件,如果您需要指定扫描Bucket中的哪些文件或者不要扫描哪些文件,则可以单击Bucket右侧的设置过滤条件,并在过滤条件对话框,按照页面提示完成过滤条件配置,然后单击确定。
- 配置检测场景。OSS违规检测为您提供8个推荐配置,每种推荐配置包含大类场景(图片、视频、语音)和细分场景(每种推荐配置的细分场景均不相同)。如果推荐的配置与您业务不符,您可以关闭或者开启大类场景,但不支持修改细分场景。
然后单击下一步。
- 配置扫描范围。扫描范围根据您配置的检测场景显示。例如,您在场景配置页面只勾选图片,那么扫描配置页面就只显示图片的配置信息。如果当前配置与您业务不符,您可以自定义扫描范围。说明 至少选择一类检测场景进行扫描,即图片、视频、语音中至少开启一项。
表 2. 扫描配置参数说明 扫描范围 配置项 说明 图片 图片扫描上限 扫描的图片张数默认为10,000张/Bucket。如果设置了扫描上限,扫描数量超出限制后将会停止扫描,因此会存在巨大违规图片外露的风险。常规情况下,不建议您设置扫描上限。 检测无后缀文件 开启检测无后缀文件后,会扫描无后缀的图片文件,检测速度会降低,根据HTTP头的content-type判断是否为图片,支持content-type有:image/jpg,image/jpeg,image/png,image/gif,image/bmp,image/webp。 视频 视频扫描上限 扫描的视频个数默认为1,000个/Bucket。如果设置了扫描上限,扫描数量超出限制后将会停止扫描,因此会存在巨大违规视频外露的风险。常规情况下,不建议您设置扫描上限。 截帧频率 截帧频率默认为1帧/秒,您可以设置截帧频率(每多少秒截取一帧)。取值范围1~60帧/秒。截帧频率越高,识别准确率越高。 单视频帧数上限 单视频帧数默认为200帧,您可以设置单个视频的最大截帧数量。取值范围:5~20,000帧。 单视频大小上限 单视频大小默认为500 MB,您可以设置单视频大小上限,取值范围:1~2,048 MB,超过部分不会被检测。 语音 语音扫描上限 扫描的音频个数默认为1,000个/Bucket。如果设置了扫描上限,扫描数量超出限制后将会停止扫描,因此会存在巨大违规音频外露的风险。常规情况下,不建议您设置扫描上限。 单音频大小上限 单音频大小默认为200 MB。您可以设置单音频大小上限,取值范围:1~2,048 MB,超过部分不会被检测。 然后单击下一步。
- 冻结配置。根据是否需要自动冻结检测出来的违规图片、视频和语音,配置对应的冻结规则,并选择一种冻结方式。配置说明:
- 自动冻结违规图片:开启图片区域下的需要自动冻结开关,并为不同场景设置对应的冻结规则(不同场景的设置方法一样)。
支持以下两种类型的冻结规则:
- 按分值冻结:选择按分值冻结并设置一个违规分数阈值。当图片的违规分超过阈值时,将被冻结。
注意 请慎重修改冻结阈值。默认冻结分数是99.01分,正常情况下不建议设置到99分以下,分数过低可能会导致正常图片被冻结。
- 按结论冻结:选择按结论冻结并选中要冻结的违规内容类型,可选项:冻结确定违规内容、冻结疑似违规内容。
说明 建议您优先使用按结论冻结,按分值冻结需具有一定的专业知识。如果您分值配置不适当可能会导致正常图片被冻结。
- 按分值冻结:选择按分值冻结并设置一个违规分数阈值。当图片的违规分超过阈值时,将被冻结。
- 自动冻结违规视频:开启视频区域下的需要自动冻结开关,并为不同场景选择要冻结的违规内容类型,可选项:冻结确定违规内容、冻结疑似违规内容。
- 自动冻结违规语音:开启语音区域下的需要自动冻结开关,并为不同场景选择要冻结的违规内容类型,可选项:冻结确定违规内容、冻结疑似违规内容。
- 选择冻结方式:
- 修改权限:将您Bucket中public权限的违规文件设置为private访问权限。
互联网用户无法读取private权限的文件,但您可以通过文件URL将私有文件分享给您的合作伙伴访问。更多信息,请参见在URL中包含签名。
- 移动文件:将您Bucket中违规的文件移动到Bucket中的备份目录(位置:${bucket}/aligreen_freeze_backup/),并删除原路径下的文件。
注意 选择该方式时请慎重。文件删除后将无法恢复,如需找回被删除的文件,您必须到备份目录中查找。
- 修改权限:将您Bucket中public权限的违规文件设置为private访问权限。
然后单击下一步。
- 自动冻结违规图片:开启图片区域下的需要自动冻结开关,并为不同场景设置对应的冻结规则(不同场景的设置方法一样)。
- 可选:其它。在回调通知区域,您可以选择一个已有的回调通知方案,通过指定的通知方案接收存量扫描的结果。您必须先创建回调通知方案才可以进行设置。如果您未创建过回调通知方案,可以单击新增通知方案去添加通知方案。具体操作,请参见配置消息通知。
- 选择Bucket。
- 在页面最下方,单击提交。OSS违规检测功能会根据您的配置为您预估出扫描费用的上限,您可以根据实际业务选择按量付费或者资源包抵扣方式。
然后单击确定。
存量扫描任务提交后,将立即开始扫描。扫描所需时间取决于存量文件的数量和开启的扫描场景。您可以在存量扫描任务列表中查看当前任务的状态。OSS违规检测为您提供如下功能。您需要根据实际需要,选择合适的操作。- 暂停扫描
如果您因为其他原因,需要暂停扫描任务时,单击操作列暂停扫描。只有扫描任务未结束时可以执行该操作,支持扫描任务暂停后7天内可以继续扫描。
- 数据统计
如果您需要查看当前任务的调用量统计信息,单击操作列数据统计,进入OSS违规检测调用量页面,查看最近7天的调用量。您可以设置扫描的时间、任务等条件自定义查询统计信息。
- 终止扫描
如果您不再需要扫描当前任务时,单击操作列终止扫描,终止扫描后存量的文件将不再执行扫描动作。只有扫描任务未结束时可以执行该操作。
- 扫描结果
如果您需要查看当前任务的扫描结果,在操作列选择更多 > 扫描结果(任务未扫描完成)或者单击操作列扫描结果(任务已扫描完成)。您可以设置扫描的时间、任务等条件自定义查询结果信息。
- 查看配置
如果您需要查看当前任务的配置信息,在操作列选择更多 > 查看配置(任务未扫描完成)或者单击操作列查看配置(任务已扫描完成),展开任务配置详情面板查看。
- 用量说明
如果您需要查看当前任务的用量,在操作列选择更多 > 用量说明,展开任务用量说明面板查看。
- 暂停扫描
步骤二:查看扫描结果
OSS违规检测服务为您提供查看扫描结果的功能,当您完成增量扫描任务后,您可以随时在内容安全控制台查看扫描结果,并根据检测结果执行自助审核。
- 在存量扫描页面,查看您的任务概览、任务状态以及任务结果。
- 单击操作列扫描结果,查询扫描结果并进行自助审核。默认显示最近7天的扫描结果和处理的违规内容。您可以设置文件类型、检测场景、Bucket、分值、识别结果、Key和时间范围自定义扫描范围。
通过导出,将扫描结果导出进行查看。少于50条记录时将导出所有结果,否则只导出违规和疑似违规的结果。
说明 通过单击扫描结果的图片或视频,可以查看详细信息,具体包括文件创建时间、Key值(OSS扫描的文件名)、所在Bucket。如果扫描结果不符合您的业务需要,您可以对扫描结果进行自助审核,自助审核包含如下操作:- 违规并删除
通过单击违规并删除,可将图片或视频从内容安全控制台和OSS Bucket中一并删除。支持单选或者多选。
- 正常并忽略
通过单击正常并忽略,则忽略该检测结果。忽略后该图片或视频将不再在控制台展示,并不影响存储在OSS Bucket中的图片或视频。支持单选或者多选。
- 正常并解冻
若您设置了自动冻结功能,则还可以在选中图片或视频后单击正常并解冻,将已冻结的图片或视频解冻。
您可以搜索您重点关注的结果,或者将扫描结果导出进行查看(少于50条记录时将导出所有结果,否则只导出违规和疑似违规的结果)。
- 违规并删除
步骤三:查看统计数据
OSS违规检测服务为您提供数据统计功能,当您完成存量扫描任务后,您可以随时在内容安全控制台查看数据统计信息。您可以通过监控一段时间的统计数据,根据网站的之前数据的违规情况,对网站的存量内容加以调整。
- 在存量扫描页面的操作列,单击数据统计。
- 在数据统计页面,通过单击图片、视频和语音页签查看最近7天扫描的统计信息。
支持查看的数据统计信息如下表所示。
查询对象 支持的统计信息 图片 - 图片总量:表示检测的图片总数量。
- 鉴黄场景检测量:包含违规、疑似、正常结果的数量。
- 暴恐涉政场景检测量:包含违规、疑似、正常结果的数量。
- 广告场景检测量:包含违规、疑似、正常结果的数量。
- 不良场景检测量:包含违规、疑似、正常结果的数量。
视频 - 视频总量:表示检测的视频总数量。
- 截帧总量:表示检测的视频截帧总数量。
- 鉴黄场景视频量:包含违规、疑似、正常结果的数量。
- 暴恐涉政场景视频量:包含违规、疑似、正常结果的数量。
- 广告场景检测量:包含违规、疑似、正常结果的数量。
- 不良场景检测量:包含违规、疑似、正常结果的数量。
- 语音反垃圾检测量:包含违规、疑似、正常结果的数量。
语音 - 语音总量:包含违规、疑似、正常结果的数量。
- 语音总时长:包含违规、疑似、正常结果的数量。
- 语音反垃圾检测量:包含违规、疑似、正常结果的数量。