全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件

过滤规则设置

更新时间:2017-11-08 09:57:28

设置过滤规则

配置好主题及关键词后,如果抓取的内容太多怎么办?其中一个办法是通过设置“过滤规则”来对抓取内容进行过滤。满足定义好的过滤规则的内容将不再抓取。

点击Tab ‘过滤规则’ 后出现规则列表页,添加过滤规则或者对已有规则进行编辑或者批量删除。

添加过滤规则:

可在主题中添加多个数据过滤规则,它们之间为或的逻辑关系。即可按关键词、反馈名/源站名称、网站URL和作者信息来进行规则设定。如下图:

filter

“规则”需要根据下面的“过滤类型”来填写不同的内容,关键词是针对抓取的文本内容来过滤的。“网站url”则是针对抓取的站点url来过滤的,如m.techweb.com.cn。

填写“规则”需学习下面几点:

a、规则可以直接写关键字进行匹配,示例:搜索 ,会把包含”搜索“的内容进行匹配

b、多个关键字同时匹配可通过+ 连接,其中包括标题过滤关键词以及正文过滤关键词

c、多个网站url用英文状态下的逗号相连,表示 或的关系

d、规则支持正则表达式,只需要在规则前增加RE(空格),示例1: RE ^\w+$,表示对纯数字/英文的内容进行匹配。示例2:RE^[\s\S]{0,5}$,表示对小于5个字符的内容进行匹配

e、正则表达式测试教程

注意:

1 勾选正则表达式时,输入框切换为正则表达式的输入方式

2 用户在过滤网站URL时,源站类型将不可操作

3 过滤至回收站是默认“是”,即过滤的内容是否进去回收站,如果不是,则过滤内容不进去回收站,则不消耗推送舆情配额

编辑&删除过滤规则

如下图,可以点击某调过滤规则相应按钮进行编辑,也可以选择多条后进行批量操作。

filterrule

本文导读目录