1. 基于域名值的数据过滤功能

1.1. 概述

功能导航: 软件菜单-》【过滤规则设置】-》【域名前缀后缀过滤器】 如图:

域名前缀后缀过滤器

域名值,也就是域名的文本。比如"www.baidu.com" 域名值过滤,主要用来针对域名后缀或前缀进行过滤。

域名前缀后缀过滤器,可以通过识别域名,以及用户设置的规则,去决定采集到的数据是否需要存储。

1.2. 设置说明

注意!! 必须[打开对应过滤器]的启动开关,以及在[任务参数]中选择"使用过滤方案",才会生效!

设置界面,如图:

filter-language-1

1.2.1. 判断类型

判断类型分为【包含】以及【不含】;

如果为"包含",则只存储结果数据中,域名内容包含【规则值】中任意一项数据的结果

如果为"不含",则域名内容中包含【规则值】中任意一项的数据都不会被存储!

1.2.2. 规则值

规则值需要自行添加配置。可以一个或者多个。

可以点击【新增】,然后输入需要的值;然后【回车键】或者【点击空白地方】实现添加,然后点击【保存按钮】即可保存配置!

每个过滤值的前面,建议包含"." 原因如下:

".gov.cn"可以过滤xxx.gov.cn,但不会过滤 xxxgov.cn;

但是 如果不包含".", 比如填写"gov.cn" 那么会过滤xxx.gov.cn ,但也会过滤 xxxgov.cn

输入规则值后,按回车即可确认输入!

1.3. 示例说明

判断类型为不含,规则值为".edu"和".gov",则采集结果的域名中,如果包含".edu"或".gov",都会被自动过滤掉,不会存储!

比如要排除百度的所有子域名,那么启用类型就选择“不含”,过滤值里面就添加".baidu.com";

Copyright © msray.net 2020 all right reserved,powered by Gitbook文件修订时间: 2023-10-30 23:00:28

results matching ""

    No results matching ""