云监控告警

DDoS高防集成云监控告警功能,支持设置监控告警以及实时监控大盘。当高防业务发生异常时云监控可以及时地向您发送报警,帮助您缩短响应时间,尽快恢复业务。您也可以通过实时监控大盘查看监控细节,进行故障排查。本文介绍如何设置DDoS高防的监控告警以及实时监控大盘。

背景信息

云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。关于云监控的更多介绍,请参见什么是云监控

DDoS高防(中国内地)和DDoS高防(非中国内地)集成云监控告警功能,您可以在云监控中配置如下事件的报警通知或者实时监控大盘。

事件名称

事件所属类型

说明

IP流量告警

数据监控告警

您可以设置数据监控报警通知,及时获知指标数据发生的异常,并在发生故障时及时发现问题,缩短故障处理时间,以便尽快恢复业务。

连接数告警

QPS告警

状态码告警

DDoS黑洞事件告警

事件监控告警

您可以设置事件监控报警通知,及时获知DDoS高防(中国内地)和DDoS高防(非中国内地)上发生的黑洞、清洗、四层CC攻击、七层CC攻击事件,并在发生故障时及时发现问题,缩短故障处理时间,以便尽快恢复业务。

DDoS清洗事件告警

DDoS监控大盘

实时监控大盘

云监控的Dashboard功能为您提供自定义查看监控数据的功能。您可以在一张监控大盘中跨产品、跨实例查看监控数据,将相同业务的不同产品实例集中展现。

您可以在云监控中配置DDoS高防(中国内地&非中国内地)实时监控大盘,帮助您直观、全面地了解DDoS高防的业务防护情况。

单击此处查看云监控支持监控的数据指标。

监控项

监控维度

单位

高防IP出流量

实例维度、IP维度

bit/s

高防IP入流量

实例维度、IP维度

bit/s

高防IP回源流量(通过高防清洗后回源到源站服务器的干净业务流量)

实例维度、IP维度

bit/s

高防IP攻击流量

实例维度、IP维度

bit/s

活跃连接数

实例维度、IP维度

非活跃连接数

实例维度、IP维度

新建连接数

实例维度、IP维度

QPS

域名维度

个/秒

QPS环比下降率

域名维度

%

QPS环比增长率

域名维度

%

200状态码数量

域名维度

2XX状态码数量

说明

统计的是201~299之间的状态码数量。

域名维度

2XX状态码占比

域名维度

%

3XX状态码数量

域名维度

3XX状态码占比

域名维度

%

404状态码数量

域名维度

404状态码占比

域名维度

%

4XX状态码数量

说明

统计的是400~499之间除403、404和405以外,其他状态码的数量。

域名维度

4XX状态码占比

域名维度

%

5XX状态码数量

说明

统计的是500~599之间除500、502、503和504以外,其他状态码的数量。

域名维度

5XX状态码占比

域名维度

%

2XX回源状态码数量

域名维度

2XX回源状态码占比

域名维度

%

3XX回源状态码数量

域名维度

3XX回源状态码占比

域名维度

%

404回源状态码数量

域名维度

404回源状态码占比

域名维度

%

4XX回源状态码数量

域名维度

4XX回源状态码占比

域名维度

%

5XX回源状态码数量

域名维度

5XX回源状态码占比

域名维度

%

前提条件

已购买DDoS高防(中国内地)实例或DDoS高防(非中国内地)实例。具体操作,请参见购买DDoS高防实例

操作步骤

  1. 登录DDoS高防控制台

  2. 在顶部菜单栏左上角处,选择地域。

    • DDoS高防(中国内地):选择中国内地地域。

    • DDoS高防(非中国内地):选择非中国内地地域。

  3. 在左侧导航栏,选择调查分析 > 云监控告警

  4. 云监控告警页面,根据您要设置的告警类型,单击联动配置列的云监控通知

    事件名称

    操作步骤

    IP流量告警连接数告警QPS告警状态码告警

    在云监控控制台为DDoS高防(中国内地、非中国内地)创建阈值报警规则。具体操作,请参见配置数据监控报警通知

    DDoS黑洞事件告警DDoS清洗事件告警

    在云监控控制台为DDoS高防(中国内地、非中国内地)创建事件报警规则。具体操作,请参见配置事件监控报警通知

    DDoS监控大盘

    在云监控控制台为DDoS高防(中国内地、非中国内地)创建监控大盘和添加图表。具体操作,请参见配置实时监控大盘

配置数据监控报警通知

  1. 在云监控控制台,创建报警联系人。如果已有联系人,请跳过此步骤。

    1. 在左侧导航栏,选择报警服务 > 报警联系人

    2. 报警联系人页签,单击新建联系人

    3. 设置报警联系人面板,填写联系人信息并完成滑块验证,单击确认

  2. 创建报警联系人组。如果已有联系人组,请跳过此步骤。

    说明

    报警通知的接收对象必须是联系人组,您可以在联系人组中添加一个或多个联系人。

    1. 在左侧导航栏,选择报警服务 > 报警联系人
    2. 报警联系组页签,单击新建联系组

    3. 新建联系组面板,设置组名,从已有联系人中选择并添加联系人到当前组,单击确认

  3. 创建报警规则。

    1. 在左侧导航栏,选择报警服务 > 报警规则

    2. 报警规则列表页面,单击创建报警规则

    3. 创建报警规则面板,完成报警规则配置,并单击确认

      配置项

      说明

      产品

      选择DDoS高防(中国内地)或者DDoS高防(非中国内地)

      资源范围

      报警规则作用的资源范围。取值:

      • 全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。

      • 应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。

      • 实例:报警规则作用于指定云产品的指定资源上。

      规则描述

      报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

      1. 单击添加规则

      2. 设置规则描述面板,先输入规则名称,再设置规则条件。

        • 单指标:先选择监控指标,再为其设置阈值和报警级别。

        • 多指标:先选择报警级别,再为两个或两个以上的监控指标设置报警条件。

        • 智能阈值:关于智能阈值的更多信息,请参见概览创建智能阈值报警规则

      3. 单击确定

      关于如何设置复杂的报警条件,请参见报警规则表达式说明

      通道沉默周期

      报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

      某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

      例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

      生效时间

      报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。

      说明

      当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。

      报警联系人组

      选择发送报警的联系人组。

      标签

      报警规则的标签。包括标签名称和标签值。

      说明

      您最多可设置6组标签。

      报警回调

      公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

      当您需要测试报警回调地址的连通性时,可以执行以下操作。

      1. 单击回调地址正后方的测试

        WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

        说明

        您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

      2. 单击关闭

      说明

      单击高级设置,可设置该参数。

      弹性伸缩

      无需设置。如果您想了解更多信息,请参见创建报警规则

      日志服务

      消息服务MNS-Topic

      函数计算

配置事件监控报警通知

  1. 在云监控控制台,创建报警联系人。如果已有联系人,请跳过此步骤。

    1. 在左侧导航栏,选择报警服务 > 报警联系人

    2. 报警联系人页签,单击新建联系人

    3. 设置报警联系人面板,填写联系人信息并完成滑块验证,单击确认

  2. 创建报警联系人组。如果已有联系人组,请跳过此步骤。

    说明

    报警通知的接收对象必须是联系人组,您可以在联系人组中添加一个或多个联系人。

    1. 在左侧导航栏,选择报警服务 > 报警联系人
    2. 报警联系组页签,单击新建联系组

    3. 新建联系组面板,设置组名,从已有联系人中选择并添加联系人到当前组,单击确认

  3. 创建云产品事件报警规则。

    1. 在左侧导航栏,选择事件中心 > 系统事件

    2. 事件监控页签,单击右侧的旧版事件报警规则,然后单击创建报警规则

    3. 创建/修改事件报警面板,完成报警配置,并单击确定

      类型

      配置项

      说明

      基本信息

      报警规则名称

      自定义报警规则名称。

      事件报警规则

      产品类型

      选择DDoS高防(中国内地)DDoS高防(非中国内地)

      事件类型

      选择要通知的事件类型。可选项:

      • ddos黑洞:表示DDoS攻击黑洞事件。

      • ddos清洗:表示DDoS攻击清洗事件。

      • ddos4层cc攻击:表示四层CC攻击事件。

      • ddos7层cc攻击:表示七层CC攻击事件。

      事件等级

      选择要通知的事件等级。所有DDoS告警事件均为严重等级,该参数仅支持选择严重

      事件名称

      选择要通知的事件。不同事件类型包含的事件不同,具体说明如下:

      • DDoS攻击黑洞事件包括:黑洞进行中黑洞解除

      • DDoS攻击清洗事件包括:清洗进行中清洗解除

      • 四层CC攻击事件包括:4层cc攻击进行中4层cc攻击结束

      • 七层CC攻击事件包括:7层cc攻击进行中7层cc攻击结束

      关键词过滤

      报警规则的过滤关键词。取值:

      • 满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。

      • 满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。

      说明

      关于如何查看事件内容,请参见查看系统事件

      SQL Filter

      SQL过滤语句。

      支持andor的条件筛选,例如:Warn and i-hp368focau7dp0hw****,表示当事件内容中包含实例i-hp368focau7dp0hw****和报警级别Warn时,云监控才会发送报警通知。

      资源范围

      选择全部资源

      报警方式

      联系人组

      选择发送报警的联系人组。

      报警通知

      事件报警的级别和通知方式。取值:

      • Critical(电话+短信+邮件+WebHook)

      • Warning(短信+邮件+WebHook)

      • Info(邮件+WebHook)

      消息服务队列

      无需设置。如果您想了解更多信息,请参见管理系统事件报警规则(旧版)

      函数计算

      URL回调

      日志服务

      通道沉默周期

      报警发生后未恢复正常,间隔多久重复发送一次报警通知。

  4. (可选)在云监控查询近期发生的DDoS报警事件。

    1. 系统事件页面的事件监控页签,选择产品为DDoS高防(中国内地)或者DDoS高防(非中国内地),设置要查询的事件类型和时间范围后,单击搜索

    2. 在历史事件记录中,单击操作列的详情,查看事件详情。

配置实时监控大盘

  1. 在云监控控制台的左侧导航栏,单击Dashboard

  2. 自定义大盘页签,单击添加大盘

  3. 添加大盘组对话框,设置大盘名称并单击确定

    成功添加监控大盘后,在自定义大盘页签您可以看到刚才新建的监控大盘。

  4. 单击大盘名称后,单击添加图表,在添加图表页面自定义图表内容。

    1. 选择图表类型。支持的类型包括折线图、面积图、TopN表格、热力图、饼图。

      关于不同图表类型的具体说明,请参见管理自定义监控大盘中的监控图表

    2. 选择监控项。选择云产品监控,并设置产品为DDoS高防(中国内地)或者DDoS高防(非中国内地),进一步配置监控项资源

      • 监控项:选择要监控的DDoS高防数据指标。

      • 资源:根据您的业务需要选择应用分组选择云产品实例选择监控实例选择后,然后选择要监控的DDoS高防实例和IP。

      说明

      单击添加监控项可以在当前图表中添加多个监控项。

    3. 单击确定,生成监控图表。

    成功生成监控图表后,您可以重复该步骤,在当前监控大盘下继续添加更多的图表。