报警配置

MSHA提供的报警功能可以为您及时发现系统风险点。您可以通过配置报警规则、添加钉钉报警通知人信息等操作,在您指定的钉钉群中接收相关告警信息,以便您能够根据告警信息的内容排查和修复错误。

步骤一:设置钉钉机器人

设置钉钉机器人报警后,您可以通过指定钉钉群接收报警通知。请按照以下步骤添加自定义钉钉机器人并获取Webhook地址。

  1. 在PC版钉钉上打开您想要添加报警机器人的钉钉群,并单击右上角的群设置图标。

  2. 群设置面板中单击智能群助手

  3. 智能群助手面板单击添加机器人

  4. 群机器人对话框单击添加机器人区域右侧的图标,然后选择自定义Add Robot

  5. 机器人详情对话框单击添加

  6. 添加机器人对话框中编辑机器人头像和名称,选择必要的安全设置自定义关键词加签至少选择一个,可全选,然后按需填写相应的自定义关键词),选中我已阅读并同意《自定义机器人服务及免责条款》,然后单击完成

    ert

  7. 添加机器人对话框中复制生成的机器人Webhook地址,然后单击完成

    Add Robot

    重要

    请保管好此Webhook地址,不要公布在外部网站上,泄露后有安全风险。

步骤二:创建报警联系人

添加报警联系人用于及时接收报警通知消息。在创建报警联系人时,您可以指定用于自动发送报警通知的钉钉机器人地址。

  1. 登录多活容灾MSHA控制台

  2. 在左侧导航栏选择报警管理 > 报警配置

  3. 报警配置页面,单击管理报警联系人组,进入报警联系人页面。

  4. 报警联系人页签单击创建联系人,在右侧弹出的设置报警联系人面板中设置报警联系人姓名和接收报警信息的钉钉报警机器人Webhook地址。Webhook地址的获取方式,请参见步骤一:设置钉钉机器人

    ert

    说明

    MSHA支持安全词、加签和安全词+加签三种安全设置方式,您可以根据在钉钉机器人中的配置,选择最适合的设置方式填写对应信息。加签的签名密钥可在钉钉机器人设置页面获取。

    以上信息配置完成后,您可以单击测试,测试能否正确的发送和接收报警信息。若您在钉群中收到如下图所示的报警测试信息,表示测试通过,然后您需要单击确定完成创建报警联系人;若当前页面出现发送报警信息失败的提示,请检查钉钉机器人是否配置正确或者联系人信息是否有误。

    ety

相关操作

  • 编辑报警联系人:

    报警联系人页面,单击目标联系人右侧操作列的编辑,您可以修改联系人信息,也可以再次进行报警测试。

  • 删除报警联系人:

    报警联系人页面,单击目标联系人右侧操作列的删除,然后在弹出的对话框中单击确认,您可以删除该报警联系人。

    说明

    如果有报警规则使用了该联系人,则无法进行删除。

步骤三:创建报警联系组

MSHA报警规则以联系组为通知粒度,您可以通过将多个报警联系人添加到某个报警联系组,允许多方接收报警信息。

  1. 登录多活容灾MSHA控制台

  2. 在左侧导航栏选择报警管理 > 报警配置

  3. 报警配置页面,单击管理报警联系人组,进入报警联系人页面。

  4. 报警联系人页面单击报警联系组页签。

  5. 单击创建联系组,在右侧弹出的新建联系组面板中设置组名并选择接收报警的联系人,然后单击确定,完成创建联系组。

    weu

    说明
    • 支持选择多个报警联系人接收报警信息。

    • 暂不支持在报警联系组中创建报警联系人,若您需要创建接收报警联系人,具体操作,请参见步骤二:创建报警联系人

相关操作

  • 查看报警联系组详情:

    单击目标报警联系组名称左侧的rt图标,可以查看该联系组包含的所有报警联系人信息。

  • 添加报警联系人到报警联系组:

    单击目标报警联系组名称右侧的er图标,然后在右侧弹出的编辑联系组面板中您可以为当前联系组重新添加报警联系人。

  • 删除报警联系组

    单击需要删除的报警联系组名称右侧的weu图标,然后在弹出的对话框中单击确认,您可以删除该报警联系组。

    说明

    如果有报警规则使用了该联系组,则无法进行删除。

步骤四:配置报警规则

配置报警规则,以便您能及时感知MSHA监控信息,然后您可以根据告警信息的内容,进行错误排查和修复。

  1. 登录多活容灾MSHA控制台

  2. 在左侧导航栏选择报警管理 > 报警配置

  3. 报警配置页面,单击创建报警规则

  4. 在弹出的新增报警规则对话框中配置相关规则参数信息,完成后单击确定

    参数

    说明

    规则名称

    自定义设置报警规则名称。

    规则类型

    选择报警规则类型。

    命名空间

    报警覆盖范围以MSHA命名空间为粒度,您需要选择需要监控的命名空间。

    监控项

    选择要监控的事件。支持选择检查全部,将会监控该命名空间下的所有事件。

    沉默周期

    选择规则的沉默周期,决定同一报警信息不重复发送报警的周期。

    通知对象

    选择要通知的报警联系组,具体详情,请参见步骤三:创建报警联系组

    报警规则创建完成后,您将会接收到钉群发送的报警信息。qsa

相关操作

  • 禁用报警规则:

    单击需要禁用的报警规则名称右侧操作列的禁用,然后在弹出的对话框中单击确认,禁用该规则,禁用后该规则将不会再触发报警。

  • 启用报警规则:

    单击需要启用的报警规则名称右侧操作列的启用,然后在弹出的对话框中单击确认,启用该规则,启用后该规则将会再次触发报警。

  • 删除报警规则

    单击需要删除的报警规则名称右侧操作列的删除,然后在弹出的对话框中单击确认,您可以删除该规则。

步骤五:查看报警历史

您可以在报警历史页面查看接收到的历史报警事件详情信息,具体操作如下。

  1. 登录多活容灾MSHA控制台

  2. 在左侧导航栏选择报警管理 > 报警历史。报警历史页面展示了所有报警规则被触发后联系人接收到的历史报警事件信息。

    wer