事件用于记录和通知云资源信息,包括资源异常、操作执行情况以及资源状态变化等。EMR Serverless StarRocks会记录当前实例资源发生的系统事件,并自动将其同步到云监控服务。您可以在EMR控制台查看实例的事件,并在云监控控制台中设置事件告警规则,以便及时响应。
事件类型
健康事件
健康事件是非人为引发的服务健康状态异常变化的事件,用于展示当前实例已安装服务组件的风险与异常情况。例如,包括节点系统事件、数据存储bucket,以及FE、BE或CN崩溃或重启等情况。
操作事件
操作事件是认为操作后流程进行中发生的异常状态变化的事件,展示当前所有实例操作所面临的风险和异常情况。例如,业务类操作可能出现的异常包括报错查询超时和导入超时;而运维类操作则可能涉及扩缩容失败、变配失败或版本升级失败等情况。
事件状态
事件状态如下表所示。
状态 | 说明 |
待处理 | 事件仍保持异常状态,需要您及时处理。 |
已完成 | 事件已成功处理。 |
已取消 | 对应的检查对象已被删除,或事件已被忽略。 |
已预约 | 事件已在未来24小时内预约处理。 |
事件等级
按照对实例正常运行的影响程度进行划分,系统事件分为以下几个等级:
严重:影响重大,需要尽快处理,否则可能影响业务运行。
警告:有一定影响,需要您在影响持续期间加以关注,或者选择合适时间处理。
信息:展示事件经过,您自行选择是否关注即可。
事件列表
事件名称 | 建议操作 |
StarRocks实例数据存储bucket下行带宽超过流控阈值 | 根据事件详情中的建议,联系EMR Serverless StarRocks团队提升带宽阈值或其他相关参数。 |
StarRocks实例数据存储bucket上行带宽超过流控阈值 | |
StarRocks实例数据存储bucket QPS超过流控阈值 | |
当前用户下行带宽超过流控阈值 | |
当前用户上行带宽超过流控阈值 | |
当前用户QPS超过流控阈值 | |
节点因系统维护需要重启 | 支持立即重启或预约时间重启,请根据业务需求选择合适的重启时间。 |
查看事件
在左侧导航栏,单击事件。
单击EMR Serverless StarRocks页签。
在健康事件和操作事件页签,查看待处理或全部的事件。
单击全部页签,可以查看所有事件。
单击目标事件操作列的详情,可以查看事件的详细信息,包括事件Code及事件内容等信息。
处理事件
在健康事件和操作事件页签,单击目标事件操作列的处理,可以选择立即处理或者预约指定时间处理当前事件。