异常检测

及时发现数据库的异常问题是数据库日常运维的重点。数据库自治服务DAS提供异常检测功能,基于机器学习和细粒度的监控数据,无需手动开启,自动实现7x24小时的异常检测。相比基于规则或阈值的告警方式,能够更及时地发现数据库异常变化。

前提条件

  • 目标数据库实例为:

    数据库

    地域

    • RDS MySQL

    • MyBase MySQL

    华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、华东5(南京)、华东6(福州)、西南1(成都)、郑州、中国(香港)、日本(东京)、韩国(首尔)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、菲律宾(马尼拉)、泰国(曼谷)、澳大利亚(悉尼)关停中、阿联酋(迪拜)、沙特(利雅得)、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)和英国(伦敦)

    RDS PostgreSQL

    华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、西南1(成都)、中国(香港)、日本(东京)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、菲律宾(马尼拉)、澳大利亚(悉尼)关停中、阿联酋(迪拜)、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)和英国(伦敦)

    RDS SQL Server

    华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、西南1(成都)、中国(香港)、日本(东京)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、澳大利亚(悉尼)关停中、阿联酋(迪拜)、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)和英国(伦敦)

    PolarDB MySQL版标准版、企业集群版

    华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、西南1(成都)、中国(香港)、日本(东京)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、菲律宾(马尼拉)、澳大利亚(悉尼)关停中、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)和英国(伦敦)

    云数据库Redis

    • 云数据库Redis

    • MyBase Redis

    • 社区版

    • Tair(Redis企业版)内存型

    华东1(杭州)、华东2(上海)、华南1(深圳)、华南2(河源)、华南3(广州)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、西南1(成都)、中国(香港)、日本(东京)、韩国(首尔)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、菲律宾(马尼拉)、泰国(曼谷)、澳大利亚(悉尼)关停中、阿联酋(迪拜)、沙特(利雅得)、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)和英国(伦敦)

    Tair(Redis企业版)持久内存型、磁盘型

    华东1(杭州)、华东2(上海)、华南1(深圳)、华北2(北京)、华北3(张家口)、中国(香港)、新加坡、德国(法兰克福)和美国(弗吉尼亚)

  • 目标数据库实例已接入DAS,并且接入状态显示为接入正常

    说明

    接入数据库实例的操作请参见接入阿里云数据库实例

功能介绍

基于机器学习和细粒度的监控数据,无需手动开启,自动实现7x24小时的异常检测。相比基于规则或阈值的告警方式,能更及时地发现数据库异常变化。

对比项

传统方式

DAS异常检测

方式

基于规则、阈值。

基于AI。

检测项

主要基于监控指标。

监控指标、SQL、日志、锁、运维事件等。

实时性

至少5分钟,甚至到天。

准实时。

检测原理

故障驱动。

异常驱动。

周期性识别

无。

自动识别。

适应性

无法自适应业务特征。

自适应业务特征。

预测能力

无。

具备预测能力。

查看异常检测结果

在DAS的自治中心,可以直接查看选定时间范围内检测到的异常事件。

  1. 登录DAS控制台

  2. 在左侧导航栏中,单击实例监控

  3. 找到目标实例,单击实例ID,进入目标实例详情页。

  4. 在左侧导航栏中,单击自治中心

  5. 选择时间范围,查看指定时间范围内的异常事件。

开启事件告警

开启事件告警功能后,如果检测到异常事件,DAS将会根据您设置的方式进行通知(例如手机短信),帮助您及时发现数据库异常变化。详情请参见配置告警

说明

配置告警规则时,将告警类型设置为自治事件事件类型设置为监控指标异常,即可对检测到的异常事件进行告警。

常见问题

Q:监控指标时序异常检测(时序异常检测)事件的异常快照中,异常指标分析的相关指标变化倍数是如何计算得出的?异常指标

A:指标变化倍数=实际指标值/预测指标值。DAS会使用数据库实例过去一段时间内小时级别的数据预测数据库实例当前时刻的指标值,以预测指标值作为基线与当前实际指标值进行对比,从而得出指标变化倍数。

相关文档

您可以利用DAS的自治功能,在数据库出现异常时进行自动处理。