本文主要介绍当前阶段产品的各个功能模块。

对用户本地IDC和云上的数据库进行集中管理,统一监控,节省用户50%以上的管理成本,显著减少操作故障概率。

  • 统一监控通过DAS平台,即可查看所有环境、所有集群、所有实例的性能趋势情况和实时性能情况。
    • 低成本:用户无需耗费人力开发和部署采集、计算、存储程序,直接使用DAS即可监控数据库。
    • 指标丰富:支持数据库各项关键指标的采集、计算和展示。
    • 细粒度的监控:支持用户按需设置细粒度的监控,最小支持秒级监控,帮助用户快速发现异常。
  • 统一告警支持云上云下数据库告警规则的自定义、告警信息的发送。
    • 默认告警模版:基于阿里巴巴的数据库运维经验,为各种数据库引擎定义了默认的告警模版,用户可以直接使用。
    • 灵活配置:支持各种告警规则、告警模版、告警联系人、告警联系组的灵活配置,用户可以为企业内不同的使用者定义不同的告警模版。
    • 异常发现:自动发现没有定义告警的数据库实例,避免因为告警信息发送不及时,导致业务受损。

自治服务(智能诊断和优化)

基于机器学习和细粒度的监控数据,实现7 * 24小时的异常检测,提供自动SQL限流、异常快照、自动SQL Review和优化、存储空间自动扩展、计算资源自动扩展等功能,从异常发现、根因分析、进行止损/优化、效果跟踪、回滚/沉淀知识库,实现诊断流程的闭环,优化效果可量化,确保数据库持续可用。

我们数据库的自动驾驶能力分为5层:

能力级 描述 决策主体 关键能力
Level-0 全人工 无。
Level-1 辅助工具、看板 负载信息采集、监控、告警、脚本以及工具支持。
Level-2 输出诊断和优化建议 人 + DAS 异常检测、SQL优化建议、容量评估、健康诊断等。
Level-3 部分场景全自动化 DAS + 人 自动异常修复、自动SQL优化、自动参数配置、自动弹性伸缩等等,少量场景仍然由人做主要决策/动作,系统辅助。
Level-4 自动驾驶 DAS 全部场景实现端到端决策,进入自动驾驶模式。

主要包含如下功能:

  • SQL诊断和优化
  • 慢SQL分析
  • 空间分析
  • 性能趋势
  • 会话管理
  • 全量SQL分析
  • 诊断报告
  • 7X24小时异常检测
  • 自动SQL限流
  • 自动SQL优化
  • 自动SQL Review和优化
  • 容量评估和规格推荐
  • 弹性伸缩

企业级数据库服务

  • Dashboard

    DAS总结阿里巴巴数据库团队多年的数据库运维和管理经验,提供多种监控场景,跨实例、跨集群、跨环境,跨功能模块的护航大盘、实例大盘等。

  • 多环境、多集群管理

    DAS满足企业管理多套环境多套集群的需求,支持环境级别、集群级别的性能监控指标的聚合和下钻,贴近企业级管理视角。

  • 巡检评分

    DAS支持巡检评分,自动对用户接入DAS的所有数据库实例进行巡检,从基础巡检到SQL、容量、性能、安全等等,并给出健康评分,帮助用户一目了然的确认数据库运行情况。

数据库安全审计

DAS 提供高危SQL识别、SQL注入检测、新增访问来源识别、敏感数据访问发现等等服务,实时检测,全量审计,快速识别数据库异常访问、拖库等行为,有效保障数据库安全。

数据库安全审计包含如下功能:

  • SQL注入识别
  • 高危SQL识别
  • 新增访问来源识别