Insights是一个对应用进行定时巡检的智能运维工具。针对巡检后发现的问题,Insights可以给出具体的根因分析和建议。

功能说明

Insights巡检的问题主要包括服务性能、中间件性能和机器相关(基础设施)。您无需做任何设置,Insights将会基于应用历史数据并结合智能算法完成巡检。

目前Insights支持巡检以下问题类型,并从服务性能、中间件性能和机器相关(基础设施)3个方面对问题进行分类。

问题分类 问题类型 问题描述
服务性能 应用服务RT突增 基于服务历史3小时数据,判断最近10分钟是否有异常突增点。目前服务支持按照HTTP、Dubbo、HSF和MQ进行分类查询,异常点最小值默认为200 ms/min。
应用HTTP服务Error突增 基于应用提供的HTTP服务历史3小时数据,判断最近10分钟是否有准确率突降。同时默认异常时刻最小错误数为每分钟40个。
应用服务异常数突增 基于服务历史3小时数据,判断最近10分钟是否有异常数突增。异常点最小值默认为每分钟40个。
请求量Top 5服务RT突增 基于Top 5流量服务历史3小时数据,判断最近10分钟是否有异常突增点。异常点最小值默认为200 ms/min。
请求量Top 5服务Error突增 基于Top 5流量的HTTP服务历史3小时数据,判断最近10分钟是否有准确率突降。同时默认异常时刻最小错误数为每分钟40个。
请求量Top 5服务异常数突增 基于Top 5流量的服务历史3小时数据,判断最近10分钟是否有异常数突增。同时默认异常时刻最小异常数为每分钟40个。
中间件性能 SQL RT突增 基于应用请求某个实例SQL历史3小时数据,判断最近10分钟是否有执行耗时突增。异常点最小值默认为300 ms/min,支持的SQL类型为MySQL、PostgreSQL和Oracle。
SQL Error突增 基于应用请求某个实例SQL历史3小时数据,判断最近10分钟是否有执行错误异常突增。异常点最小值默认每分钟40个,支持的SQL类型为MySQL、PostgreSQL和Oracle。
NoSQL RT突增 基于应用请求某个实例NoSQL的历史3小时数据,判断最近10分钟是否有执行耗时突增。异常点最小值默认为300 ms/min,支持的SQL类型为Redis和Memcache。
NoSQL Error突增 基于应用请求某个实例SQL的历史3小时数据,判断最近10分钟是否有执行错误异常突增。异常点最小值默认每分钟40个,支持的SQL类型为Redis和Memcache。
机器相关 流量不均 基于应用最近15分钟某个类型服务(HTTP、Dubbo、HSF)的流量数据,判断应用是否存在流量不均异常。默认单机5分钟流量不小于1000,默认最大流量和最小流量差30%。
Pod重启次数过多 最近15分钟内单个Pod重启次数超过最小默认值3次。
内存泄漏 最近15分钟服务器发生FullGC次数超过默认值3次,同时老年代变化很小。

开通Insights

Insights功能目前处于白名单试用期间。如果您想体验Insights功能,请通过扫描以下二维码进入钉群申请开通。

Insights体验答疑群