监控与日志

阿里云提供了各种监控与日志审计相关的服务,例如云监控、配置审计等,帮助实时监控专有网络VPC中资源的使用情况和业务运行状况,并在收到异常报警时及时响应,有效保障专有网络VPC的可用性、业务的正常运行和健康度。

问题诊断排查

自助问题排查

VPC自助排查功能可以排查VPC实例网络连通性问题、VPC与外部网络连接、费用问题及资源配额不足等问题,并提供解决建议。实例排查期间可能会对实例探测并进行诊断分析,但不会对实例配置和正常业务造成影响。

基础云监控

VPC 已接入阿里云基础云监控服务,可以免费使用,对各项指标进行实时监控。

监控指标阈值报警

使用云监控为VPC相关指标创建阈值报警规则。通过对监控项报警阈值进行监控,可以迅速得知监控数据异常并解决异常。

订阅阈值事件

当监控指标达到阈值报警条件时,云监控自动发送原始报警通知给报警联系人。订阅阈值事件,可以对报警通知进行定制化处理:

  • 合并降噪:从阈值事件的订阅范围对报警进行合并,通过条件降噪来控制报警的有效性,避免大量重复报警造成报警风暴。

  • 合并降噪后的有效报警通知:云监控可以直接发送给报警联系人,如果报警在预定时间内未恢复,云监控自动将报警通知发送给下一个报警联系人组。

  • 自定义通知方式:可以按照习惯定义通知渠道的级别和模板,还可以通过推送与集成,直接将所有报警数据推送到轻量消息队列(原 MNS)、日志服务SLS、函数计算FCWebhook。

可监控指标

产品

指标类型

可监控指标

VPC 对等连接

实例维度

周期内入方向流量、周期内出方向流量、网络限速丢包速率、入方向带宽、出方向带宽

IPAM 作用范围

实例维度

作用范围内合规CIDR数量、不合规CIDR数量、已忽略CIDR数量、托管CIDR数量、未托管CIDR数量、不重叠CIDR数量、重叠CIDR数量、子网CIDR数量、VPC CIDR数量

IPAM 地址池

实例维度

池整体利用率、池分配子池利用率、池分配资源利用率,地址池内合规CIDR数量、不合规CIDR数量、重叠CIDR数量、不重叠CIDR数量

IPAM资源(VPC)

实例维度

VPC利用率、VPC IPv4网段利用率、VPC IPv6网段利用率

IPAM资源(VSwitch)

实例维度

子网利用率、子网IPv4网段利用率、子网IPv6网段利用率

健康状态监控

查看阿里云健康看板。实时了解云资源的健康状态,查看阿里云每个地域下云服务的状态是否有异常,以及该服务异常状态的RSS订阅方式,便于可及时处理异常情况。

image

云资源配置审计

VPC已接入阿里云配置审计供免费试用,提供统一的云资源配置历史追踪、配置合规审计,可以实现对云上资源合规性的自主监控,确保基础设施的持续合规性。

  • 资源配置检测:检测当前阿里云账号和所有RAM用户的操作记录,且默认每隔10分钟记录资源配置的变更。

  • 开启等保2.0云上预检功能:配置审计解读等保2.0法规条例,并对应实现为云上资源配置的检测。一键开启等保2.0云上预检功能,配置审计将持续监控资源的合规性。还可以下载预检报告,呈递检测机构报备。

  • 审计数据实时查询与分析:将云资源的配置变更历史和不合规事件数据投递到日志服务SLS的指定日志库中,实现通过日志服务SLS统一查询和分析日志数据。

云资源操作审计

VPC已接入阿里云操作审计,可提供统一的云资源操作日志管理,记录云账号下用户登录及资源访问操作,实现安全分析、入侵检测、资源变更追踪以及合规性审计。

  • 操作审计可记录通过阿里云控制台、OpenAPI、开发者工具访问和使用云上产品和服务的日志数据

  • 默认追踪并记录最近90天的事件。如需保存更长时间的日志,则需要创建跟踪,将产生的时间记录到日志服务或对象存储OSS。

  • 将事件投递到SLSOSS后,可以通过SLSOSS控制台查询事件

  • 创建数据回补投递任务可以跟踪历史事件,将跟踪历史投递到日志服务SLS。

流日志与流量镜像

VPC流日志采集并记录弹性网卡的进出流量信息,可以监控网络性能、排查网络故障或优化流量成本。

当需要监控网络流量时,传统方式为登录实例抓包或在实例部署监控Agent,占用实例的系统资源,影响业务性能。VPC流量镜像提供旁路监控方案,在不影响业务流量的前提下,将符合筛选条件的出入指定弹性网卡的流量复制并转发到安全分析设备,实现实时检测。