监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量等方面的监控数据指标,并且提供自定义报警服务,帮助您跟踪请求、分析使用情况、统计业务趋势,及时发现以及诊断系统的相关问题。

OSS监控指标主要分为基础服务指标、性能指标和计量指标,详见OSS监控指标参考

高实时性

高实时性能够暴露可能隐藏的峰谷问题,显示出实际的波动情况,有助于分析和评估业务场景。OSS监控指标的实时性(除了计量指标)是按照分钟粒度采集聚合的,输出延时不超过1分钟,即每分钟内的用户信息都会聚合成一个值,并在一分钟内输出,代表这一分钟的监控情况。

计量指标相关说明

为了保持和计费策略的统一,计量指标的收集和展现存在一定的特殊性,说明如下:

  • 计量指标数据是按照小时粒度输出的,即每个小时内的资源计量信息都会聚合成一个值,代表这个小时总的计量情况。

  • 计量指标数据会有近半个小时的延时输出。

  • 计量指标数据的数据时间是指该数据所统计时间区间的开始时间。

  • 计量采集截止时间是当月最后一条计量数据所统计时间区间的结束时间,如果当月没有产生任何一条计量监控数据,那么计量数据采集截止时间为当月1号0点。

  • 计量指标数据的展示都是尽最大可能推送的,准确计量请参考费用中心—使用记录

举个例子,假设用户只使用PutObject这个请求上传数据,每分钟平均10次。那么在2018-05-10 08:00:00到2018-05-10 09:00:00这一个小时时间区间内,用户的PUT类请求数的计量数据值为600次(10*60分钟),数据时间为2018-05-10 08:00:00,这条数据将会在2018-05-10 09:30:00左右被输出。如果这条数据是从2018-05-01 00:00:00开始到现在的最后一条计量监控数据,那么当月的计量数据采集截止时间就是2018-05-10 09:00:00。如果2018年5月该用户没有产生任何的计量数据,那么计量采集截止时间为2018-05-01 00:00:00。

OSS报警服务

每个账号最多能够设置1000项报警规则。除计量指标和统计指标,其他的监控指标均可配置为报警规则加入报警监控,并且一个监控指标可以配置为多个不同的报警规则。

监控数据保留策略

监控数据保留31天,过期自动清除,如果需要离线分析监控数据或者长期下载并保存历史监控,需要使用工具或者编写代码来读取云监控数据存储,请参见OpenAPI访问监控数据

控制台展示最近7天的数据,如果希望查询7天以上的历史数据,建议使用云监控提供的SDK进行查询,请参见OpenAPI访问监控数据

OpenAPI访问监控数据

OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:

监控、诊断和故障排除

监控诊断和故障排除通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行状态并进行自主诊断和故障排除:

  • 服务监控

    介绍如何使用监控服务持续监控OSS存储服务的运行状况和性能。

  • 跟踪诊断

    介绍如何使用OSS监控服务和logging记录功能诊断问题,以及如何关联各种日志文件中的相关信息进行跟踪诊断。

  • 故障排除

    提供常见的问题场景和故障排除方法。

注意事项

OSS Bucket全局唯一,如果删除Bucket之后再创建同名的Bucket,那么被删除的Bucket的监控以及报警规则会应用在新的同名Bucket上。