全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网
对象存储 OSS

监控服务使用指南

更新时间:2017-11-06 16:37:49

OSS监控服务入口

OSS监控服务处于云监控控制台中。可以通过如下两种方式进入。

OSS监控服务页面

OSS监控服务主页的主体由如下三部分组成。

  • 用户概况
  • Bucket列表
  • 报警规则


该页面没有自动刷新功能,可以点击右上角的刷新按钮自动更新数据信息。

点击前往OSS控制台可以直接进入OSS控制台界面。

用户概况

用户概况页面从用户层级监控用户相关的信息。主要包括用户监控信息、当月计量统计和用户层级监控指标三大部分。

用户监控信息

该模块主要展示用户拥有的bucket总数以及相关的报警规则情况。

  • 点击Bucket数量的数字,链接到Bucket列表Tab页。
  • 点击报警规则总数的数字,链接到报警规则Tab页。
  • 点击处于告警状态的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。
  • 点击已禁用规则数的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均被禁用。
  • 点击警铃图标下面的数字,链接到报警规则Tab页,并且此时该页展示的报警规则均处于告警状态。

当月计量统计

当月计量统计展示了该用户从当月1号0点开始,到采集截止时间为止,这段时间内所使用的OSS服务的计费相关的资源信息,包括如下指标:

  • 存储大小
  • 公网流出流量
  • Put类请求数
  • Get类请求数


截用户层级当月计量统计图

各个计量框中展示的数据根据量级自动调整单位,鼠标停留在数字上方会显示精确的数值。

用户层级监控指标

该模块主要展示具体的用户层级的监控图表,主要包括服务监控总览请求状态详情两部分,下面会详细介绍。

图表展现提供了快速时间范围选择按钮和自定义时间框。

  • 快速时间范围选择按钮提供1小时、6小时、12小时、1天和7天的时间范围选择,默认为1小时。
  • 自定义时间框可以自定义起始时间和结束时间,精确到分钟级别。注意,不支持查询8天以前的数据。


图表展示还支持以下功能:

  • 点击相关图例可以将该指标曲线隐去,如下图:

  • 点击图形右上图标可以将图形放大展示。注意,表格不支持放大展示。

  • 点击图形右上图标可以对该图中展示的指标项设置相关报警规则。详见报警服务使用指南。注意,表格和计量参考指标不支持报警设置。
  • 鼠标按住图形曲线区域拖放,可以进行时间范围快速调整放大,点击恢复缩放回归到拖放之前的时间范围。

服务监控总览

服务监控总览页面主要包括下面监控指标图:

  • 用户层级可用性/有效请求率: 包括可用性和有效请求率2项指标。
  • 用户层级总请求数/有效请求数: 包括总请求数和有效请求数2项指标。
  • 用户层级流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、cdn流出流量、cdn流入流量、跨区域复制流出流量和跨区域复制流入流量8项指标。
  • 用户层级请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。


user_monitor_outline

请求状态详情

请求状态详情是对请求状态分布统计的一个具体监控,主要包括下面的监控指标图:

  • 用户层级服务端错误请求数。
  • 用户层级服务端错误请求占比。
  • 用户层级网络错误请求数。
  • 用户层级网络错误请求占比。
  • 用户层级客户端错误请求数: 包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数4项指标。
  • 用户层级客户端错误请求占比: 包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比4项指标。
  • 用户层级有效请求数: 包括成功请求数和重定向请求数2项指标。
  • 用户层级有效请求占比: 包括成功请求占比和重定向请求占比2项指标。


用户层级请求状态详情

Bucket列表

Bucket列表信息

列表展现了用户拥有的所有Bucket的名称、所属地域、创建时间、当月计量数据统计信息以及相关操作,表中内容如下:

  • 当月计量统计包括每个bucket各自的存储大小、公网流出流量、Put类请求数和Get类请求数。
  • 点击监控图表或者对应的Bucket名称,能够进入具体的Bucket监控视图页。
  • 点击报警规则,进入报警规则Tab页,并且展现所有属于该Bucket的报警规则。
  • 通过上面的搜索框能够模糊匹配快速找到具体的bucket。
  • 选中bucket复选框,并点击设置报警规则可以批量设置报警规则,详见报警服务使用指南

Bucket层级监控视图

点击Bucket列表中具体的Bucket行中的监控图表,就能进入对应的Bucket的监控视图页。如下图:
bucket监控图表

Bucket监控视图页按指标分组进行展示监控图,主要包含6个指标分组:

  • 服务监控总览
  • 请求状态详情
  • 计量参考
  • 平均延时
  • 最大延时
  • 成功请求操作分类

除了计量参考,所有的指标项都是分钟级别聚合展示的。不同于用户层级默认时间展现为最近1小时,Bucket层级的监控展示默认为6小时。点击上方的返回Bucket列表能够回到Bucket列表Tab页。

服务监控总览

该指标分组同用户层级的服务监控总览,只是从具体的Bucket进行监控,主要包括下面监控指标图:

  • 可用性/有效请求率: 包括可用性和有效请求率2项指标。
  • 总请求数/有效请求数: 包括总请求数和有效请求数2项指标。
  • 流量: 包括公网流出流量、公网流入流量、内网流出流量、内网流入流量、cdn流出流量、cdn流入流量、跨区域复制流出流量和跨区域复制流入流量8项指标。
  • 请求状态分布: 该表格中展示选定时间范围内各个请求类型的个数以及占比。


截用户层级服务监控总览图

请求状态详情

该指标分组同用户层级的请求状态详情,只是从具体的Bucket进行监控,主要包括下面监控指标图:

  • 服务端错误请求数
  • 服务端错误请求占比
  • 网络错误请求数
  • 网络错误请求占比
  • 客户端错误请求数: 包括资源不存在错误请求数、授权错误请求数、客户端超时错误请求数和客户端其他错误请求数4项指标。
  • 客户端错误请求占比: 包括资源不存在错误请求占比、授权错误请求占比、客户端超时错误请求占比和客户端其他错误请求占比4项指标。
  • 有效请求数: 包括成功请求数和重定向请求数2项指标。
  • 有效请求占比: 包括成功请求占比和重定向请求占比2项指标。


计量参考

计量参考分组展示各个计量相关的指标信息,以小时粒度收集展现,如下图所示:
bucket层级计量参考

包含以下计量指标监控图:

  • 存储大小
  • 公网流出流量
  • 计费请求数:包括Get类请求数和Put类请求数2项指标项。

如果新建Bucket,需要到当前时间点的下一个整小时点才会采集到新数据,然后在半个小时内展示出来。
bucket层级新申请的bucket计量视图

平均延时

该分组包含分API类型监控的各项平均延时指标,包含如下几个指标图:

  • GetObject请求平均延时
  • HeadObject请求平均延时
  • PutObject请求平均延时
  • PostObject请求平均延时
  • AppendObject请求平均延时
  • UploadPart请求平均延时
  • UploadPartCopy请求平均延时

每个指标图中都包含对应的平均E2E延时和平均服务器延时,如下图所示:
bucket层级平均延时

最大延时

该分组包含分API类型监控的各项最大延时指标,包含如下几个指标图:

  • GetObject请求最大延时
  • HeadObject请求最大延时
  • PutObject请求最大延时
  • PostObject请求最大延时
  • AppendObject请求最大延时
  • UploadPart请求最大延时
  • UploadPartCopy请求最大延时

每个指标图中都包含对应的最大E2E延时和最大服务器延时,如下图所示:
bucket层级最大延时

成功请求操作分类

该分组包含分API类型监控的各项成功请求数指标,包含如下几个指标图:

  • GetObject成功请求
  • HeadObject成功请求
  • PutObject成功请求
  • PostObject成功请求
  • AppendObject成功请求
  • UploadPart成功请求
  • UploadPartCopy成功请求
  • DeleteObject成功请求
  • DeleteObjects成功请求

如下图所示:
bucket层级成功请求数

报警规则

报警规则Tab页能够展示和管理该用户的所有的报警规则,如下图所示
报警规则

报警规则页的使用和相关说明详见报警服务使用指南

监控关注事项以及使用指导

监控关注点以及使用指南可以参考监视诊断和故障排除的相关章节。

本文导读目录