监控指标参考

根据用户使用场景,OSS的指标分为用户层级指标和存储空间(Bucket)层级指标。为了更好地观察监控数据以及匹配计费策略,OSS对现有的监控指标项进行统计分析,提供了一段时间内的统计数据,例如请求状态分布统计和当月计量统计。

说明
  • 监控指标项中包含按分钟级别汇总的时间序指标(例如求和、求最大值或者求均值等),以及按小时级别汇总的计量指标等。

  • 云监控默认为您提供ECS监控大盘,展示ECS部分监控数据。如果您需要查看其他云服务(例如OSS用户层级或者Bucket层级指标)监控项,可以将相关监控项通过添加图表的形式添加到同一个监控大盘。具体操作,请参见管理自定义监控大盘中的监控图表

用户层级指标

用户层级指标是指从阿里云账号级别对OSS使用的总体情况进行监控的指标信息,即该阿里云账号下所有Bucket相关监控数据的汇总。包括当月计量统计、服务监控总览和请求状态详情三个方面。

  • 当月计量统计

    当月计量统计指标是指从当月的1号0点开始,到当月计量采集截止时间之内计量指标的统计数据。具体指标项如下:

    指标名称

    单位

    描述

    存储大小

    字节

    从本月1号0点开始累积到计量采集截止时间为止,用户所有Bucket占用的存储总大小。

    公网流出流量

    字节

    从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有公网流出流量的总和。

    Put类请求数

    次数

    从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有Put类请求的总和。

    Get类请求数

    次数

    从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有Get类请求的总和。

  • 服务监控总览

    服务监控总览指标属于基础服务指标。具体指标项如下:

    指标名称

    单位

    描述

    可用性

    %

    存储服务的系统可用性衡量指标。通过公式 1 - 服务端错误请求(返回状态码为5xx)占总请求的百分比获取。

    有效请求率

    %

    有效请求占总请求数的百分比。

    总请求数

    次数

    被OSS服务端接收并处理的请求总数。

    有效请求数

    次数

    返回状态码为2xx和3xx的请求总数。

    公网流出流量

    字节

    通过互联网网络的下行流量。

    公网流入流量

    字节

    通过互联网网络的上行流量。

    内网流出流量

    字节

    通过服务系统内部网络的下行流量。

    内网流入流量

    字节

    通过服务系统内部网络的上行流量。

    CDN流出流量

    字节

    开通CDN加速服务之后,通过CDN产生的下行流量,即回源流量。

    CDN流入流量

    字节

    开通CDN加速服务之后,通过CDN产生的上行流量。

    跨区域复制流出流量

    字节

    开通跨区域复制之后,数据复制过程产生的下行流量。

    跨区域复制流入流量

    字节

    开通跨区域复制之后,数据复制过程产生的上行流量。

  • 请求状态详情

    请求状态详情指标是指根据请求返回状态码或者OSS错误码进行分类的请求的监控信息,属于基础服务指标。具体指标项如下:

    指标名称

    单位

    描述

    服务端错误请求总数

    次数

    返回状态码为5xx的系统级错误请求总数。

    服务端错误请求占比

    %

    服务端错误请求总数占总请求数的百分比。

    网络错误请求总数

    次数

    HTTP状态码为499的请求总数。

    网络错误请求占比

    %

    网络错误请求数占总请求数的百分比。

    客户端授权错误请求总数

    次数

    返回状态码403的请求总数。

    客户端授权错误请求占比

    %

    授权错误请求数占总请求数的百分比。

    客户端资源不存在错误请求总数

    次数

    返回状态码为404的请求总数。

    客户端资源不存在错误请求占比

    %

    资源不存在错误请求数占总请求数百分比。

    客户端超时错误请求总数

    次数

    返回状态码为408或者返回的OSS错误码为RequestTimeout的请求总数。

    客户端超时错误请求占比

    %

    客户端超时错误请求总数占总请求数的百分比。

    客户端其他错误请求总数

    次数

    除了以上提到的客户端错误请求之外的其他返回状态码为4xx的请求总数。

    客户端其他错误请求占比

    %

    客户端其他错误请求数占总请求数的百分比。

    成功请求总数

    次数

    返回状态码为2xx的请求总数。

    成功请求占比

    %

    成功请求数占总请求数的百分比。

    重定向请求总数

    次数

    返回状态码为3xx的请求总数。

    重定向请求占比

    %

    重定向请求数占总请求数的百分比。

Bucket层级指标

Bucket层级指标除包含以上所有用户层级指标以外,还包括计量参考、延时和成功请求操作分类等计量指标和性能指标。

重要

与用户层级指标监控当前账号下所有Bucket指标信息不同的是,Bucket层级指标仅监控单个Bucket的指标信息。例如用户层级指标统计的存储大小,表示在计量采集截止时间前属于该账号下所有Bucket占用的存储总大小。而Bucket层级指标统计的存储大小,则表示在计量采集截止时间前该Bucket占用的存储总大小。

  • 计量参考

    具体指标项如下:

    指标名称

    单位

    描述

    存储大小

    字节

    该Bucket每小时使用的平均存储大小。

    计费流量

    字节

    计费请求数

    次数

  • 延时

    请求延时是系统性能的直观反映,且只对返回状态码为2xx的成功请求进行监控。监控服务提供了分钟级别的平均延时和最大延时两类指标,分别反映系统平均响应能力和系统抖动情况。

    延时监控指标分别从E2E和服务器两条不同的链路进行收集,便于分析性能热点以及环境问题,其中:

    • E2E延时是指向OSS系统发出的成功请求的端到端滞后时间,包括在OSS系统中读取请求、发送响应以及接收响应确认所需的处理时间。

    • 服务器延时是指OSS系统成功处理请求所使用的滞后时间,不包括E2E延时中的网络滞后时间。

    具体指标项如下:

    指标名称

    单位

    描述

    GetObject请求平均E2E延时

    毫秒

    请求API为GetObject的成功请求的平均端到端延时。

    GetObject请求平均服务器延时

    毫秒

    请求API为GetObject的成功请求的平均服务器延时。

    GetObject请求最大E2E延时

    毫秒

    请求API为GetObject的成功请求的最大端到端延时。

    GetObject请求最大服务器延时

    毫秒

    请求API为GetObject的成功请求的最大服务器延时。

    HeadObject请求平均E2E延时

    毫秒

    请求API为HeadObject的成功请求的平均端到端延时。

    HeadObject请求平均服务器延时

    毫秒

    请求API为HeadObject的成功请求的平均服务器延时。

    HeadObject请求最大E2E延时

    毫秒

    请求API为HeadObject的成功请求的最大端到端延时。

    HeadObject请求最大服务器延时

    毫秒

    请求API为HeadObject的成功请求的最大服务器延时。

    PutObject请求平均E2E延时

    毫秒

    请求API为PutObject的成功请求的平均端到端延时。

    PutObject请求平均服务器延时

    毫秒

    请求API为PutObject的成功请求的平均服务器延时。

    PutObject请求最大E2E延时

    毫秒

    请求API为PutObject的成功请求的最大端到端延时。

    PutObject请求最大服务器延时

    毫秒

    请求API为PutObject的成功请求的最大服务器延时。

    PostObject请求平均E2E延时

    毫秒

    请求API为PostObject的成功请求的平均端到端延时。

    PostObject请求平均服务器延时

    毫秒

    请求API为PostObject的成功请求的平均服务器延时。

    PostObject请求最大E2E延时

    毫秒

    请求API为PostObject的成功请求的最大端到端延时。

    PostObject请求最大服务器延时

    毫秒

    请求API为PostObject的成功请求的最大服务器延时。

    AppendObject请求平均E2E延时

    毫秒

    请求API为AppendObject的成功请求的平均端到端延时。

    AppendObject请求平均服务器延时

    毫秒

    请求API为AppendObject的成功请求的平均服务器延时。

    AppendObject请求最大E2E延时

    毫秒

    请求API为AppendObject的成功请求的最大端到端延时。

    AppendObject请求最大服务器延时

    毫秒

    请求API为AppendObject的成功请求的最大服务器延时。

    UploadPart请求平均E2E延时

    毫秒

    请求API为UploadPart的成功请求的平均端到端延时。

    UploadPart请求平均服务器延时

    毫秒

    请求API为UploadPart的成功请求的平均服务器延时。

    UploadPart请求最大E2E延时

    毫秒

    请求API为UploadPart的成功请求的最大端到端延时。

    UploadPart请求最大服务器延时

    毫秒

    请求API为UploadPart的成功请求的最大服务器延时。

    UploadPartCopy请求平均E2E延时

    毫秒

    请求API为UploadPartCopy的成功请求的平均端到端延时。

    UploadPartCopy请求平均服务器延时

    毫秒

    请求API为UploadPartCopy的成功请求的平均服务器延时。

    UploadPartCopy请求最大E2E延时

    毫秒

    请求API为UploadPartCopy的成功请求的最大端到端延时。

    UploadPartCopy请求最大服务器延时

    毫秒

    请求API为UploadPartCopy的成功请求的最大服务器延时。

  • 成功请求

    成功请求的监控一定程度上反映了系统处理访问请求的能力。具体指标项如下:

    指标名称

    单位

    描述

    GetObject成功请求数

    次数

    请求API为GetObject的成功请求数。

    HeadObject成功请求数

    次数

    请求API为HeadObject的成功请求数。

    PutObject成功请求数

    次数

    请求API为PutObject的成功请求数。

    PostObject成功请求数

    次数

    请求API为PostObject的成功请求数。

    AppendObject成功请求数

    次数

    请求API为AppendObject的成功请求数。

    UploadPart成功请求数

    次数

    请求API为UploadPart的成功请求数。

    UploadPartCopy成功请求数

    次数

    请求API为UploadPartCopy的成功请求数。

    DeleteObject成功请求数

    次数

    请求API为DeleteObject的成功请求数。

    DeleteObjects成功请求数

    次数

    请求API为DeleteObjects的成功请求数。

  • 镜像回源

    具体指标项如下:

    指标名称

    单位

    描述

    [镜像回源]指定回源源站的正常请求流入流量

    字节

    统计指定某个源站时,返回值200和206的请求流入流量之和。

    [镜像回源]指定返回值和回源源站的请求流入流量

    字节

    统计指定某个源站以及某个返回值时的请求流入流量。

    [镜像回源]指定回源源站的正常请求平均传输速度

    字节/秒

    统计指定某个源站时,返回值200和206的请求流入速率的平均值。

    [镜像回源]指定返回值和回源源站的请求平均传输速度

    字节/秒

    统计指定某个源站以及某个返回值时的请求流入速率的平均值。

    [镜像回源]指定回源源站的正常请求总数

    次数

    统计指定某个源站时,返回值为200和206的请求总数。

    [镜像回源]指定返回值和回源源站的请求总数

    次数

    统计指定某个源站和返回值时的请求总数。

    [镜像回源]指定回源源站的正常请求平均延时

    毫秒

    统计指定某个源站时,返回值为200和206的请求平均延时。

    [镜像回源]指定返回值和回源源站的请求平均延时

    毫秒

    统计指定某个源站以及某个返回值时的请求平均延时。

    [镜像回源]指定回源源站的状态码2xx、3xx、4xx、5xx所占总请求量的百分比

    %

    统计指定某个源站时,各类请求状态码(2xx、3xx、4xx、5xx)所占总请求次数的百分比。

    [镜像回源]指定回源源站的状态码2xx、3xx、4xx、5xx的请求数量

    次数

    统计指定某个源站时,各类请求状态码(2xx、3xx、4xx、5xx)的请求次数。