根据用户使用场景,OSS的指标分为用户层级和存储空间(Bucket)层级。为了更好地观察监控数据以及匹配计费策略,OSS对现有的监控指标项进行统计分析,提供了一段时间内的统计数据,如请求状态分布统计和当月计量统计。

说明
  • 监控指标项中包含按分钟级别汇总的时间序指标(例如求和、求最大值或者求均值等),以及按小时级别汇总的计量指标等。
  • 云监控默认为您提供ECS监控大盘,展示ECS部分监控数据。如果您需要查看其他云服务(例如OSS用户层级或者Bucket层级指标)监控项,可以将相关监控项通过添加图表的形式添加到同一个监控大盘。具体步骤,请参见管理自定义监控大盘中的监控图表

用户层级指标

用户层级指标是指从阿里云账号级别对OSS使用的总体情况进行监控的指标信息,即该阿里云账号下所有Bucket相关监控数据的汇总。包括当月计量统计、服务监控总览和请求状态详情三个方面。
  • 当月计量统计

    当月计量统计指标是指从当月的1号0点开始,到当月计量采集截止时间之内计量指标的统计数据。具体指标项如下:

    指标名称单位描述
    存储大小字节从本月1号0点开始累积到计量采集截止时间为止,用户所有Bucket占用的存储总大小。
    公网流出流量字节从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有公网流出流量的总和。
    Put类请求数次数从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有Put类请求的总和。
    Get类请求数次数从本月1号0点开始累积到计量采集截止时间为止,用户所使用的所有Get类请求的总和。
  • 服务监控总览

    服务监控总览指标属于基础服务指标。具体指标项如下:

    指标名称单位描述
    可用性%存储服务的系统可用性衡量指标。通过公式 1 - 服务端错误请求(返回状态码为5xx)占总请求的百分比获取。
    有效请求率%有效请求占总请求数的百分比。
    总请求数次数被OSS服务端接收并处理的请求总数。
    有效请求数次数返回状态码为2xx和3xx的请求总数。
    公网流出流量字节通过互联网网络的下行流量。
    公网流入流量字节通过互联网网络的上行流量。
    内网流出流量字节通过服务系统内部网络的下行流量。
    内网流入流量字节通过服务系统内部网络的上行流量。
    CDN流出流量字节开通CDN加速服务之后,通过CDN产生的下行流量,即回源流量。
    CDN流入流量字节开通CDN加速服务之后,通过CDN产生的上行流量。
    跨区域复制流出流量字节开通跨区域复制之后,数据复制过程产生的下行流量。
    跨区域复制流入流量字节开通跨区域复制之后,数据复制过程产生的上行流量。
  • 请求状态详情

    请求状态详情指标是指根据请求返回状态码或者OSS错误码进行分类的请求的监控信息,属于基础服务指标。具体指标项如下:

    指标名称单位描述
    服务端错误请求总数次数返回状态码为5xx的系统级错误请求总数。
    服务端错误请求占比%服务端错误请求总数占总请求数的百分比。
    网络错误请求总数次数HTTP状态码为499的请求总数。
    网络错误请求占比%网络错误请求数占总请求数的百分比。
    客户端授权错误请求总数次数返回状态码403的请求总数。
    客户端授权错误请求占比%授权错误请求数占总请求数的百分比。
    客户端资源不存在错误请求总数次数返回状态码为404的请求总数。
    客户端资源不存在错误请求占比%资源不存在错误请求数占总请求数百分比。
    客户端超时错误请求总数次数返回状态码为408或者返回的OSS错误码为RequestTimeout的请求总数。
    客户端超时错误请求占比%客户端超时错误请求总数占总请求数的百分比。
    客户端其他错误请求总数次数除了以上提到的客户端错误请求之外的其他返回状态码为4xx的请求总数。
    客户端其他错误请求占比%客户端其他错误请求数占总请求数的百分比。
    成功请求总数次数返回状态码为2xx的请求总数。
    成功请求占比%成功请求数占总请求数的百分比。
    重定向请求总数次数返回状态码为3xx的请求总数。
    重定向请求占比%重定向请求数占总请求数的百分比。

Bucket层级指标

Bucket层级指标除包含以上所有用户层级指标以外,还包括计量参考、延时和成功请求操作分类等计量指标和性能指标。

重要 与用户层级指标监控当前账号下所有Bucket指标信息不同的是,Bucket层级指标仅监控单个Bucket的指标信息。例如,用户层级指标统计的存储大小,表示在计量采集截止时间前属于该账号下所有Bucket占用的存储总大小。而Bucket层级指标统计的存储大小,则表示在计量采集截止时间前该Bucket占用的存储总大小。
  • 计量参考

    具体指标项如下:

    指标名称单位描述
    存储大小字节该Bucket每小时使用的平均存储大小。
    公网流出流量字节该Bucket每小时的公网流出流量的总和。
    Put类请求数次数该Bucket每小时的Put类请求的总和。
    Get类请求数次数该Bucket每小时的Get类请求的总和。
  • 延时

    请求延时是系统性能的直观反映,且只对返回状态码为2xx的成功请求进行监控。监控服务提供了分钟级别的平均延时和最大延时两类指标,分别反映系统平均响应能力和系统抖动情况。

    延时监控指标分别从E2E和服务器两条不同的链路进行收集,便于分析性能热点以及环境问题,其中:

    • E2E延时是指向OSS系统发出的成功请求的端到端滞后时间,包括在OSS系统中读取请求、发送响应以及接受响应确认所需的处理时间。
    • 服务器延时是指OSS系统成功处理请求所使用的滞后时间,不包括E2E延时中的网络滞后时间。

    具体指标项如下:

    指标名称单位描述
    GetObject请求平均E2E延时毫秒请求API为GetObject的成功请求的平均端到端延时。
    GetObject请求平均服务器延时毫秒请求API为GetObject的成功请求的平均服务器延时。
    GetObject请求最大E2E延时毫秒请求API为GetObject的成功请求的最大端到端延时。
    GetObject请求最大服务器延时毫秒请求API为GetObject的成功请求的最大服务器延时。
    HeadObject请求平均E2E延时毫秒请求API为HeadObject的成功请求的平均端到端延时。
    HeadObject请求平均服务器延时毫秒请求API为HeadObject的成功请求的平均服务器延时。
    HeadObject请求最大E2E延时毫秒请求API为HeadObject的成功请求的最大端到端延时。
    HeadObject请求最大服务器延时毫秒请求API为HeadObject的成功请求的最大服务器延时。
    PutObject请求平均E2E延时毫秒请求API为PutObject的成功请求的平均端到端延时。
    PutObject请求平均服务器延时毫秒请求API为PutObject的成功请求的平均服务器延时。
    PutObject请求最大E2E延时毫秒请求API为PutObject的成功请求的最大端到端延时。
    PutObject请求最大服务器延时毫秒请求API为PutObject的成功请求的最大服务器延时。
    PostObject请求平均E2E延时毫秒请求API为PostObject的成功请求的平均端到端延时。
    PostObject请求平均服务器延时毫秒请求API为PostObject的成功请求的平均服务器延时。
    PostObject请求最大E2E延时毫秒请求API为PostObject的成功请求的最大端到端延时。
    PostObject请求最大服务器延时毫秒请求API为PostObject的成功请求的最大服务器延时。
    AppendObject请求平均E2E延时毫秒请求API为AppendObject的成功请求的平均端到端延时。
    AppendObject请求平均服务器延时毫秒请求API为AppendObject的成功请求的平均服务器延时。
    AppendObject请求最大E2E延时毫秒请求API为AppendObject的成功请求的最大端到端延时。
    AppendObject请求最大服务器延时毫秒请求API为AppendObject的成功请求的最大服务器延时。
    UploadPart请求平均E2E延时毫秒请求API为UploadPart的成功请求的平均端到端延时。
    UploadPart请求平均服务器延时毫秒请求API为UploadPart的成功请求的平均服务器延时。
    UploadPart请求最大E2E延时毫秒请求API为UploadPart的成功请求的最大端到端延时。
    UploadPart请求最大服务器延时毫秒请求API为UploadPart的成功请求的最大服务器延时。
    UploadPartCopy请求平均E2E延时毫秒请求API为UploadPartCopy的成功请求的平均端到端延时。
    UploadPartCopy请求平均服务器延时毫秒请求API为UploadPartCopy的成功请求的平均服务器延时。
    UploadPartCopy请求最大E2E延时毫秒请求API为UploadPartCopy的成功请求的最大端到端延时。
    UploadPartCopy请求最大服务器延时毫秒请求API为UploadPartCopy的成功请求的最大服务器延时。
  • 成功请求

    成功请求的监控一定程度上反应了系统处理访问请求的能力。具体指标项如下:

    指标名称单位描述
    GetObject成功请求数次数请求API为GetObject的成功请求数。
    HeadObject成功请求数次数请求API为HeadObject的成功请求数。
    PutObject成功请求数次数请求API为PutObject的成功请求数。
    PostObject成功请求数次数请求API为PostObject的成功请求数。
    AppendObject成功请求数次数请求API为AppendObject的成功请求数。
    UploadPart成功请求数次数请求API为UploadPart的成功请求数。
    UploadPartCopy成功请求数次数请求API为UploadPartCopy的成功请求数。
    DeleteObject成功请求数次数请求API为DeleteObject的成功请求数。
    DeleteObjects成功请求数次数请求API为DeleteObjects的成功请求数。
  • 镜像回源

    具体指标项如下:

    指标名称单位描述
    [镜像回源]指定回源源站的正常请求流入流量字节统计指定某个源站时,返回值200和206的请求流入流量之和。
    [镜像回源]指定返回值和回源源站的请求流入流量字节统计指定某个源站以及某个返回值时的请求流入流量。
    [镜像回源]指定回源源站的正常请求平均传输速度字节/秒统计指定某个源站时,返回值200和206的请求流入速率的平均值。
    [镜像回源]指定返回值和回源源站的请求平均传输速度字节/秒统计指定某个源站以及某个返回值时的请求流入速率的平均值。
    [镜像回源]指定回源源站的正常请求总数次数统计指定某个源站时,返回值为200和206的请求总数。
    [镜像回源]指定返回值和回源源站的请求总数次数统计指定某个源站和返回值时的请求总数。
    [镜像回源]指定回源源站的正常请求平均延时毫秒统计指定某个源站时,返回值为200和206的请求平均延时。
    [镜像回源]指定返回值和回源源站的请求平均延时毫秒统计指定某个源站以及某个返回值时的请求平均延时。
    [镜像回源]指定回源源站的状态码2xx、3xx、4xx、5xx所占总请求量的百分比%统计指定某个源站时,各类请求状态码(2xx、3xx、4xx、5xx)所占总请求次数的百分比。
    [镜像回源]指定回源源站的状态码2xx、3xx、4xx、5xx的请求数量次数统计指定某个源站时,各类请求状态码(2xx、3xx、4xx、5xx)的请求次数。