常见问题

更新时间:

本文主要介绍云服务诊断在使用过程中的常见问题及解决办法。如需更多帮助请查看云服务诊断目录下其他帮助文档。欢迎加入钉钉交流群(群号:86570007290)与产品团队分享您的问题和观点。

FAQ

问:为什么我的RAM用户(子账号)无法开通服务?

答:RAM子账号需要拥有指定的权限才能开通服务,请根据界面提示向管理员获取权限后再试。主账号开通更加简单方便,主账号开通后子账号无需再开通。

问:为什么我的RAM用户(子账号)无法访问云服务诊断?

答:为了提供更安全的服务,RAM子账号访问云服务诊断需要只读或管理权限,请联系管理员授权。权限说明请参见只读及管理权限

问:为什么我有云资源,但看不到云资源的健康状态?

答:健康状态支持的云产品仍在不断丰富中,可能暂时无法覆盖您所有云资源。另外健康状态覆盖的资源类型是资源中心的子集,如ECS只提供实例的健康状态而快照、安全组等不提供健康状态。查看已支持的产品、资源类型清单请参见健康状态支持产品及说明

问:健康状态的不可用具体指什么,判断标准是什么,可信度如何?

答:不可用定义:因阿里云原因(如故障、计划内维护变更等)导致客户某个云资源在某个时段完全不响应用户正常请求(如宕机、完全无法连通、全部返回5xx或不返回等)或服务可用性低于正常波动范围(根据服务特点而定),则认为该云资源在该时段内服务不可用。

因为云产品较多,差异较大,不同云产品在不可用定义上可能存在差别,判断标准也有所不同。详情请参见健康状态支持产品及说明

健康状态基于各云产品的自主监测或云资源的日志分析,结果可信。如您对产品功能或判断标准有宝贵建议,欢迎加入钉钉交流群(群号:86570007290),我们将竭诚为您服务。

问:健康状态与阿里云健康看板有什么区别?

答:云服务诊断的云资源健康状态与阿里云健康看板均可展示云产品可用性状态。但两者在应用场景、资源粒度等方面各有侧重,详见下表:

云资源健康状态

阿里云健康看板

应用场景

用户云资源日常运维和问题排查

重大故障披露和公示

可用性粒度

资源粒度:云产品每一个可独立管理及运行的实例或服务统称为一个云资源,如ECS的每一个实例、OSS的每一个bucket

可用区+云产品粒度:如华北2(北京)可用区的ECS

时间粒度

以小时为粒度,部分产品可精确到秒。可查看近15

以天为粒度,可查看近1

产品范围

用户账号下的云资源

阿里云全部公共云产品

总结

后者针对的是所有阿里云用户;前者针对的单一用户。

后者出现可用性异常,若影响了某用户的某云资源不可用,前者会在该用户下展示异常,未影响的用户不展示异常。

前者出现可用性异常,若只是个别云资源问题,则不会在后者展示异常。

用户运维排查问题时,可优先查看前者,若前者出现异常再查看后者,若后者正好有对应的服务事件,可关注服务事件的处理动态。若后者无服务事件,可通过诊断进一步排查或联系客服。

问:健康状态与服务等级协议(SLA)的关系,是否可以依据健康状态结果进行赔偿申请?

答:云服务诊断的云资源健康状态与服务等级协议没有直接关系,也不能依据健康状态结果进行赔偿申请。详见下表:

云资源健康状态

服务等级协议

应用场景

用户云资源日常运维和问题排查

云产品服务等级指标及赔偿方案,即服务承诺

不可用定义

部分产品相同,部分产品不相同,需针对特定产品进行比较,不能简单等价

时间因素

以小时为粒度展示异常,但不代表该小时全部不可用。假设ECS 9:05-9:15异常,则9:00-9:59的小时段会标记异常。且仅保留近15天的记录

以月为粒度计算可用性指标,某天或某小时异常不能单独申请赔偿,需要进行累计

指标计算

计算的指标仅反映某个时段的二分情况,即只区分正常或异常,不记录具体指标值

往往需要计算整个月的平均值,每个时段的指标值都对结果有影响,都应该准确计算

限制条件

不区分引起不可用的原因,只关注可用性状态

往往有一些排除项,如客户受到黑客攻击引起的、阿里云所属设备以外的问题引起的、阿里云预先通知客户后进行系统维护所引起的不可用等,不在指标计算范围

总结

两者除了部分产品的不可用定义相同,其余关键维度均有明显差异,不能将云服务诊断的健康状态用于计算服务等级指标。如有赔偿申请诉求,请遵循服务等级协议。