常见问题

更新时间:

本文主要介绍云服务诊断在使用过程中的常见问题及解决办法。如需更多帮助请查看云服务诊断目录下其他帮助文档。欢迎加入钉钉交流群(群号:86570007290)与产品团队分享您的问题和观点。

FAQ

问:使用健康状态为什么需要创建AliyunServiceRoleForHealth服务关联角色?

答:云服务诊断在获取资源的历史健康状态时会进行定期的检测,需要AliyunServiceRoleForHealth服务关联角色以及对应的角色权限策略AliyunServiceRolePolicyForHealth来查询您账户下云资源的资源可用性状态。 健康状态检测不消耗您账户下的资源。

问:「网站无法访问」诊断为什么需要创建AliyunServiceRolePolicyForNis和AliyunServiceRoleForResourceMetaCenter的服务关联角色?

答:云服务诊断在「网站无法访问」诊断场景中需通过资源管理查询您账户下的云资源信息来形成资源关系拓扑,资源管理需要AliyunServiceRoleForResourceMetaCenter服务关联角色以及对应的角色权限策略AliyunServiceRolePolicyForResourceMetaCenter。 另外在「网站无法访问」诊断场景中使用网络智能服务的能力进行网络资源实例的诊断,网络智能服务需要AliyunServiceRolePolicyForNis服务关联角色以及对应的角色权限策略AliyunServiceRolePolicyForNis

问:为什么我的RAM用户(子账号)无法创建服务关联角色?

答:RAM子账号需要拥有指定的权限才能创建相应的服务关联角色,请根据界面提示操作即可。主账号创建服务关联角色更加简单方便,主账号创建后子账号无需再创建。

问:为什么我有云资源,但看不到云资源的健康状态?

答:若健康状态资源列表为空,您可能未开通资源中心服务。健康状态依赖资源中心服务同步您保有的云资源列表,您可前往免费开通。同时健康状态支持的云产品仍在不断丰富中,可能暂时无法覆盖您所有云资源,查看已支持的产品清单请参见健康状态支持产品及说明

问:为什么我的RAM用户(子账号)无法访问云服务诊断?

答:为了提供更安全的服务,云服务诊断进行了系统升级。自2024年10月8日起,RAM子账号访问云服务诊断需要只读或管理权限,请联系管理员授权。权限说明请参见只读及管理权限

问:为什么有些功能不支持子账号和STS账号使用?

答:「网站无法访问」诊断以及「网络与CDN」相关诊断,因为涉及比较多的其他云产品能力和复杂的权限管控要求,暂时不支持子账号和STS账号使用,支持时间另行通知。如需使用以上功能,请以主账号登录使用。

问:健康状态的不可用具体指什么,判断标准是什么,可信度如何?

答:不可用定义:因阿里云原因(如故障、计划内维护变更等)导致客户某个云资源在某个时段完全不响应用户正常请求(如宕机、完全无法连通、全部返回5xx或不返回等)或服务可用性低于正常波动范围(根据服务特点而定),则认为该云资源在该时段内服务不可用。

因为云产品较多,差异较大,不同云产品在不可用定义上可能存在差别,判断标准也有所不同。详情请参见健康状态支持产品及说明

健康状态基于各云产品的自主监测或云资源的日志分析,结果可信。如您对产品功能或判断标准有宝贵建议,欢迎加入钉钉交流群(群号:86570007290),我们将竭诚为您服务。

问:健康状态与阿里云健康看板有什么区别?

答:云服务诊断的云资源健康状态与阿里云健康看板均可展示云产品可用性状态。但两者在应用场景、资源粒度等方面各有侧重,详见下表:

云资源健康状态

阿里云健康看板

应用场景

用户云资源日常运维和问题排查

重大故障披露和公示

可用性粒度

资源粒度:云产品每一个可独立管理及运行的实例或服务统称为一个云资源,如ECS的每一个实例、OSS的每一个bucket

可用区+云产品粒度:如华北2(北京)可用区的ECS

时间粒度

以小时为粒度,部分产品可精确到秒。可查看近15天

以天为粒度,可查看近1年

产品范围

用户账号下的云资源

阿里云全部公共云产品

总结

后者针对的是所有阿里云用户;前者针对的单一用户。

后者出现可用性异常,若影响了某用户的某云资源不可用,前者会在该用户下展示异常,未影响的用户不展示异常。

前者出现可用性异常,若只是个别云资源问题,则不会在后者展示异常。

用户运维排查问题时,可优先查看前者,若前者出现异常再查看后者,若后者正好有对应的服务事件,可关注服务事件的处理动态。若后者无服务事件,可通过诊断进一步排查或联系客服。

问:健康状态与服务等级协议(SLA)的关系,是否可以依据健康状态结果进行赔偿申请?

答:云服务诊断的云资源健康状态与服务等级协议没有直接关系,也不能依据健康状态结果进行赔偿申请。详见下表:

云资源健康状态

服务等级协议

应用场景

用户云资源日常运维和问题排查

云产品服务等级指标及赔偿方案,即服务承诺

不可用定义

部分产品相同,部分产品不相同,需针对特定产品进行比较,不能简单等价

时间因素

以小时为粒度展示异常,但不代表该小时全部不可用。假设ECS 9:05-9:15异常,则9:00-9:59的小时段会标记异常。且仅保留近15天的记录

以月为粒度计算可用性指标,某天或某小时异常不能单独申请赔偿,需要进行累计

指标计算

计算的指标仅反映某个时段的二分情况,即只区分正常或异常,不记录具体指标值

往往需要计算整个月的平均值,每个时段的指标值都对结果有影响,都应该准确计算

限制条件

不区分引起不可用的原因,只关注可用性状态

往往有一些排除项,如客户受到黑客攻击引起的、阿里云所属设备以外的问题引起的、阿里云预先通知客户后进行系统维护所引起的不可用等,不在指标计算范围

总结

两者除了部分产品的不可用定义相同,其余关键维度均有明显差异,不能将云服务诊断的健康状态用于计算服务等级指标。如有赔偿申请诉求,请遵循服务等级协议。