附录:诊断支持场景及说明

更新时间:

本文介绍云服务诊断已支持的诊断场景及说明,如需更多帮助请查看云服务诊断目录下其他帮助文档。如您有希望增加的诊断能力或意见反馈,欢迎加入钉钉交流群(群号:86570007290)与产品团队分享您的观点。

诊断场景清单

已支持的诊断场景及说明如下,更多诊断场景将陆续上线,敬请期待。

  1. ECS远程无法访问

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的ECS实例

    3. 功能描述:当用户发现云服务器ECS远程无法访问时,可通过ECS远程无法访问诊断工具快速排查ECS远程无法访问可能的原因。包括实例配置管理诊断、网络服务健康诊断、实例操作系统内相关配置诊断、计算服务健康诊断以及费用相关诊断等。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS远程无法访问

  2. ECS实例安全风险

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现服务器疑似被攻击、遭入侵等情况时,可通过ECS实例安全风险诊断工具快速排查ECS实例是否存在相关安全风险。若存在安全风险,用户可参考修复建议解决问题,确保ECS实例安全。

    4. 诊断入口:ECS实例安全风险

  3. ECS实例负载高

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现云服务器ECS CPU、磁盘、内存等使用率高,或系统响应慢等问题时,可通过ECS实例负载高诊断工具快速排查ECS实例是否存在负载高问题以及原因。包括对ECS实例的CPU、内存、磁盘IOPS或BPS、带宽等进行负载诊断。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS实例负载高

  4. ECS实例安全管控

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现云服务器ECS被锁定或疑似被封禁时,可通过ECS实例安全管控诊断工具快速排查ECS实例是否触发安全管控事件,以及触发的原因和影响。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS实例安全管控

  5. ECS是否出现宕机

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现云服务器ECS系统崩溃、蓝屏卡死、自动重启、宕机时,可通过ECS是否出现宕机诊断工具快速排查ECS实例是否存在以上问题及其原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS是否出现宕机

  6. ECS网络性能受损

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现云服务器ECS网速很慢、总是丢包、网络会话异常时,可通过ECS网络性能受损诊断工具快速排查ECS实例是否存在网络性能受损问题及其原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS网络性能受损

  7. ECS GPU设备健康检查

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的Linux ECS实例

    3. 功能描述:当用户发现云服务器ECS GPU工作不正常、或找不到连接不上时,可通过ECS GPU设备健康检查诊断工具快速排查ECS GPU设备是否正常。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS GPU设备健康检查

  8. ECS云盘扩容未生效

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的Linux ECS实例

    3. 功能描述:当用户发现云服务器ECS 云盘申请了扩容但未生效时,可通过ECS云盘扩容未生效诊断工具快速排查ECS 云盘是否正常。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS云盘扩容未生效

  9. ECS资源配额不足

    1. 诊断产品:云服务器ECS

    2. 诊断对象:地域

    3. 功能描述:当用户发现某地域云服务器ECS无法创建安全组、无法创建服务器镜像、云盘无法保存数据等问题时,可通过ECS资源配额不足诊断工具快速排查该地域ECS配额是否充足。若发现配额不足,用户可参考修复建议提升配额,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS资源配额不足

  10. ECS费用及安全行为审计

    1. 诊断产品:云服务器ECS

    2. 诊断对象:ECS实例

    3. 功能描述:当用户发现云服务器ECS安全组被人修改、实例莫名被停止、费用突然升高、服务器数量无故变化等情况时,可通过ECS费用及安全行为审计诊断工具快速排查ECS是否存在非预期的实例、安全组、费用等变化。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS费用及安全行为审计

  11. ECS无法正常启动

    1. 诊断产品:云服务器ECS

    2. 诊断对象:已停止的Linux ECS实例

    3. 功能描述:当用户发现云服务器ECS无法启动、进不去系统、无法停止、无法关机等情况时,可通过ECS无法正常启动诊断工具快速排查ECS无法启动或停止的原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。诊断工具会尝试为实例挂载修复盘进行诊断,诊断完毕后,如果不需要进一步修复,您需要通过诊断报告中提供的「卸载修复盘」功能将修复盘卸载。修复过程中可能会修改实例系统盘的配置,为了避免不必要的风险,建议您在诊断前创建系统盘快照,以便后续数据恢复。

    4. 诊断入口:ECS无法正常启动

  12. ECS SSH无法连接

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的ECS实例

    3. 功能描述:当用户发现云服务器ECS SSH无法连接时,可通过ECS SSH无法连接诊断工具快速排查ECS SSH无法连接的原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS SSH无法连接

  13. ECS Workbench公网无法远程连接

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的ECS实例

    3. 功能描述:当用户发现云服务器ECS实例通过Workbench公网无法连接时,可通过ECS Workbench公网无法远程连接诊断工具快速排查ECS实例Workbench公网无法连接的原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS Workbench公网无法远程连接

  14. ECS Workbench内网无法远程连接

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的ECS实例

    3. 功能描述:当用户发现云服务器ECS实例通过Workbench内网无法连接时,可通过ECS Workbench内网无法远程连接诊断工具快速排查ECS实例Workbench内网无法连接的原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS Workbench内网无法远程连接

  15. ECS PING不通

    1. 诊断产品:云服务器ECS

    2. 诊断对象:运行中的ECS实例

    3. 功能描述:当用户发现云服务器ECS实例ping不通时,可通过ECS PING不通诊断工具快速排查ECS实例ping不通的原因。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:ECS PING不通

  16. 轻量应用服务器远程无法访问

    1. 诊断产品:轻量应用服务器

    2. 诊断对象:运行中的轻量应用服务器实例

    3. 功能描述:当用户发现云轻量应用服务器实例远程无法访问时,可通过轻量应用服务器远程无法访问诊断工具快速排查轻量应用服务器实例远程无法访问可能的原因。包括实例配置管理诊断、网络服务健康诊断、实例操作系统内相关配置诊断、计算服务健康诊断以及存储服务健康诊断等。用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:轻量应用服务器远程无法访问

  17. 传统型负载均衡全方位

    1. 诊断产品:负载均衡

    2. 诊断对象:CLB实例

    3. 功能描述:当用户发现传统型负载均衡CLB实例疑似存在丢包、无法访问、健康状态异常、欠费或安全策略问题时,可通过传统型负载均衡全方位诊断工具快速排查传统型负载均衡CLB实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:传统型负载均衡全方位

  18. 应用型负载均衡全方位

    1. 诊断产品:负载均衡

    2. 诊断对象:ALB实例

    3. 功能描述:当用户发现应用型负载均衡ALB实例疑似存在丢包、无法访问、健康状态异常、欠费或安全策略问题时,可通过应用型负载均衡全方位诊断工具快速排查传统型负载均衡ALB实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:应用型负载均衡全方位

  19. 网络型负载均衡全方位

    1. 诊断产品:负载均衡

    2. 诊断对象:NLB实例

    3. 功能描述:当用户发现网络型负载均衡NLB实例疑似存在丢包、无法访问、健康状态异常、欠费或安全策略问题时,可通过网络型负载均衡全方位诊断工具快速排查网络型负载均衡NLB实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:网络型负载均衡全方位

  20. NAT网关全方位

    1. 诊断产品:NAT网关

    2. 诊断对象:NAT网关实例

    3. 功能描述:当用户发现NAT网关实例疑似存在丢包、速度慢、无法连接、配额不足、欠费或安全策略问题时,可通过NAT网关全方位诊断工具快速排查NAT网关实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:NAT网关全方位

  21. 弹性公网IP全方位

    1. 诊断产品:弹性公网IP

    2. 诊断对象:弹性公网IP实例

    3. 功能描述:当用户发现弹性公网IP实例疑似存在丢包、无法连接、带宽不足、欠费或安全策略问题时,可通过弹性公网IP全方位诊断工具快速排查弹性公网IP实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:弹性公网IP全方位

  22. 全球加速全方位

    1. 诊断产品:全球加速

    2. 诊断对象:全球加速实例

    3. 功能描述:当用户发现全球加速实例疑似存在丢包、无法连接、带宽不足、欠费或安全策略问题时,可通过全球加速全方位诊断工具快速排查全球加速实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:全球加速全方位

  23. VPN全方位

    1. 诊断产品:VPN网关

    2. 诊断对象:VPN网关实例

    3. 功能描述:当用户发现VPN网关实例疑似存在丢包、速度慢、无法连接、带宽不足、欠费或安全策略问题时,可通过VPN全方位诊断工具快速排查VPN网关实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:VPN全方位

  24. 虚拟边界路由器全方位

    1. 诊断产品:高速通道

    2. 诊断对象:虚拟边界路由器实例

    3. 功能描述:当用户发现虚拟边界路由器实例疑似存在丢包、连接不通、健康状态异常、欠费或安全策略问题时,可通过虚拟边界路由器全方位诊断工具快速排查虚拟边界路由器实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:虚拟边界路由器全方位

  25. 转发路由器全方位

    1. 诊断产品:转发路由器

    2. 诊断对象:转发路由器实例

    3. 功能描述:当用户发现转发路由器实例疑似存在丢包、连接不通、速度慢、欠费或安全策略问题时,可通过转发路由器全方位诊断工具快速排查转发路由器实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:转发路由器全方位

  26. 私网连接终端节点全方位

    1. 诊断产品:私网连接

    2. 诊断对象:私网连接终端节点实例

    3. 功能描述:当用户发现私网连接终端节点实例疑似存在丢包、连接不通、速度慢、欠费等问题时,可通过私网连接终端节点全方位诊断工具快速排查私网连接终端节点实例的健康、配置、安全、容量、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:私网连接终端节点全方位

  27. 私网连接终端节点服务全方位

    1. 诊断产品:私网连接

    2. 诊断对象:私网连接终端节点服务实例

    3. 功能描述:当用户发现私网连接终端节点服务实例疑似存在配置、欠费等问题时,可通过私网连接终端节点服务全方位诊断工具快速排查私网连接终端节点服务实例的健康、配置、费用等问题。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:私网连接终端节点服务全方位

  28. RDS白名单检测

    1. 诊断产品:云数据库RDS

    2. 诊断对象:RDS实例

    3. 功能描述:当用户无法连接RDS实例时,可通过RDS白名单检测工具快速批量检测私网IP或公网IP是否在RDS实例白名单中,并可以一键添加白名单。更多无法连接 RDS 的解决办法请参考解决无法连接实例问题

    4. 诊断入口:RDS白名单检测

  29. 网站无法访问

    1. 诊断产品:多产品

    2. 诊断对象:网站域名

    3. 功能描述:当用户发现部署在阿里云上的网站无法访问或访问异常时,可通过网站无法访问诊断工具快速排查网站无法访问/访问异常/被封禁等原因。用户只需输入网站域名,即可自动分析网站所依赖的云资源(仅限用户名下的资源),并对SLB、EIP、ECS等资源进行诊断,排查网站无法访问的原因。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。

    4. 诊断入口:网站无法访问

  30. 网络路径连通性

    1. 诊断产品:多产品

    2. 诊断对象:ECS、公网IP、交换机、负载均衡等

    3. 功能描述:当用户发现或疑似ECS、公网IP、交换机、负载均衡等网络节点间网络不通时,可通过网络路径连通性诊断工具快速排查发起端与目的端的网络路径连通情况。用户选择发起端和目的端即可自动分析端到端的网络路径,查看路径中每个节点的信息。若发现异常,用户可参考修复建议解决问题,及时恢复业务,提升运维效率。如路由配置缺少下一跳需增加路由配置、无法与公网互连需配置弹性公网 IP、被安全组规则丢弃需调整安全组设置等。若未发现异常,还可一键发起反向路径连通性诊断,验证往返情况。

    4. 诊断入口:网络路径连通性

一键诊断

说明

为了方便用户使用,从2024年11月8日开始陆续开放「一键诊断」功能的邀测。「一键诊断」可一键为用户全方位诊断云上资源,一次性解决问题,免去用户逐个排查的烦恼。邀测期间可针对ECS资源进行一键诊断。欢迎加入钉钉交流群(群号:86570007290)获取邀测链接。

一键诊断概述

选择特定场景诊断要求用户能够对问题有初步判断,通过相关的诊断工具逐一排查和解决。而一键诊断只需用户一次发起即可针对用户保有的云上资源进行整体诊断,排查每个资源是否存在异常情况,对异常进行严重等级排序并提供修复建议,方便用户集中处理。一键诊断类似全身体检,可排查有明显表征及无明显表征的健康问题;场景诊断类似专科检查。

一键诊断使用

发起一键诊断

入口1:登录控制台,在控制台首页侧边栏可快速发起诊断(侧边栏收起时,可点击右下角展开image)。

image

入口2:登录控制台,在控制台首页-运维监控-创建诊断可快速发起诊断。

image

邀测用户在点击入口发起诊断时,默认选中一键诊断,也可切换至场景诊断。

image

系统展示当前账号下所有ECS实例,并默认选中第一页的实例,可根据需要调整待诊断的实例。邀测期间一次诊断最多选中20个ECS实例。

点击「开始诊断」启动一键诊断,可查看整体诊断进度以及每个实例的诊断进度,整个过程大概1-2分钟。

image

说明

一键诊断需要使用AliyunServiceRoleForHealth服务关联角色调用云产品相关诊断接口,若未创建AliyunServiceRoleForHealth服务关联角色,请根据界面提示一键创建。

全部诊断完成后,可查看诊断结论。

image

若诊断发现异常,异常的ECS实例排在前列。点击箭头展开可查看异常详情和修复建议。可根据修复建议解决问题,若问题仍未解决可提交工单处理。

点击「有帮助」、「没有帮助」反馈诊断效果,我们将认真听取并持续优化。

说明

诊断结果标识说明:

无异常:未发现明显异常,问题排查时可排除该项。

信息:偏离最佳实践,但暂不会影响用户使用,可酌情处理。

警告:有明显异常,可能影响用户使用,建议尽快处理。

严重:有重大异常,极有可能影响用户使用,请立即处理。

失败:因意外情况未得到明确诊断结果,可重新诊断。