在应用管理中创建应用后,建议实时监控其健康状况。这有助于快速响应故障,确保业务持续稳定运行。应用管理已集成云监控功能,让应用监控变得更简便高效。
功能优势
上云后,若使用单一阿里云账号集中管理所有云资源,鉴于企业内部存在多个业务线,每个业务线通常涉及一个或多个应用服务。这些业务线被分配给不同的团队管理。因此,按应用对资源进行分组管理能有效减轻管理负担并提升运营效率。
例如,传统模式下,运维人员在排查问题时需要首先确定受影响的业务,然后找到该业务对应的应用,接着定位到其所在地域的线上环境应用分组,最后查看监控指标以检查是否存在异常。
但在按应用分组维度创建了报警规则后,报警信息中将包含应用名称(以识别出关联的业务)及应用分组名称,便于快速判断受影响的业务及其环境类型。
云监控为云上用户提供开箱即用的企业级开放型一站式监控解决方案。云监控涵盖IT设施基础监控和外网网络质量拨测监控,是基于事件、自定义指标和日志的业务监控,为您全方位提供更高效、全面、省钱的监控服务。使用云监控,不但可以帮助您提升系统服务可用时长,还可以降低企业IT运维监控成本。
应用管理会自动为每个应用分组在云监控中创建一个对应的云监控应用分组。
查看应用分组的监控信息
在应用分组的概览页面,查看到应用分组对应的标签。应用管理会根据这些标签在云监控中创建动态分组。云监控应用分组与应用管理中的应用分组是一一对应的。
监控视图:常见资源类型的核心指标的监控图表,可分组查看或按实例查看。
故障列表:故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。
可用性监控:设置应用的可用性监控配置。
组进程监控:配置进程级别的监控。
报警历史:记录报警事件的历史数据。
报警规则:管理报警规则的列表。
设置应用的报警
使用报警联系人组
云监控的报警通知对象是报警联系人组。建议按应用维度创建联系人组,并将与应用相关的开发和运维负责人加入到这些联系人组中。
使用报警模板
推荐采用报警模板来维护应用的报警配置。基于应用架构,在模板内设定相应的报警规则。例如,对于包含ECS实例、RDS数据库实例以及SLB负载均衡器的Web应用,可以在报警模板中添加对这些资源监控指标的报警规则。利用报警模板,可以快速为不同环境(如预发布环境与生产环境)或多个地理区域生成统一标准的报警配置。
统一应用的监控报警配置
如果您应用中的所有分组需要保持相同的监控报警配置,您可以配置应用级别的报警设置。这可以在创建应用时进行设置,或者在应用创建后通过高级设置进行修改。应用级别的监控报警配置将在所有现有及新建的应用分组中自动生效,从而帮助您节省管理成本。
应用的报警联系人组。
应用的报警模板。
应用健康检查URL:使用此URL来配置可用性监控规则。如果报警模板中已经包含可用性监控,此项可以不填。比如应用可以暴露一个checkhealth地址(如
http://localhost:8080/checkhealth
),云监控通过定时轮询这个地址来判断应用是否可用。