操作手册
【试用教程】使用云监控监控云服务器ECS
cms
手动配置
35
教程简介
在本教程中,您将学习到如何在云服务器ECS上安装云监控插件,查看采集到的云服务器ECS操作系统层面的监控指标,并对其设置报警规则,帮助您及时得知异常监控数据,并快速处理。
云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。
云监控(CloudMonitor)用于收集阿里云资源使用情况、业务运行状况和健康度,并进行异常报警,保证应用程序顺畅运行。
我能学到什么
学会为云服务器ECS安装云监控插件。
学会为监控指标创建报警规则。
准备环境和资源
10
开始教程前,请按以下步骤准备环境和资源:
安装云监控插件
5
登录云监控控制台。
在左侧导航栏,单击主机监控。
在主机监控页面,选中待安装或升级插件的阿里云主机,单击左下角的批量安装或升级插件。
单击确定。
安装或升级插件大约需要5分钟,请您耐心等待。当插件状态由安装中变为运行中时,表示插件安装或升级成功。
说明对于新购阿里云主机,您可以先单击左上角的安装/更新Agent,然后打开新购ECS自动安装云监控开关。打开开关后,您新购买的ECS主机将自动安装云监控插件,反之,需要您手动安装。
当某个阿里云主机的插件状态为已停止或安装失败时,您可以单击重装/升级,重新安装插件。当安装插件仍然失败时,需要手动安装。具体操作,请参见为阿里云主机手动安装插件。
查看监控图标
3
在左侧导航栏,单击主机监控。
在主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表。
您可以查看云服务器ECS的操作系统监控、基础监控、进程监控、网络监控和云盘的监控图表。
设置报警规则
5
前提条件
请确保您已创建报警联系人和报警联系组。具体操作,请参见创建报警联系人或报警联系组。
操作步骤
在左侧导航栏,单击主机监控。
在主机监控页面,单击右上角的创建报警规则。
在创建报警规则面板,设置报警规则相关参数。
参数
说明
产品
云监控可管理的云产品名称。例如:云数据库RDS版。
资源范围
报警规则作用的资源范围。取值:
全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。
应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。
实例:报警规则作用于指定云产品的指定资源上。
规则描述
报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:
单击添加规则。
在添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。
单击确定。
说明关于如何设置复杂的报警条件,请参见报警规则表达式说明。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
说明单击高级设置,可设置该参数。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
说明单击高级设置,可设置该参数。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域、ProjectName和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
说明单击高级设置,可设置该参数。
轻量消息队列(原 MNS)— topic
如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。
关于如何创建主题,请参见创建主题。
说明单击高级设置,可设置该参数。
无数据处理方法
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
说明单击高级设置,可设置该参数。
标签
报警规则的标签。包括标签名称和标签值。
单击确定。
完成
2
完成以上操作后,报警联系人可以接收到云服务器ECS的报警通知,并进行处理。
清理及后续
10
清理
在云服务器ECS控制台,如果您使用的是ECS试用实例,您可以参考以下内容释放或保留实例。
ECS提供的试用实例有按量付费实例和包年包月实例。请在阿里云免费试用确认您试用的实例类型,并参考以下规则清理:
按量付费实例释放
如果无需继续使用实例,可以登录ECS控制台,找到目标实例,在操作列单击
,搜索并单击释放设置,根据界面提示释放实例。
如果需要继续使用实例,请至少在试用到期1小时前为阿里云账号充值,确保账户金额不小于100.00元人民币。到期未续费的实例会因欠费而被自动停机,停机15天内实例将保留,15天后实例和数据都将被自动释放。
包年包月实例释放
包年包月实例到期会自动释放,释放实例的同时释放数据。
如果需要继续使用实例,请在试用到期前及时续费。到期未续费的实例会因欠费而被自动停机,停机15天内实例将保留,15天后实例和数据都将被自动释放。
在云监控控制台,您需要卸载云监控插件和删除报警规则。
后续
主机监控属于基础云监控的功能,如果您希望使用企业云监控或网络分析与监控功能。具体操作,请参见网络分析与监控和企业云监控。
总结
常用知识点
问题1:云监控自动为云服务器ECS安装云监控插件,安装的插件是哪个版本?(单选题)
C++
Go
Java
正确答案是C++。C++版本最新且占用的CPU和内存资源低。
问题2:用什么账号安装云监控插件?(单选题)
root
admin
root或Administrator
正确答案是root或Administrator。云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。