日志服务Logtail支持采集主机CPU、内存、负载、磁盘、网络等监控数据。本文介绍如何通过日志服务控制台创建Logtail采集配置来采集主机监控数据。

前提条件

已在服务器上安装Logtail(Linux Logtail 0.16.40及以上版本),详情请参见安装Logtail(Linux系统)

使用限制

  • 不支持Windows版本。
  • 不支持采集GPU、硬件状态等监控数据。

操作步骤

  1. 登录日志服务控制台
  2. 接入数据区域,选择主机监控
  3. 选择日志空间页签中,选择目标Project和MetricStore,单击下一步
    您也可以单击立即创建,重新创建Project和MetricStore,详情请参见创建Project创建MetricStore
  4. 创建机器组页签中,创建机器组。
  5. 机器组配置页签中,应用机器组。
    选择一个机器组,将该机器组从源机器组移动到应用机器组
  6. 数据源设置页签中,配置配置名称插件配置
    inputs为Logtail采集配置,必选项,请根据您的数据源配置。
    说明 一个inputs中只允许配置一个类型的数据源。
    {
        "inputs": [
            {
                "detail": {
                    "IntervalMs": 30000
                },
                "type": "metric_system_v2"
            }
        ]
    }
    参数 类型 是否必选 参数说明
    type string 数据源类型,固定为metric_system_v2。
    IntervalMs int 每次请求的间隔,单位:ms。不能低于5000,建议设置为30000。
  7. 单击下一步,完成配置。

指标说明

主机CPU、内存、负载、磁盘、网络等指标说明如下:
  • CPU相关指标
    指标名 说明 单位 示例
    cpu_count CPU核数 2.0
    cpu_util CPU使用率,计算方式为排除idle、wait、steal后的占比 百分号(%) 7.68
    cpu_guest_util 客户时间(guest time)占比 百分号(%) 0.0
    cpu_guestnice_util Nice进程客户时间(nice guest time)占比 百分号(%) 0.0
    cpu_irq_util 硬中断处理时间(Hard Irq time)占比 百分号(%) 0.0
    cpu_nice_util Nice时间(Nice time)占比 百分号(%) 0.0
    cpu_softirq_util 软中断处理时间(Soft Irq time)占比 百分号(%) 0.06
    cpu_steal_util 等待宿主机CPU时间(Steal time)占比 百分号(%) 0.0
    cpu_sys_util 内核态(System time)占比 百分号(%) 2.77
    cpu_user_util 用户态(User time)占比 百分号(%) 4.84
    cpu_wait_util 等待IO(Waiting time)占比 百分号(%) 0.11
  • 内存相关指标
    指标名 说明 单位 示例
    mem_util 内存使用率 百分号(%) 51.03
    mem_cache 已申请但未使用的内存 byte 3566386668.0
    mem_free 未使用的内存 byte 177350084.0
    mem_available 可用内存 byte 3699885553.0
    mem_used 已使用内存 byte 4041510463.0
    mem_swap_util swap内存使用率 百分号(%) 0.0
    mem_total 内存总量 byte 7919128576.0
  • 磁盘相关指标
    指标名 说明 单位 示例
    disk_rbps 硬盘每秒读取流量 byte/s 8376.81
    disk_wbps 硬盘每秒写入流量 byte/s 247633.58
    disk_riops 硬盘每秒读取次数 次/s 0.22
    disk_wiops 硬盘每秒写入次数 次/s 43.39
    disk_rlatency 平均读延迟 ms 2.83
    disk_wlatency 平均写延迟 ms 2.15
    disk_util IO使用率 百分号(%) 0.27
    disk_space_usage 磁盘使用百分比 百分号(%) 9.12
    disk_inode_usage inode使用率 百分号(%) 1.18
    disk_space_used 磁盘已使用容量 byte 11068512238.59
    disk_space_total 磁盘总量 byte 126692061184.0
    disk_inode_total inode总量 byte 7864320.0
    disk_inode_used inode已使用容量 byte 93054.78
  • NET相关指标
    指标名 说明 单位 示例
    net_drop_util 丢弃的数据包占总数据包的比值 百分号(%) 0.0
    net_err_util 报错数据包占总数据包的比值 百分号(%) 0.0
    net_in 网络接收速率 byte/s 8440.91
    net_in_pkt 每秒接收的数据包 个/s 40.83
    net_out 网络发送速率 byte/s 12446.53
    net_out_pkt 每秒发送的数据包 个/s 39.95
  • TCP相关指标
    指标名 说明 单位 示例
    protocol_tcp_established 已建立连接数 205.0
    protocol_tcp_insegs 接收的所有报文数 4654.0
    protocol_tcp_outsegs 发送的报文数 4870.0
    protocol_tcp_retran_segs 重传报文数 0.0
    protocol_tcp_retran_util 重传报文占总发送报文数量的比值 百分号(%) 0.0
  • system相关指标
    指标名 说明 单位 示例
    system_boot_time 系统启动时间 s 1578461935.0
    system_load1 系统平均负载,1分钟平均值 不涉及 0.58
    system_load5 系统平均负载,5分钟平均值 不涉及 0.68
    system_load15 系统平均负载,15分钟平均值 不涉及 0.60

后续步骤

  • 查询分析

    采集到数据后,您可以在MetricStore查询分析页面进行查询分析操作,详情请参见查询分析时序数据

  • 日志服务可视化
    日志服务自动在对应Project中生成主机监控仪表盘,您可以直接使用该仪表盘查看查询分析结果,及进行告警等相关操作。主机监控
  • Grafana可视化
    日志服务为主机监控数据提供Grafana模板,您可以使用Grafana仪表盘展示查询分析结果,详情请参见使用Prometheus采集Kubernetes监控数据,Grafana模板详情请参见《1 SLS主机监控单机指标v2020.08.08》对接Grafana