前置条件:安装 Agent
如果对于功能和性能有所调整,请参考:高级设置
本章节主要介绍在 IoT 安全运营中心 Agent 安装结束之后,如何使用一些手段评估其基本功能的兼容性以及对系统的性能损耗。分别介绍如下,以供参考。
1. 系统兼容性
在完成 IoT 安全运营中心的安全 Agent 并确保接入到 IoT 安全运营中心之后,请按照如下三步进行兼容性检查:
(1)命令行输入以下命令,观察是否有打印输出包含 /system/dps/bin/linker64,例如:
cat /proc/self/maps | grep linker
ffff945c2000-ffff94869000 r-xp 00000000 b3:02 651591 /system/dps/bin/linker64
ffff94869000-ffff9486a000 ---p 002a7000 b3:02 651591 /system/dps/bin/linker64
ffff9486a000-ffff9487c000 r--p 002a7000 b3:02 651591 /system/dps/bin/linker64
ffff9487c000-ffff9487f000 rw-p 002b9000 b3:02 651591 /system/dps/bin/linker64
(2)请使用 GUI 或者 sudo reboot 命令行重启系统,并观察系统是否可以完成启动。如果系统可以完整完成启动(如果有 GUI 界面请同时确保可以启动 GUI 并完成用户登录),并且确保业务应用程序也运行正常,则不存在兼容性问题。
(3)如果在设备操作系统类型、版本、内核版本都符合本文档要求的前提下,出现上述步骤中任意一步异常,请联系阿里云物联网团队的工程师进行协助。我们不对超出本文档声称支持的系统环境范围外的系统兼容性进行免费技术支持,如果需要适配新的系统、内核以及文档声明之外的其它 Linux 发行版,请加入我们的钉钉群获取支持:23147118。
2. 进程 CPU 资源消耗
为了确保 IoT 安全运营中心的安全 Agent 常驻进程对设备 CPU 资源的消耗,请使用以下命令进行评估和观察:
sudo ps -aux | grep dps
root 77448 0.2 0.1 17660 4960 ? Ssl 09:29 0:01 /system/dps/bin/dpsd
600 77470 0.1 0.1 23324 5892 ? SNl 09:29 0:00 /system/dps/bin/logd
root 77471 0.0 0.1 20020 5240 ? Sl 09:29 0:00 /system/dps/bin/sagent --self-activate
root 77472 0.0 0.1 18704 6172 ? Sl 09:29 0:00 /system/dps/bin/sandbox --daemon
root 77559 0.0 0.0 15560 2584 pts/0 S+ 09:42 0:00 grep --color=auto dps
上述命令获取了常驻的进程后台进程 pid,主要关心
/system/dps/bin/dpsd
/system/dps/bin/logd
/system/dps/bin/sagent (如果您是通过接入已经在物联网平台注册的产品,则无需评估此进程)
这三个进程的资源占用状况,采用 top -p 命令针对其 pid 分别逐个观察,以上述见到的 logd (pid 为 77470) 为例:
sudo top -p 77470
观察 %CPU 是否在可接受的范围内,例如上图它的 CPU 占用几乎是 0%。
3. 进程 RAM 资源消耗
同样可以使用上述观察 CPU 占用的方法,采用 top -p 命令对 dpsd,logd,sagent 三个进程进行内存消耗观察,观察的字段为 %MEM(相对值) 以及 VIRT?(绝对值),以评估是否在可接受范围内。
4. 网络流量消耗
网络流量消耗需要借助 nethogs 工具进行评估,可以在集成了 IoT 安全运营中心的安全 Agent 的目标设备上安装 nethogs 辅助工具:
Ubuntu/Debian:
sudo apt-get install nethogs
CentOS:
sudo yum install nethogs
然后运行,并在监控视图中按下 m 键以切换至积累流量统计模式(默认是实时流量统计模式)
sudo nethogs
然后维持一段时间,建议是一天或者更长,观察:
/system/dps/bin/sagent
/system/dps/bin/update
/system/dps/bin/scanner(如果您是通过接入已经在物联网平台注册的产品,则无需评估此进程)
这三个进程的上下行流量统计,确认在可接受范围内。
后续步骤:大规模部署和生产建议