可能原因
应用监控被暂停。
应用所在pod的探针没有被正确加载。
解决方案
步骤一:检查应用监控是否被暂停
登录ARMS控制台,在左侧导航栏选择 。
在应用列表页面顶部选择目标地域,然后单击目标应用名称。
如果未找到目标应用,请参考步骤二继续排查。
新版控制台请在上方导航栏选择
,在探针开关设置区域确认是否暂停应用监控。如果暂停应用监控开关被开启,请关闭开关,然后单击保存。
如果暂停应用监控开关保持关闭,请参考步骤二继续排查。
旧版控制台请在左侧导航栏中单击应用设置,然后在右侧页面单击自定义配置页签。在Agent开关配置区域确认Agent总开关是否开启。
如果Agent总开关未开启,请打开Agent总开关,然后单击页面底部的保存。
如果Agent总开关已开启,请参考步骤二继续排查。
步骤二:检查探针是否被正确加载
登录容器服务管理控制台,在集群列表页面,单击目标集群名称进入集群详情页。
在左侧导航栏选择 。
在容器组页面顶部选择您的应用所在的命名空间,然后单击目标应用右侧单击编辑。
在编辑YAML对话框中查看YAML文件中是否存在initContainers。
在命名空间为ack-onepilot。查看Pod列表中是否存在名称前缀为ack-onepilot的Pod。 页面顶部选择
如果存在,则执行步骤6。
如果不存在,则在应用市场中安装ack-onepilot。具体操作,请参见如何安装ack-onepilot和卸载arms-pilot。
在工作负载下的无状态或有状态页面目标应用右侧操作列中选择spec.template.metadata层级下是否存在以下Labels注解。 ,在编辑YAML对话框查看YAML文件中的
labels: armsPilotAutoEnable: "on" armsPilotCreateAppName: "<your-deployment-name>" #请将<your-deployment-name>替换为您的应用名称。 armsSecAutoEnable: "on" #如果需要接入应用安全,则需要配置此参数。
如果存在,则执行步骤7。
如果不存在,则在编辑YAML对话框中的spec.template.metadata层级下添加以上Labels注解,然后单击更新。
在
"Message":"STS错误"
。 页面目标应用右侧单击日志,查看ack-onepilot的Pod日志是否报STS错误,即提示如果报STS错误,则需为应用所在集群授权,并重启应用所在Pod。具体操作,请参见为容器服务Kubernetes版授权。
如果未报STS错误,请提交工单。
在javaagent参数。 页面目标应用右侧单击编辑,在编辑YAML对话框中查看YAML文件中是否存在以下
-javaagent:/home/admin/.opt/ArmsAgent/aliyun-java-agent.jar
说明如果您使用的探针版本在2.7.3.5以下,请将本文中的aliyun-java-agent.jar替换为arms-bootstrap-1.7.0-SNAPSHOT.jar。建议您尽快将探针升级至最新版本。