通用方案:专有云V3环境ram-ramService服务ServiceTest#服务角色测试用例出错的临时处理方法

通用方案:专有云V3环境ram-ramService服务ServiceTest#服务角色测试用例出错的临时处理方法

更新时间:2020-06-29 10:36:31

1. 概述

本文主要介绍在专有云V3环境,ram-ramService服务ServiceTest#服务角色测试用例出错的临时处理方法。

1.1. 适用范围

  • 专有云V3,RAM
    说明:适用于专有云V3.0.0~V3.10。

1.2. 风险说明

本方案属于故障恢复操作,故风险低。

2. 问题描述

在专有云V3环境,ram-ramService服务ServiceTest#服务角色未达终态。pop-aliyun-com容器所在的VM或宿主机,进行重新克隆操作后,容易触发该问题。

3. 解决方案

3.1. 环境检查

检查测试用例出错详情,并确认是否符合处理要求。

检查出错详情

  1. 登录天基控制台,在Project框中搜索ram。选择BasicCluster-A-XXX>Dashboard
  2. 服务实例列表区域,单击ram-ramService右侧的详情
  3. 服务监控信息列表区域,单击test_report右侧的详情
  4. 确认测试的失败用例为clean_upcreate_user报错,包含以下错误关键字。
    tlsv1 alert internet error

确认符合处理要求

  1. 登录天基控制台,在Project框中搜索webappAll。选择StandardCloudCluster-A-XXX>集群运维中心
  2. 集群运维中心页面,选择webapp-pop服务与PopAliyunCom#角色。单击Terminal,登录对应的机器。
  3. 登录pop-aliyun-com容器,依次执行以下命令,检查相应的文件是否存在。
    ll /etc/tengine/ssl
    ll /var/run/proxyssl
    正常情况下,系统返回类似如下。请确认当前环境这些文件有缺失。

3.2. 实施步骤

重新拉起pop-aliyun-com容器

若两个pop-aliyun-com容器都出现文件缺失的现象,则两个容器均需操作。完成一个后在操作另一个,不能同时进行重拉操作,避免单点故障。

  1. 登录天基控制台,在Project框中搜索webappAll。选择StandardCloudCluster-A-XXX>集群运维中心
  2. 集群运维中心页面,选择webapp-pop服务与PopAliyunCom#角色。单击 Terminal,登录对应的机器。
  3. 执行以下命令,停止并删除容器,随后天基会重新拉起容器。
    docker stop [$Container_ID]; docker rm [$Container_ID]
    说明
    • [$Container_ID]为pop-aliyun-com容器的ID。
    • 上述命令需要放在同一行中执行。

重启ServiceTest#角色

  1. 登录天基控制台,在Project框中搜索ram。选择BasicCluster-A-XXX>Dashboard
  2. 服务实例列表区域,单击ram-ramService右侧的详情
  3. 服务角色列表区域,单击ServiceTest#右侧的详情
  4. 服务角色Dashboard页面,单击操作菜单>重启服务角色

3.3. 结果验证

  1. 登录天基控制台,在Project框中搜索ram。选择BasicCluster-A-XXX>集群运维中心
  2. 服务实例列表区域,单击ram-ramService右侧的详情
  3. 服务监控信息列表区域,单击test_report右侧的详情
  4. 确认测试通过。

4. 回滚方案

重启容器,无回滚方案。