通用方案:专有云V3.8环境网络集群问题的检查及修复方法

通用方案:专有云V3.8环境网络集群问题的检查及修复方法

更新时间:2020-07-24 14:25:16

1. 概述

本文主要介绍在专有云V3.8环境中,网络集群问题的检查及修复方法。

1.1. 适用范围

  • 专有云V3,天基
    说明:适用于专有云V3.8所有版本(V3.8.0和V3.8.1)集群网络问题的检查和修复。

1.2. 风险说明

无风险,方案中的脚本可重复执行。

2. 问题描述

在专有云V3.8环境中存在一个风险,可能导致以下两种情况。

  • 在进行环境升级时,天基终态的显示模块存在问题,在天基控制台中的TJDB同步时间或终态计算时间与北京时间不同步。
  • 如果是新部署环境,可能出现网络设备集群无法部署的情况。

3. 解决方案

3.1. 环境检查

上传fix38.py脚本文件到OPS1服务器的/home/admin目录,并确认脚本MD5值。

说明:脚本文件的MD5值为4448877ed2d5f0d19dd4b1bfd63d0c80

fix38.py

3.2. 实施步骤

  1. 登录OPS1服务器,切换到admin用户,进入/home/admin目录。
  2. 执行以下命令,检查环境是否正常。
    python2.7 fix38.py checkonly ; echo $?
    系统显示类似如下,返回结果最后为0,则说明环境正常,不需要进行以下操作。如果返回非0,则进入下一步操作。
  3. 执行以下命令,进行修复。
    python2.7 fix38.py recycle ; echo $?
    系统显示类似如下,如果结果返回非0,则再重试一次。两次重试都失败,请联系阿里云技术支持进行处理。
  4. 执行以下命令,再次进行环境检查。
    python2.7 fix38.py checkonly ; echo $?
    系统显示类似如下,返回结果为0,则环境修复正常,结束操作。否则,联系阿里云技术支持进行处理。

3.3. 结果验证

参见实施步骤的步骤4进行验证。

4. 回滚方案

无需回滚。