MSHA的核心功能是切流。在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。
创建切流工单
- 登录多活容灾MSHA控制台。
- 在左侧导航栏选择,并在顶部选择目标命名空间。
- 在异地应用双活切流页面,单击切流。
- 在切流详情页面您可以修改工单名称,然后择以下任意一种方式完成第①步的规则调整。
- 方式一:范围切流
- 选择切流方式为范围。
- 开启或关闭接入层无标流量分流开关。
- 开启接入层无标流量分流开关:接入层会按照路由规则的比例进行多单元分流。
- 关闭接入层无标流量分流开关:接入层信赖DNS权重的分流,将所有流量默认路由到本单元。
说明
- 建议您在调整路由规则的比例后,当DNS的权重生效,即可关闭接入层分流。这样可以减少跨单元流量和响应时间,提升用户体验。
- 在关闭接入层无标流量分流开关的情况下,尽量不要调整路由规则,否则会使得流量在一段时间内不符合新的路由规则,这个时间主要由域名权重在所有客户端生效的时间决定。
- 使用以下任意方式更改切流规则,也可单击一键切零,比例归为零。
- 编辑中心单元的流量百分比。
说明 更改一个单元的流量百分比后,另一单元的流量百分比也随即改变。
- 滑动中心单元或普通单元区段的指针来改变流量百分比。
说明 中心单元与普通单元的流量百分比随指针位置变化。
- 单击关闭按比例调节,然后编辑中心单元的流量区间。
说明 中心单元的流量区间与普通单元的流量区间需连续且不重复。例如中心单元流量区间为[0,3925],则普通单元为[3926,9999]。
异地应用双活切流规则如下:若命名空间配置了接入层路由标提取规则,则切流完成后,MSHA接入层集群会将带标的流量按新路由规则路由到各个单元,而无标流量按比例分流到各个单元。
- 根据需要,选择切流的组件。可以选择同时进行各层组件切流或者某一层组件的切流。
- 方式二:精准切流
- 选择切流方式为精准切流。
- 开启接入层无标流量分流开关。接入层会按照路由规则的比例进行多单元分流。
说明 精准切流的场景,接入层无标流量分流开关默认必须开启。
- 选择单元。
- 选择切流调整的规则。
- 单击单元操作列的修改,在中心单元面板中输入访问中心单元的流量名单,单击+ 添加,可添加多个要切流的精准名单。完成后单击确定。
- 在第①步规则调整区域单击生成预览,查看切流规则。
- 单击第②步生效时间右侧的规则文本,即可对比查看切流规则前后变更详情。确认后单击执行预检查。
- 在第③步切流检查区域单击详情,在弹出的接入层实例检查面板查看切流检查详情,待所有检查项均通过后,单击确认。
说明 若有检查项检查不通过,可在该检查项右侧单击重试或跳过。跳过功能一般用于紧急切流场景,请谨慎使用。
然后在弹出的切流确认对话框中单击确定。
查看切流进程详情
创建切流任务后,MSHA会自动执行切流的各个步骤,您可以在切流任务页面单击步骤节点图标查看步骤的执行详情。
- 单击前置任务,可以查看该命名空间下配置的前置自定义动作。配置前置自定义动作的具体操作,请参见切流回调配置。
- 单击更新规则。
MSHA会将切流产生的流量规则或云产品切换规则推送给管控命令通道(从而下发到MSHA SDK),业务应用中依赖的MSHA SDK或Agent接收到新规则后将立即按新版流量规则进行流量处理或执行云产品切换动作。
说明 若推送规则失败,则单击重试进行重试,MSHA将在2小时内定时自动重试,如果超时仍未成功则切流工单进入异常状态并回滚重推基线规则。
- 各层切流。同时进行接入层和数据层切流。
- 单击接入层切流。MSHA将执行各单元流量比例推送和各单元化路由规则推送。
说明 若推送规则失败,则单击重试,MSHA将在2小时内定时自动重试,如果超时仍未成功则切流工单进入异常状态。
- 单击数据层切流。MSHA自动获取数据层的实例库DTS同步延迟情况。业务系统中依赖的MSHA SDK也会根据同步延时策略,进行相关的控制(禁写、禁更新、忽略)。当所有实例库DTS同步延迟为0s时。
- 单击消息层切流。MSHA自动获取MQ控制台重置消费位点情况。业务系统中依赖的MSHA SDK也会根据一定的策略,对消息归属消费单元重新计算,保证消息不丢失。
- 单击后置任务,可以查看该命名空间下配置的后置自定义动作。配置后置自定义动作的具体操作,请参见切流回调配置。