方案选型
Elasticsearch(ES)异地容灾主要有以下2种方案:
OSS快照备份与恢复:通过将索引数据备份到阿里云对象存储OSS,实现数据持久化保存。首次快照为全量备份,后续为增量备份。通过跨集群OSS仓库,可将快照数据恢复到目标ES实例。详情请参见通过跨集群OSS仓库备份与恢复数据。
跨集群复制(CCR):将Leader集群的可写索引,以异步、增量的方式自动复制到一个或多个Follower集群。支持近实时同步,适用于对RPO和RTO要求较高的容灾场景,详情请参见通过CCR实现跨集群数据复制。
方案对比
方案 | 适用场景 | RPO | RTO | 主要限制 |
OSS快照 | 大规模数据(GB~PB级别)的定期备份与恢复 | 小时级到天级(取决于快照间隔) | 数小时(取决于数据量和分片恢复时间) | 无法实现持续同步;恢复期间可能需要停止服务 |
CCR | 异地容灾、读写分离、就近访问 | 近零(秒级) | 秒级到分钟级 | Follower索引只读;需要相同的mapping和分片数 |
对于RPO和实时性要求高的异地容灾场景,CCR是最佳选择:
CCR实现秒级数据同步,数据丢失最小化。
主集群故障时,业务流量切换到Follower集群即可恢复服务,无需等待快照恢复。
虽然初始部署成本较高,但长期来看避免了数据丢失导致的业务损失,性价比更高。
该文章对您有帮助吗?