如果 etcd 集群由于无法预知的原因导致不能正常工作(节点之前的数据不一致),可尝试修复集群,该操作将用指定的某个集群内节点上的数据文件覆盖其他节点上的文件从而恢复数据一致。

注意事项

  • 执行修复集群操作会覆盖现有数据,请谨慎操作。如需协助,可提交工单联系技术支持。

  • 当集群多数节点(大于n/2)不健康,使用本集群中数据是正常的节点(通过看每个节点的etcd日志确定出数据正常的节点)对集群做修复,此时需选择多数节点不正常修复集群

  • 当集群少数节点(小于n/2)不健康,可以使用本集群的正常节点上的数据对本集群不正常节点做修复,服务不会中断。此时需选择少数节点不正常修复集群

操作步骤

  1. 登录管理控制台。

  2. 选择产品与服务 > 消息队列与中间件 > Etcd 服务,进入集群管理页面。

  3. 选择目标集群,点击目标集群 ID,进入集群详情页面。

  4. 在集群详情页,点击右上角更多操作

    cluster more opera
  5. 展开下拉菜单,点击自定义服务

    • 若集群中有少于一半的节点不正常,则选择少数节点不正常修复集群,在弹窗中输入集群其中一个正常节点 IP不正常节点 IP,点击确定即可。

      repair cluster 1 pub
    • 若集群中有多于一半的节点不正常,则选择多数节点不正常修复集群,在弹窗中输入集群中数据正常的节点 IP 地址点击确定即可。

      repair cluster 2 pub