本技术提供了一种分布式存储系统异常节点重启方法及系统。该方法包括:由存储集群中的各个节点共同组成监控环;在监控环中,各个节点启动对一个相邻节点的监控;当检测到被监控节点出现故障时,对被监控节点进行重启。本发明提供的分布式存储系统异常节点重启方法及系统能够在第一时间处理分布式存储系统中出现的故障。
背景技术
随着互联网技术的发展,对于存储的的要求也逐渐增加,现阶段一些关键技术的发展都是以大数据基础发展出来的。这也使得拥有易扩展,大容量的分布式存储系统得到市场的青睐。但分布式存储因为是将数据存储到不同机器节点上原因,导致会出现许多不确定性,其中有些状态只能通过重启节点来恢复节点的状态,从而恢复集群的状态。
现有技术方案都是通过人工干预的方式,去修复、重启节点从而达到恢复集群的目的,各个分布式存储管理平台也仅能提示使用者集群状态、节点状态。管理平台自身无法自动去重启节点。
实现思路