Skip to content

Latest commit

 

History

History
11 lines (10 loc) · 947 Bytes

node.md

File metadata and controls

11 lines (10 loc) · 947 Bytes

HA(高可用):

  1. 有节点宕机的时候,通过多个provider集群+注册中心,可以运行期保障服务的整体可用
  2. 有节点偶尔有异常,但是没有宕机,可以通过重试+LB重新选节点,实现这次的调用成功
  3. 有节点在一段时间内异常(这个实例上有很多服务,其中个别服务因为某种原因比如SQL查询太慢等),没有宕机,甚至其他服务一直是好使的。

容错:在一群服务中,有个别机器短暂的出现了坏点,但是它不是宕机掉线,而是异常,不能被注册中心发现。 采取的办法就是故障隔离。识别出这种机器,把它从正常节点中剔除放置到隔离区。 之后每隔一段时间探活一次,如果恢复,就放回去,也就是故障恢复。

  • 被隔离(full close 全关闭)
  • 探活好了,做障恢复(full open 全开)
  • 每次定时探活放一部分流量(half open 半开 )