HA(高可用):
- 有节点宕机的时候,通过多个provider集群+注册中心,可以运行期保障服务的整体可用
- 有节点偶尔有异常,但是没有宕机,可以通过重试+LB重新选节点,实现这次的调用成功
- 有节点在一段时间内异常(这个实例上有很多服务,其中个别服务因为某种原因比如SQL查询太慢等),没有宕机,甚至其他服务一直是好使的。
容错:在一群服务中,有个别机器短暂的出现了坏点,但是它不是宕机掉线,而是异常,不能被注册中心发现。 采取的办法就是故障隔离。识别出这种机器,把它从正常节点中剔除放置到隔离区。 之后每隔一段时间探活一次,如果恢复,就放回去,也就是故障恢复。
- 被隔离(full close 全关闭)
- 探活好了,做障恢复(full open 全开)
- 每次定时探活放一部分流量(half open 半开 )