GaussDB 200集群系统的高可靠解决方案主要包括以下部分:
- 硬件级高可靠:
- 存储:磁盘Raid。
- 网络:交换机堆叠及网卡bond。
- 电源:不间断电源UPS(Uninterruptible Power Supply)。
- 软件级高可靠:GaussDB 200集群实例全方位HA。目前实例HA主要采用两种方式:
- Active-Active模式。CN采用这种模式。集群中可部署多个CN,并同时对外提供服务。CN的角色是对等的,即用户连到任何一个CN都可以得到一致的结果。
某CN故障时,负载均衡会将新的连接负载到其他CN上,故障CN上未完成的事务会全部回滚。对于V100R006C10及之前版本,CN故障时,整个集群将无法执行DDL,直至CN被修复。从V100R007C10开始,为不影响DDL的执行,GaussDB 200支持故障CN剔除功能,开启办法为将coordinator_heartbeat_timeout设置为正整数。
- Active-Standby模式。GTM和DN采用这种模式。GTM和DN主、备部署在不同的节点上,主和同步备间保持实时同步,异步备以追赶日志的方式进行同步。
主故障时,同步备会自动升主继续提供服务,并有相关告警上报进行提示。
- Active-Active模式。CN采用这种模式。集群中可部署多个CN,并同时对外提供服务。CN的角色是对等的,即用户连到任何一个CN都可以得到一致的结果。
在上述高可靠方案下,硬件级的高可靠保证了GaussDB 200所依赖的基础设施的可靠性;集群实例全方位HA在硬件可靠失效、操作系统故障及GaussDB 200自身故障时,能保证短时间自动恢复并对外提供服务,进而保证应用业务运行的持续性。