高性能nosql ledisdb设计与实现（2）：replication

2022-04-18 11:12:30

ledisdb如今已经支持replication机制，为ledisdb的高可用做出了保障。

使用

如果master的ip为10.20.187.100。端口6380，slave的ip为10.20.187.101。端口为6380.

首先我们须要master打开binlog支持，在配置文件里指定：

use_bin_log : true

在slave的机器上面我们能够通过配置文件指定slaveof开启replication。或者通过命令slaveof显示的开启或者关闭。

slaveof 10.20.187.100 6380

ledisdb的replication机制參考了redis以及mysql的相关实现，以下简单说明。

redis的replication机制主要介绍在这里，已经说明的非常具体了。

在redis2.8之后，为了防止断线导致又一次生成dump，redis添加了psync命令。在断线的时候master会记住当前的同步状态，这样下次就能进行断点续传了。

mysql的replication主要是通过binlog的同步来完毕的。

在master的不论什么数据更新，都会写入binlog。至于binlog的格式这里不再累述。

如果binlog的basename为mysql，index文件名称字为mysql-bin.index。该文件记录着当前全部的binlog文件。

binlog有max file size的配置。当binlog写入的的文件大小超过了该值。mysql就会生成一个新的binlog文件。当mysql服务重新启动的时候，也会生成一个新的binlog文件。

在Percona的mysql版本号中，binlog另一个max file num的设置，当binlog的文件数量超过了该值，mysql就会删除早的binlog。

slave有一个master.info的文件。用以记录当前同步master的binlog的信息，主要就是当前同步的binlog文件名称以及数据偏移位置，这样下次又一次同步的时候就能从该位置继续进行。

slave同步的数据会写入relay log中，同一时候在后台有另一个线程将relay log的数据存入mysql。

由于master的binlog可能删除，slave同步的时候可能会出现binlog丢失的情况。mysql通过dump+binlog的方式解决。事实上也就是slave全然的dump master数据，在生成的dump中也同一时候会记录当前的binlog信息。便于下次继续同步。

ledisdb的replication机制參考了redis以及mysql，支持fullsync以及增量sync。

master没有採用aof机制，而是使用了binlog。通过指定max file size以及max file num用来控制binlog的整体大小，这样我就无需关心aof文件持续增大须要又一次rewrite的过程了。

binlog文件名称格式例如以下：


ledis-bin.0000001
ledis-bin.0000002

binlog文件名称的后缀採用数字递增，兴许我们使用index来表示。

slave端也有一个master.info文件，由于ledisdb会严格的保证binlog文件后缀的递增。所以我们只须要记录当前同步的binlog文件后缀的index就可以。

整个replication流程例如以下：

当同步或者记录的binlog信息由于master端binlog删除导致不一致的时候，slave会发送fullsync进行全同步。
master收到fullsync信息之后。会将当前的数据以及binlog信息dump到文件，并将其发送给slave。
slave接受完毕整个dump文件之后，清空全部数据。同一时候将dump的数据导入leveldb。并保存当前dump的binlog信息。
slave通过sync命令进行增量同步。sync命令格式例如以下：
```
  sync binlog-index binlog-pos
```
master通过index定位到指定的binlog文件，并seek至pos位置。将其后面的binlog数据发送给slave。
slave接收到binlog数据，导入leveldb，如果sync没有收到不论什么新增数据，1s之后再次sync。

对于后一点，主要就是一个问题，即master新增的binlog怎样让slave进行同步。

对于这点无非就是两种模型。push和pull。

对于push来说。不论什么新增的数据都能非常及时的通知slave去获取，而pull模型为了性能考虑。不可能太过于频繁的去轮询，略有延时。

mysql採用的是push + pull的模式，当binlog有更新的时候，只通知slave有了更新，slave则是通过pull拉取实际的数据。可是为了支持push，master必须得维持slave的一些状态信息。这略微又添加了一点复杂度。

ledisdb採用了非常easy的一种方式，定时pull，使用1s的间隔，这样既不会由于轮询太过频繁导致性能开销增大，同一时候也能大限度的降低当机数据丢失的风险。