Redis 持久化

Redis 是内存数据库,如果不将内存中的数据库状态保存至硬盘中,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能。

RDB ( Redis DataBase)

在主从复制中,rdb 就是备用的,放在从机上面。

在指定的时间间隔内将内存中的数据集快照写入磁盘,恢复时是将快照文件读到内存里。

Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个文件替换上次持久化好的文件。在整个过程中,主进程是不进行任何 IO 操作的。这就确保了极高的性能。如果需要大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 要比 AOF 方式更加的高效。RDB 的缺点就是最后一次持久化的数据可能丢失。我们默认的就是 RDB,一般情况下不需要修改这个配置。

==RDB 保存的文件是 dump.rdb==

触发机制

1、save 规则满足的情况下,会自动触发 rdb 规则

2、执行了 flushall 命令也会触发 rdb 规则

3、退出 redis 也会产生 rdb 文件。

备份就自动生成一个 dump.rdb

如何恢复 rdb 文件

1、只需要将 rdb 文件放在 redis 的启动目录下就可以,redis 启动的时候会自动检查 dump.rdb 恢复其中的数据

2、查看需要存在的位置

127.0.0.1:6379> config get dir
1) "dir"
2) "D:\\redis"        # 如果这个目录下存在 dump.rdb 文件,启动就会自动恢复其中的数据

优点:

1、适合大规模的数据恢复

2、对数据的完整性要求不高

缺点:

1、需要一定的时间间隔进程操作,如果 redis 意外宕机了,这个最后一次修改的数据就没有了

2、fork 进程的时候,会占用一定的内存空间

AOF ( Append Only File )

将我们的所有命令都记录下来,恢复的时候就把这个文件全部再执行一遍。

以日志的形式来记录每个写操作,将 Redis 执行过的所有指令记录下来(读操作不记录),只许追加文件但不许改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

==AOF保存的是 appendonly.aof==

默认是不开启的,需要手动进行配置。

重启 redis 就可以生效。

如果这个 aof 文件有错,这个时候 redis 是启动不起来的,我们需要修复这个 aof 文件

redis 给我们提供了一个工具 redis-check-aof

image-20220722110704581

重写规则

aof 默认的就是文件的无线追加,文件会越来越大

image-20220722111920442

如果 aof 文件大于 64m,太大了,redis 会 fork 一个新的进程来将我们的文件进行重写。

appendonly no    # 默认是不开启 aof 模式,默认是使用 rdb 方式持久化    在大部分所有的情况下,rdb 完全够用

appendfilename "appendonly.aof"    # 持久化文件的名字

# appendfsync always    # 每次修改都会 sync。消耗性能
appendfsync everysec    # 每秒执行一次 sync同步,可能会丢失这1s的数据
# appendfsync no    # 不执行 sync,这个时候才做系统自己同步数据,速度最快,但一般不用

优点:

1、每一次修改都同步。

2、每秒同步一次,可能会丢失一秒的数据。

3、从不同步,效率最高的。

缺点:

1、相对于数据文件大小来说,aof 远远大于 rdb,修复的速度也比 rdb 慢。

2、AOF 运行效率也要比 rdb 慢,所以 redis 默认的持久化方式是 rdb。

扩展

1、RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储

2、AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF 命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。

3、==只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化。==

4、同时开启两种持久化方式

  • 在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 保存的数据集要比 RDB 文件保存的数据集要完整。
  • RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件,那要不要只使用 AOF 呢?建议不要只使用 AOF,因为 RDB 更适合用于备份数据库 ( AOF 在不断变化不好备份 ) ,快速重启,而且不会有 AOF 可能存在的 BUG,留着作为一个万一的手段。

5、性能建议

  • 因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要 15min 备份一次就够了,只保留 save 900 1这条规则。
  • 如果 Enable AOF,好处就是在最恶劣情况下也只会丢失不超过两秒的数据,启动脚本较简单只 load 自己的 AOF 文件就可以了,代价一是带来了持续的 IO,二是 AOF rewrite 的最后将 rewrite 的过程中产生的新数据写到新文件造成的阻塞是无可避免的。只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值是 64M 太小,可以设到 5G 以上,默认超过原大小 100% 大小重写可以改到适当的数值。
  • 如果不 Enable AOF,仅靠 Master-Slave Repllcation ( 主从复制 ) 实现高可用性也可以,能省掉一大笔 IO,也减少了 rewrite 时带来的系统波动。代价是如果 Master/Slave 同时倒掉 ( 断电 ),会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的 RDB 文件,载入较新的那个,微博就是这种架构。