Redis

4-1 Redis简介 4-2 Redis常用数据类型 4-3 从海量数据里查询某一固定前缀的key 4-4 如何实现分布式锁 4-5 如何实现异步队列 4-6 持久化方式之RDB 4-7 持久化方式之AOF以及混合模式 4-8 Pipeline及主从同步 4-9 Redis集群

4-1 Redis简介

  • 主流应用架构
    主流应用架构
  • 缓存中间件——Memcache 和 Redis 的区别
    • Memcache:代码层类似Hash
      • 支持简单数据类型
      • 不支持数据持久化存储
      • 不支持主从
      • 不支持分片(Sharding)
    • Redis
      • 数据类型丰富
      • 支持数据瓷盘持久化存储
      • 支持主从
      • 支持分片
  • 为什么 Redis 能这么快(100000+QPS(QPS即 query per second,每秒查询次数))
    • 完全基于内存,绝大部分请求是纯粹的内存操作 ,执行效率高
    • 数据结构简单,对数据操作也简单
    • 采用单线程,单线程也能处理高并发请求,想多核也可以启动多实例
    • 使用多路 I/O 复用模型,非阻塞 IO
  • 多路 I/O 复用模型——Redis 采用的 I/O 多路复用函数:epoll/kqueue/evport/select
    • 因地制宜
    • 优先选择时间复杂度为 O(1) 的 I/O 多路复用函数作为底层实现
    • 以时间复杂度为 O(n) 的 select 作为保底
    • 基于 react 设计模式监听 I/O 事件

4-2 Redis常用数据类型

  • String:最基本的数据类型,二进制安全
    /**
     * 保存字符串对象的结构
     */
    struct sdshdr {
        //buf 中已占用的空间长度
        int len;
        //buf 中剩余可用的空间长度
        int free;
        //数据空间
        char bur[];
    };
    
  • Hash:String 元素组成的字典,适用于存储对象
  • List:列表,按照 String 元素插入顺序排序
  • Set:String 元素组成的无序集合,通过哈希表实现,不允许重复
  • Sorted Set:通过分数来为集合中的成员进行从小到大的排序
  • 用于计数的 HyperLogLog,用于支持存储地理位置信息的 Geo

4-3 从海量数据里查询某一固定前缀的key

  • 【细节】摸清数据规模,即问清楚边界
  • KEYS pattern:查找所有符合给定模式 pattern 的 key
    • KEYS 指令一次性返回所有匹配的 key
    • 键的数据过大会使服务卡顿
  • SCAN cursor [MATCH pattern][COUNT count]
    SCAN cursor MATCH pattern
    • 基于游标的迭代器,需要基于上一次的游标延续之前的迭代过程
    • 以0作为游标开始一次新的迭代,直到命令返回游标0完成一次遍历
    • 不保证每次执行都返回某个给定数量的元素,支持模糊查询
    • 一次返回的数量不可控,只能是大概率符合 count 参数

4-4 如何实现分布式锁

  • 分布式锁需要解决的问题
    • 互斥性
    • 安全性
    • 死锁
    • 容错
  • SETNX key value:如果 key 不存在,则创建并赋值
    • 时间复杂度:O(1)
    • 返回值:设置成功,返回1;设置失败,返回0。
  • 如何解决SETNX长期有效的问题
    • 设置 key 的生存时间,当 key 过期时(生存时间为0),会被自动删除(EXPIRE key seconds)
  • SET key value [EX seconds][PX milliseconds][NX|XX]
    • EX seconds:设置键的过期时间为 second 秒
    • PX milliseconds:设置键的过期时间为 millisecond 毫秒
    • NX:只在键不存在时,才对键进行设置操作
    • XX;只在键已经存在时,才对键进行设置操作
    • SET 操作成功完成时,返回 OK,否则返回 nil
  • 大量 key 集中过期,由于清除大量 key 很耗时,会出现短暂的卡顿现象
    • 解决方案:在设置 key 的过期时间的时候,给每个 key 加上随机值

4-5 如何实现异步队列

  • 使用 List 作为队列,RPUSH 生产消息,LPOP 消费消息
    • 缺点:没有等待队列里有值就直接消费
    • 弥补:可以通过在应用层引入 Sleep 机制去调用 LPOP 重试
  • BLPOP key [key...] timeout:阻塞直到队列有消息或者超时
    • 缺点:只能供一个消费者消费
  • pub/sub:主题订阅者模式
    • 发送者(pub)发送消息,订阅者(sub)接收消息
    • 订阅者可以订阅任意数量的频道
    • 缺点:消息的发布时无状态的,无法保证可达

4-6 持久化方式之RDB

  • RDB持久化-保存某个时间点的全量数据快照
    • 手动触发
      • SAVE:阻塞 Redis 的服务器进程,直到 RDB 文件被创建完毕
      • BGSAVE:Fork 出一个子进程来创建 RDB 文件,不阻塞服务器进程
    • 自动化触发
      • 根据 redis.conf 配置里的 SAVE m n 定时触发(用的是 BGSAVE)
      • 主存复制时,主节点自动触发
      • 执行 Debug Reload
      • 执行 Shutdown 且没有开启 AOF 持久化
  • 缺点
    • 内存数据的全量同步,数据量打会由于 I/O 严重影响性能
    • 可能会因为 Redis 挂掉而丢失从当前至最近一次快照期间的数据

4-7 持久化方式之AOF以及混合模式

  • AOF(Append-Only-File) 持久化:保存写状态
    • 记录下除了查询以外的所有变更数据库状态的指令
    • 以 append 的形式追加保存到 AOF 文件中(增量)
  • 日志重写解决 AOF 文件大小不断增大的问题,原理如下:
    • 调用 fork(),创建一个子进程
    • 子进程把新的 AOF 写到一个临时文件里,不依赖原来的 AOF 文件
    • 主进程持续将新的变动同时写到内存和原来的 AOF 里
    • 主进程获取子进程重写 AOF 的完成信号,往新 AOF 同步增量变动
    • 使用新的 AOF 文件替换掉旧的 AOF 文件
  • Redis在 RDB 和 AOF 文件共存的情况下的恢复流程
    Reids 在 RDB 和 AOF 文件共存的情况下的恢复流程
  • RDB 和 AOF 的优缺点
    • RDB
      • 优点:全量数据快照,文件小,恢复快
      • 缺点:无法保存最近一次快照之后的数据
    • AOF
      • 优点:可读性高,适合保存增量数据,数据不易丢失
      • 缺点:文件体积大,恢复时间长
  • RDB-AOF 混合持久化方式
    • BGSAVE 做镜像全量持久化,AOF 做增量持久化

4-8 Pipeline及主从同步

  • 使用 Pipeline 的好处
    Pipeline 类似于 Linux 的管道类似

    • Redis 基于请求/响应模型,单个请求处理需要一一应答
    • Pipeline 批量执行指令,节省多次 I/O 往返的时间
    • 有顺序依赖的指令建议分批发送
  • Redis 的同步机制

    • 主从同步:一般集群都是一个主多个从,主负责写,从负责读。开始主节点会启动命令开始全量同步,然后会启动增量同步。

      • 全同步过程:
        • Slave发送sync命令到Master
        • Master启动一个后台进程,将Redis中的数据快照保存到文件中(bgsave)
        • Master将保存的数据快照期间接收到的写命令也缓存起来(增量数据缓存)
        • Master完成写操作之后,将该文件发送给Slave
        • 使用新的AOF文件替换掉旧的AOF文件,然后写入内存中,恢复数据快照
        • Master将这期间收集的增量写命令也发送给Slave,Slave完成同步
      • 增量同步过程:
        • Master接收到用户的操作指令,判断是否需要传播到Slave
        • 将操作记录追加到AOF文件
        • 将该操作传播到其他Slave ,对齐住从库,往响应的缓存写入指令
        • 将缓存中的数据发送给Slave
        • 主从的弊端就是主服务器挂掉之后就不能进行写操作了,所以就有了sentinel 哨兵
    • Redis Sentinel:解决主从同步Master宕机后的主从切换问题:

      • 监控:检查主从服务器是否运行正常
      • 提醒:通过API向管理员或者其他应用程序发送故障通知
      • 自动故障迁移:主从切换
  • 流言协议Gossip,在杂乱无章中寻求一致(区块链中有用到):

    • 每个节点都随机地与对方通信,最终所有节点的状态达成一致
    • 种子节点定期随机向其他节点发送节点列表以及传播的消息
    • 不保证信息一定会传播给所有节点,但是最终会趋于一致

4-9 Redis集群

  • 如何从海量数据里快速找到所需?
    • 分片:按照某种规则去划分数据,分散存储在多个节点上
    • 常规的按照哈西划分无法实现节点的动态增减
Comment