1.简介

redis在生产环境中一般是通过集群的方式进行运行，redis集群包括主从复制集群和数据分片集群两种类型。

*主从复制集群提供高可用性，而数据分片集群提供负载均衡。

*数据分片集群中能实现主从复制集群的功能。

2.redis主从复制集群

主从复制集群中由master节点提供读写服务，slave节点负责同步master节点中的数据，当master节点发生故障时，由slave节点充当master对外提供服务。

主从复制集群中可以使用一主一从模式，也可以使用一主多从模式，在一主多从模式中主节点需要将修改同步给各个从节点从而增加了主节点的压力（带宽）

*在主从复制集群中slave节点能够进行读取（不建议），但如果没有开启tcp的no_delay功能，那么读取的数据可能是脏数据，在slave节点进行写入时，会提示slave节点不能进行写入。

关于读写分离

应用对于数据库而言都是读多写少的，即数据库的读取压力要比写入的压力大（即100个请求95个都是读的），由于受数据库自身性能影响，因此一般都会搭建主从数据库，由多个从数据库提供读取服务，分担压力，实现读写分离。

读写分离是相对于有磁盘io操作的数据库而言的，对于基于内存的nosql来说不存在此问题，其读取和写入的性能都很快，每秒能处理几万个请求，因此没有必要进行读写分离，redis中应用主从复制集群是为了保障集群的高可用性，当master节点发生故障时，由slave节点充当master对外提供服务。

主从数据库实现读写分离的根本原因是数据库自身性能低下。

2.1 搭建主从复制集群

直接修改各个节点的redis.conf配置文件

#slave节点同步master节点中的数据
slaveof <master> <port>

#slave节点修改为只读模式
slave-read-only=yes

*当master节点启动后再启动所有的slave节点。

*当主从复制集群搭建后可以通过info replication命令查看集群间的信息。

2.2 主从复制集群中的数据同步

主从复制集群中的数据同步使用psync命令进行完成，psync命令包含全量复制以及部分复制。

1.全量复制：首次加入集群的slave节点会同步master节点中的所有数据。

2.部分复制：再次与master节点建立连接的slave节点同步master节点中的部分数据。

*redis提供了repl-disable-tcp-nodelay命令，表示是否启用tcp的no_delay功能，当该命令为yes时，表示禁用tcp的no_delay功能，那么master节点在同步修改给各个slave节点时会合并小的tcp包从而节省带宽，但此方式会增加同步延时(40ms左右)，当该命令为no时，表示启用tcp的no_delay功能，那么master节点能够实时的同步修改给各个slave节点。

2.3 主从复制集群中的故障转移

当master节点发生故障时，可以通过手动或者自动的方式进行故障转移

手动故障转移

1.将其中一个存活的slave节点断开与master节点的连接，并使其成为新的master节点（slaveof no one）

2.将其他的slave节点与该新的master节点建立连接（slaveof ip port）

3.修改各个节点的redis.conf配置文件，更新主从映射关系，保证下次重启时使用最新的主从关系启动，避免主从数据不一致问题。

自动故障转移（哨兵机制）

redis中提供了sentinel哨兵机制，由多个哨兵组成一个哨兵集群，负责保障redis集群的高可用性，当master节点发生故障时，自动的将其中一个slave节点断开与master节点的连接并使其成为新的master节点，并将其他的slave节点与新的master节点建立连接，最后修改各个节点的redis.conf配置文件，更新主从映射关系。

1.每个哨兵节点每隔10s会向master发送info replication命令，获取当前集群最新的拓扑结构，此时每个哨兵就能获取到各个slave节点的连接信息。

2.每个哨兵每隔1s会向集群中的master和各个slave节点发送心跳，根据心跳来判断节点是否存活，若在一定时间内节点没有回复，那么该哨兵认为该节点已经故障。

3.每个哨兵每隔2s会向redis中的指定频道发布其对master节点的判断，同时每个哨兵会订阅该频道，因此每个哨兵都能知道其他哨兵对master节点的判断。

4.当其中一个哨兵发现master节点故障后，会查看其他哨兵对master节点的判断，若超过指定个数个哨兵都认为该节点故障，那么由该哨兵充当哨兵集群的leader进行故障转移，故障转移的步骤与手动转移的一致，挑选其中一个存活的slave节点断开与master节点的连接，并使其成为新的master节点，然后将其他slave节点与该新的master节点建立联系，最后修改各个节点的redis.conf配置文件，更新主从映射关系，保证当集群重启时以最新的主从映射关系运行，避免发生主从数据不一致的问题。

在redis的源码目录中存在sentinal.conf配置文件，该文件是哨兵的配置文件。

#监听master节点的信息
sentinel monitor <master-name> <ip> <port> <quorum>

*其中quorum表示当哨兵集群中有quorum个哨兵都认为master节点不可用时则哨兵集群认为该节点已经故障.

#心跳超时时间
sentinel down-after-milliseconds <master-name> <milliseconds>

#故障转移超时时间
sentinel failover-timeout <master-name> <milliseconds>

#允许同时有多少个从节点同步新节点的数据
sentinel parallel-syncs <master-name> <numreplicas>

*一个哨兵集群可以同时监控多个redis主从复制集群。

分别启动各个redis节点，然后通过redis-sentinel分别启动各个哨兵，由于每个哨兵都关联同一个master，因此这多个哨兵自动成为集群关系。

*在主从复制集群中，一般都会使用自动故障转移方案（哨兵机制）

3.redis数据分片集群

redis在3.0版本后推出了rediscluster用于搭建数据分片集群。

*其中每个master节点负责指定范围的槽以及槽范围内的数据，并提供读写服务，slave节点只负责同步master节点中的数据，不支持进行读取。

*使用rediscluster时，master节点的个数至少需要三个，每个master可以有任意个slave节点。

*rediscluster使用虚拟槽的方式进行数据分片，redis中虚拟槽的范围为0~16383（共16384个槽），每个master节点负责指定范围的槽以及槽范围内的数据（每个槽与很多key进行关联，这些key都在该master节点的内存中）

*所有key在进行读取和写入操作时，都需要根据h(k) = crc16[k] & 16383散列函数计算出key所坐落的槽，然后找到其对应处理的master节点，最后自动跳转到该节点进行操作。

由于使用了rediscluster，数据将分散到各个节点中，因此有些操作是不允许的

1.涉及多个key的操作，比如mset、sinter等。

2.事务不能跨节点。

3.不支持多数据库，每个master节点只能有一个数据库。

关于数据分片的路由策略

数据分片的路由策略一般有三种，分别是除留余数法、一致性hash、虚拟槽，rediscluster使用虚拟槽的方式实现数据分片。

除留余数法：以元素被某个整数m整除后所得到的余数找对其对应处理的节点（ h(k) = k % m，m等于节点的个数）

*当增加或减少节点时，数据的路由将发生变化，伸缩性很差。

一致性hash：以元素通过某个散列函数h(k)所得到的散列值坐落在hash环上的位置，找到其对应处理的节点。

1.首先将集群中的节点ip通过散列函数h(k)计算出散列值并使其坐落在hash环上，每个节点负责hash环上特定范围的请求。

2.将元素通过相同的散列函数h(k)计算出散列值，以该散列值坐落在hash环上的位置找对其对应的处理节点。

*使用此方式很难保证客户端的请求平均分配到各个节点中，不能很好的实现负载均衡。

虚拟槽：以元素通过某个散列函数h(k)所得到的槽位，找到其对应处理的节点。

1.每个节点负责指定槽范围内的请求。

2.将元素通过散列函数h(k)计算出槽位，找到其对应处理的节点。

3.1 搭建数据分片集群

可以通过手动或者自动的方式搭建数据分片集群。

手动搭建数据分片集群

1.准备配置文件

#开启rediscluster模式
cluster-enabled yes

#rediscluster集群配置文件，存放集群间节点的信息。
cluster-config-file nodes-6379.conf

#节点超时时间(ms)
cluster-node-timeout 15000

2.分别启动各个redis节点

*当启动redis节点后，会生成nodes.conf文件，该文件记录着集群间节点的关系（此时只有本节点信息）

*每个节点都有一个clusterid，且角色默认都是master。

3.握手（使各个节点建立关系）

*连接任意一个节点，然后分别对剩余的节点进行握手。

*当握手成功后，在node.conf文件中能看到集群间完整的节点信息。

4.分配槽

5.主从映射

*分别连接要作为slave的节点，然后通过clusterid与master进行关联。

6.使用集群的模式连接rediscluster

*其中cluster nodes命令能够查看集群间节点的信息，其读取的是node.conf文件中信息，cluster info命令能够查看集群的状态信息。

*当槽分配完成后，此时集群将处于上线状态，当集群中任意一个master节点故障后，如果没有对应的slave节点，那么集群将处于下线状态，当集群处于下线状态时，不能对外提供服务。

*当集群搭建完成后，可以进行关闭以及重启，当重启集群时，会自动读取node.conf文件中的信息恢复集群间的关系，并读取dump.rdb文件进行数据的恢复。

*当需要重新构建集群关系时，需要删除每个节点的node.conf以及rdb文件，否则集群搭建不成功。

*当使用集群的模式连接rediscluster后，当进行读取和写入操作时，会通过h(k)散列函数计算出key所在的槽，然后找到其对应处理的master节点，最后自动跳转到该节点进行操作。

*不管是读取还是写入操作，都会统一跳转到对应处理的master节点，slave-read-only=yes配置只适用于主从复制集群模式。

自动搭建数据分片集群

rediscluster使用ruby来自动搭建数据分片集群。

1.环境准备

需要安装ruby，并且安装redis.gem

2.准备配置文件

#开启rediscluster模式
cluster-enabled yes

#rediscluster集群配置文件，存放集群间节点的信息。
cluster-config-file nodes-6379.conf

#节点超时时间(ms)
cluster-node-timeout 15000

3.分别启动各个redis节点

4.使用redis-trib.rb命令自动完成握手、分配槽、主从映射

redis-trib.rb create --replicas <slavenum> <ip:port..>

*其中slavenum为每个master节点的slave个数，可以为0。

*只能使用ip地址，不能使用主机名。

3.2 数据分片集群中的状态同步

rediscluster是基于gossip协议的ping/pong通讯来保证数据分片集群中的状态一致性。

gossip协议

gossip协议主要用在分布式系统中各个节点的数据同步。

gossip协议由种子节点发起请求（种子节点即状态发生改变的节点），当一个种子节点有状态需要更新到网络中的其他节点时，它会随机选择周围几个节点进行散播消息，收到消息的节点也会重复此过程，直至网络中的所有节点都收到消息，这个过程需要一定的时间，因此gossip是一个最终一致性协议。

gossip协议中提供了三种通讯类型：

1.push类型：a节点将数据发送给b节点，b节点更新a节点比自己新的数据。

2.pull类型：a节点将数据发送给b节点，b节点返回比a节点新的数据，a节点再更新自己。

3.pull/push类型：a节点将数据发送给b节点，b节点返回比a节点新的数据，a节点再更新自己，然后a节点将数据发送给b节点，b节点更新a节点比自己新的数据。

*push类型发送一次请求，目的是让其他节点更新。

*pull类型发送两次请求，目的是更新自身节点的信息。

*每个消息都有一个时间戳，用来区分新老信息。

rediscluster中的ping/pong通讯

ping：发送集群中节点的信息、角色、集群id、时间戳。

pong：响应ping的请求。

*ping请求即gossip协议中的push，目的是让其他节点进行更新。

rediscluster中的每个节点都会定期的向其他节点发送ping请求，用于集群间状态的同步以及检测节点的可用性。

当集群中有新节点加入时（经过meet操作），该节点会向其他节点发送ping请求，同时其他节点也会向其发送ping请求，最终达到数据一致性。

*rediscluster中的节点故障是通过master投票决定的，当有半数的master认为该节点故障时，那么集群认为该节点故障，如果故障的节点是master，那么会将其slave节点切换为master。

*当rediscluster中有一半的master同时失效，那么整个集群将不可用，因为已经没有足够的master进行投票。

4.java中使用redis集群

4.1 使用主从复制集群

*jedis中通过jedissentinelpool实例来使用主从复制集群，连接主从复制集群中所有哨兵的地址，并指定哨兵配置文件中master的名称。

/**
 * @auther: zhuanghaotang
 * @date: 2019/4/2 17:11
 * @description:
 */
public class redisutils {

    private static final string mastername = "mymaster";

    private static jedissentinelpool jedissentinelpool = null;

    static {
        //连接主从复制集群中所有哨兵地址
        set<string> connectionmes = new hashset<>();
        connectionmes.add("192.168.2.90:26379");
        connectionmes.add("192.168.2.91:26379");
        connectionmes.add("192.168.2.92:26379");

        //连接池配置
        jedispoolconfig poolconfig = new jedispoolconfig();
        //最大连接数
        poolconfig.setmaxtotal(10);
        //最大空闲连接数
        poolconfig.setmaxidle(5);
        jedissentinelpool = new jedissentinelpool(mastername, connectionmes, poolconfig);

    }

    public static jedis getconnection() {
        return jedissentinelpool.getresource();
    }

}

4.2 使用数据分片集群

*jedis中通过jediscluster实例使用数据分片集群，连接数据分片集群中所有节点（可以直接创建jediscluster实例，也可以添加连接池进行管理）

/**
 * @auther: zhuanghaotang
 * @date: 2019/4/2 17:11
 * @description:
 */
public class redisutils {

    private static jediscluster jediscluster = null;

    static {
        //连接rediscluster中的所有节点
        set<hostandport> connectionmes = new hashset<>();
        connectionmes.add(new hostandport("192.168.2.90", 6379));
        connectionmes.add(new hostandport("192.168.2.90", 6380));
        connectionmes.add(new hostandport("192.168.2.91", 6379));
        connectionmes.add(new hostandport("192.168.2.91", 6380));
        connectionmes.add(new hostandport("192.168.2.92", 6379));
        connectionmes.add(new hostandport("192.168.2.92", 6380));

        //连接池配置
        jedispoolconfig poolconfig = new jedispoolconfig();
        //最大连接数
        poolconfig.setmaxtotal(10);
        //最大空闲连接数
        poolconfig.setmaxidle(5);
        jediscluster = new jediscluster(connectionmes, poolconfig);

    }

}

*当使用集群的模式连接rediscluster时，当进行读取和写入操作时，会随机连接集群中的一个节点，然后根据h(k)散列函数计算出key所坐落的槽，然后找到该槽所对应处理的master节点，最后自动跳转到该节点中进行操作。