当前位置：移动技术网 > IT编程>数据库>MongoDB > Redis Sentinel(哨兵模式)

Redis Sentinel(哨兵模式)

2019年05月24日 | 移动技术网IT编程 | 我要评论

主从复制的问题

当master节点发生故障时，需要手动进行故障转移
写能力与存储能力受限，写能力和存储能力都依赖于master节点

redis sentinel架构

在主从复制的基础上，新增多个redis sentinel节点，这些sentinel不存储任何的数据。这些sentinel节点会完成redis的故障判断并故障转移的处理，然后通知客户端。一套redis sentinel集群可以监控多套redis主从，每一套redis主从通过master-name作为标识。

客户端不直接连接redis服务，而连接redis sentinel。在redis sentinel中清楚哪个节点是master节点。

故障转移流程

多个sentinel发现并确认master有问题
选举出一个sentinel作为领导
选出一个slave作为master
通知其余slave成为新的master的slave
通知客户端主从发生的变化
等待老的master复活成为新master的slave

redis sentinel的相关配置

配置	含义
port ${port}	sentinel的端口号
dir "/redisdatapath"	redis的工作目录
logfile "${port}.log"	redis的日志文件
sentinel monitor mymaster 127.0.0.1 7000 2	名称为mymaster的主从 masterip=127.0.0.1 masterport=7000 2个sentinel发现这个master有问题后执行故障转移
sentinel down-after-milliseconds mymaster 30000	每个sentinel在连续ping 30000ms不通后认为有问题
sentinel parallel-syncs mymaster 1	在故障转移时，该名称为mymaster的集群中同一时间点只允许1个节点进行复制
sentinel failover-timeout mymaster 180000	故障转移的超时时间

redis sentinel的安装与配置

1.配置开启主从节点

redis-7000.conf

port 7000
daemonize yes
pidfile /var/run/redis-7000.pid
logfile "7000.log"
dir /redisdatapath

redis-7001.conf

port 7001
daemonize yes
pidfile /var/run/redis-7001.pid
logfile "7001.log"
dir /redisdatapath
slaveof 127.0.0.1  7000

redis-7002.conf

port 7002
daemonize yes
pidfile /var/run/redis-7002.pid
logfile "7002.log"
dir /redisdatapath
slaveof 127.0.0.1 7000

2.配置开启sentinel监控主节点（sentinel是特殊的redis）

redis-26379.conf（redis sentinel的默认端口是26379）

port 26379
daemonize yes
dir "/redisdatapath"
logfile "26379.log"
sentinel monitor mymaster 127.0.0.1 7000 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

redis-26380.conf

port 26380
daemonize yes
dir "/redisdatapath"
logfile "26380.log"
sentinel monitor mymaster 127.0.0.1 7000 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

redis-26381.conf

port 26381
daemonize yes
dir "/redisdatapath"
logfile "26381.log"
sentinel monitor mymaster 127.0.0.1 7000 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

客户端接入基本原理

客户端需要所有的sentinel节点以及对应的mastername
客户端会遍历所有的sentinel节点，获取一个可用的sentinel节点
向可用的sentinel调用 sentinel get-master-addr-by-name mastername，可用的sentinel将返回master节点信息。
客户端连接该master节点，调用role或者role replication，确认该节点是master节点。
如果master发生故障转移，sentinel是能够感知，并通过发布订阅模型将最新的master信息告知客户端

set<string> sentinelset = new hashset<string>() {{
    add("127.0.0.1:26379");
    add("127.0.0.1:26380");
    add("127.0.0.1:26381");
}};
jedispoolconfig poolconfig = new jedispoolconfig();
string mastername = "mymaster";
int timeout = 30_000;   //jedis连接sentinel的超时时间
jedissentinelpool sentinelpool = new jedissentinelpool(
                mastername , sentinelset , poolconfig , timeout);
jedis jedis = sentinelpool.getresource();
jedis.close();

三个定时任务

每10秒每个sentinel对master和slave执行info
- 发现slave节点
- 确认主从关系

每2秒每个sentinel通过mster节点的channel交换信息（pub/sub)
- 通过__sentinel__:hello频道交互
- 交互对节点的“看法”和自身信息

每1秒每个sentinel对其他sentinel和redis执行ping

主观下线与客观下线

主观下线：每个sentinel节点对redis节点失败的看法。
- sentinel down-after-milliseconds mastername timeout
- 每个sentinel节点每秒会对redis节点进行ping，当连续timeout毫秒之后还没有得到pong，则sentinel认为redis下线。
客观下线：所有sentinel节点对redis节点失败达成共识。

sentinel monitor mastername ip port quorum
大于等于quorum个sentinel主观认为redis节点失败下线
通过sentinel is-master-down-by-addr提出自己认为redis master下线

领导者选举

原因：只有sentinel节点完成故障转移
选举：通过 sentinel is-master-down-by-addr 命令都希望成为领导者
- 每个主观下线的sentinel节点向其他sentinel节点发送命令，要求将它设置为领导者
- 收到命令的sentinel节点如果没有同意其他sentinel节点发送的命令，那么将同意该请求，否则拒绝。
- 如果该sentinel节点发现自己的票数已经超过sentinel集合半数且超过quorum，那么将它成为领导者
- 如果此过程有多个sentinel节点成为了领导者，那么将等待一段时间重新进行选举

故障转移（sentinel领导者节点完成之后）

从slave节点中选出一个“合适的”节点作为新的master节点
- 选择slave-priority(slave节点优先级)最高的slave节点，如果存在则返回，不存在则继续
- 选择复制偏移量最大的slave节点（复制的最完整性），如果存在则返回，不存在则继续
- 选择runid最小的slave节点
对上面的slave节点执行slave no one命令让其成为master节点
向其余的slave节点发送命令，让它们成为新master节点的slave节点，复制规则和parallel-syncs参数有关。
更新对原来master节点配置为slave，并保持对其“关注”，当其恢复后命令它去复制新的master节点

节点运维（上线与下线）

生产节点下线可能原因

机器下线：过保等情况
机器性能不足：例如cpu、内存、磁盘、网络等

1.主节点

##节点下线
##手动进行故障转移
sentinel failover ${mastername}
##跳过主观下线、客观下线与领导者选举，领导者即为当前连接的sentinel节点

##节点上线
config set slave-priority num  #调大新增节点的优先级
sentinel failover ${mastername}

2.从节点

需要区分是临时下线还是永久下线。例如需要做一些配置、aof、rdb等方面的清理工作。

当上线时候，执行slaveof masterip masterport即可

3.sentinel节点

需要区分是临时下线还是永久下线。例如需要做一些配置的清理工作。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

MongoDB常用数据库命令大全

一、mongodb 数据库常用操作命令1、help查看命令提示helpdb.help();db.yourcoll.help();2、切换/创建数据库use ra... [阅读全文]
28个MongoDB经典面试题详解

mongodb是目前最好的面向文档的免费开源nosql数据库。如果你正准备参加mongodb nosql数据库的技术面试，你最好看看下面的mongodb nos... [阅读全文]
MongoDB 数据库的命名、设计规范详解

mongodb 数据库的命名和设计也有一套规范。只不过，由于用的人不多，目前在业界还没有形成权威的共识，今天根据我个人平时的一些经验，总结了一些规范第一部分，我... [阅读全文]
MongoDB中数据的替换方法实现类Replace()函数功能详解

近日接到一个开发需求，因业务调整，需要dba协助，将mongodb数据库中某集合的进行替换。例如我们需要将集合a中b字段中，有关《美好》的字符替换为《非常美好... [阅读全文]
解决MongoDB占用内存过大频繁死机的方法详解

从mongodb 3.4开始，默认的wiredtiger内部缓存大小是以下两者中的较大者：50％（ram-1 gb），或 256 mb例如，在总共有4gb ra... [阅读全文]
在 Fedora 上安装 MongoDB 服务器的方法教程

mongo（来自 “humongous” —— 巨大的）是一个高性能、开源、无模式的、面向文档的数据库，它是最受欢迎的 nosql 数据库之一。它使用 json... [阅读全文]
mongodb driver使用代码详解

mongodb 是一个基于分布式文件存储的数据库。由 c++ 语言编写。旨在为 web 应用提供可扩展的高性能数据存储解决方案。mongodb 是一个介于关系数... [阅读全文]
MongoDB操作符中的$elemMatch问题

问题如果mongodb 数据库集合中仅存在一条记录{ "_id" : objectid("5e6b4ef546b5f44e5c5b276d"), "name... [阅读全文]
Redis 字符串 SDS

SDS 简单动态字符串。 SDS的结构： struct sdshdr{ int len;//记录BUF数组中已使用字节的数量，等于SDS所八寸字符串的... [阅读全文]
理解Redis持久化，RDB持久化和AOF持久化的不同处理方式

理解和掌握Redis的持久机制，对于Redis的日常开发和运维都有很大帮助，也是在大厂面试经常被问到的知识点。 ... [阅读全文]

网友评论


验证码：