一、redis的高可用管理工具sentinel介绍

sentinel是一个管理redis实例的工具,它可以实现对redis的监控、通知、自动故障转移。sentinel不断的检测redis实例是否可以正常工作,通过API向其他程序报告redis的状态,

如果redis master不能工作,则会自动启动故障转移进程,将其中的一个slave提升(通过选举)为master,其他的slave重新设置新的master服务器。而故障的master再次启动后

会被sentinel自动降级为slave服务器加入到集群中。

redis主从的特点:

1、redis使用异步复制,从服务器会以每秒一次的频率向主服务器报告复制流的处理进度

2、一个主服务器可以有多个从服务器,从服务器也可以有自己的从服务器(级联复制)

3、复制功能不会阻塞主服务器,即使一个或多个从服务器正在进行初次同步,主服务器也可以继续处理命令请求

4、复制功能可以用于数据冗余,也可以通过让多个从服务器处理只读命令请求来提升扩展性

5、Redis从节点默认为只读,无须手动配置

redis的主从集群可以实现分担压力的效果,但是无法做到高可用,如果master宕掉,服务就不可用了,所以使用redis的sentinel可以实现HA的功能:

sentinel作用如下:

1、监控:sentinel会不断的检查你的主服务器和从服务器是否运行正常

2、当被监控的某个redis服务器出现问题时,sentinel可以通过API向管理员或者其他应用程序发送通知

3、自动故障转移:当一个主服务器不能正常工作时,sentinel会开始一次自动故障转移操作,他会将其中一个从服务器升级为新的主服务器,并将其他从服务器改为复制新的主服务器;当客户端试图连接失效的主服务器时,集群也会向客户端返回新主服务器的地址,使得集群可以使用新主服务器代替失效服务器。

redis sentinel在监控redis实例时有两种redis宕机状态S_DOWN和O_DOWN:

S_DOWN:当sentinel在指定的超时时间内没有收到一个正确的ping回复值,则认为是S_DOWN

O_DOWN:O_DOWN的条件是有足够多的sentinel认为该redis实例是S_DOWN。

注意:O_DOWN只能是发生在主服务器,sentinel和其他从服务器不会发生O_DOWN

二、开始安装配置主从高可用

1、环境架构:rhel6 or centos 6  ip:10.48.194.252 (若在不同机器上部署的话,都需要在机器上安装sentinel)

master_port:6379

slave_port:6380

slave_port:6381

sentinel_port:26379

sentinel_port:26479

本人是在一台机器上开多个实例,在不同机器中也可以。原理一样,这里不在复述

架构说明:

a、如果主节点修复后再上线,就会变成从节点。

b、客户端程序连接时,应该连接sentinel节点

2、在三台redis上配置sentinel

先介绍一下sentinel.conf配置文件中常用的参数,如下:

port 26379          
#sentinel的端口
dir 
/tmp          
#工作目录
sentinel monitor mymaster 127.0.0.1 6379 2 
#mymaster是自定义的名称,ip地址是master的ip,6379为master的redis-server端口
#2是quorum,表示sentinel确认一个Master为O_DOWN状态至少需要多少个哨兵同意(此值要小于等于集群中slave的个数)
英文翻译过来是:告诉Sentinel监视这个master,并且只有在至少<quorum> sentinels同意的情况下才考虑它是O_DOWN(客观宕掉)状态。
sentinel down-after-milliseconds mymaster 30000  
#mymaster多久不响应认为SDOWN,单位是毫秒
sentinel parallel-syncs mymaster 1         
#指定最大同时同步新maser配置的slave数量,官方提示用较低的数字,一般为1
数字越小,故障转移过程完成所需的时间就越多,如果全部从服务器一起对新的主服务器进行同步,那么就可能会造成所有从服务器在短时间内全部不可用的情况出现。
sentinel failover-timeout mymaster 180000     
#2次failover切换时间,如果第一次没有failover成功,过多长时间再次failover
注意:无论你设置要多少个Sentinel同意才能判断一个服务器失效,一个Sentinel都需要获得系统中多数(majority)Sentinel的支持,才能发起一次自动故障迁移,
并预留一个给定的配置纪元(configuration Epoch,一个配置纪元就是一个新主服务器配置的版本号)。换句话说,在只有少数(minority)Sentinel 进程正常运作的情况下,
Sentinel 是不能执行自动故障迁移的!

sentinel :port 26379 配置文件如下:

cat sentinel_26379.conf

port 26379

daemonize yes

logfile "/var/log/redis/sentinel_26379.log"

protected-mode no   (这是redis-3.2版本的新特性,改为no即可)

#master-1

sentinel monitor master-1 10.48.194.252 6379 2  (指向master服务器或端口)

sentinel auth-pass master-1 passwd

sentinel parallel-syncs master-1 1

sentinel down-after-milliseconds master-1 5000

sentinel failover-timeout master-1 18000

sentinel :port 26479 配置文件如下:

cat sentinel_26479.conf

port 26479

daemonize yes

logfile "/var/log/redis/sentinel_26479.log"

protected-mode no

#master-1

sentinel monitor master-1 10.48.194.252 6379 2

sentinel auth-pass master-1 passwd

sentinel down-after-milliseconds master-1 5000

sentinel failover-timeout master-1 18000

sentinel parallel-syncs master-1 1

redis_master_6379.conf 配置主要参数如下:

bind 10.48.194.252 127.0.0.1

protected-mode no

port 6379

requirepass passwd

masterauth passwd

redis_slave_6380.conf 配置主要参数如下:

protected-mode no

port 6380

daemonize yes

requirepass "passwd"

masterauth "passwd"

slaveof 10.48.194.252 6379

redis_slave_6381.conf 配置主要参数如下:

protected-mode no

port 6381

daemonize yes

requirepass "passwd"

masterauth "passwd"

slaveof 10.48.194.252 6379

按如下顺序依次启动服务:

redis-server  redis_master_6379.conf

redis-server  redis_slave_6380.conf

redis-server  redis_slave_6381.conf

redis-sentinel sentinel_26379.conf

redis-sentinel sentinel_26479.conf

查看进程是否都已经启动:

ps aux | grep redis | grep -v grep

root       5485  0.0  0.4 135480  9712 ?        Ssl  Nov01   0:51 redis-server *:6380               

root       5491  0.0  0.3 133432  7644 ?        Ssl  Nov01   0:52 redis-server *:6381               

root       6084  0.0  0.3 133432  7668 ?        Ssl  01:25   0:08 redis-sentinel *:26379 [sentinel] 

root       6088  0.0  0.3 133432  7664 ?        Ssl  01:25   0:08 redis-sentinel *:26479 [sentinel] 

root       6376  0.3  0.3 133432  7648 ?        Ssl  04:44   0:00 redis-server 10.48.194.252:6379 

查看master的状态

redis-cli -h 127.0.0.1 -p 6379 -a passwd

查看slave的状态:

redis-cli -h 127.0.0.1 -p 6380 -a passwd

查看sentinel状态:

redis-cli -h 127.0.0.1 -p 26379 -a passwd

验证redis sentinel 主从切换

1、首先关闭 master 服务(6379)

查看哨兵,发现端口号为6380的从服务变成了主服务,sentinel自动完成了故障切换。

再次启动redis-server redis_master_6379.conf

启动刚才被shutdown的6379服务并查看,发现它变成了从服务

80又变成了主

若想手动把从边成主,需要在6379里的配置文件中把slaveof 指向 6380的删除