Redis宕机 快速恢复

1、什么是哨兵

哨兵是对Redis的系统的运行情况的监控,它是一个独立进程,功能有二个:

  • 监控主数据库和从数据库是否运行正常;

  • 主数据出现故障后自动将从数据库转化为主数据库;

2、原理

单个哨兵的架构:

多个哨兵的架构:

多个哨兵,不仅同时监控主从数据库,而且哨兵之间互为监控。

多个哨兵,防止哨兵单点故障。

3、环境

当前处于一主多从的环境中:

4、设置哨兵

启动哨兵进程首先需要创建哨兵配置文件:

vim sentinel.conf

输入内容:

sentinel monitor taotaoMaster 127.0.0.1 6379 1

说明:

  • taotaoMaster:监控主数据的名称,自定义即可,可以使用大小写字母和“.-_”符号

  • 127.0.0.1:监控的主数据库的IP

  • 6379:监控的主数据库的端口

  • 1:最低通过票数

  • (java项目from www.fhadmin.cn)

启动哨兵进程:

redis-sentinel ./sentinel.conf

由上图可以看到:

  • 哨兵已经启动,它的id为9059917216012421e8e89a4aa02f15b75346d2b7

  • 为master数据库添加了一个监控

  • 发现了2个slave(由此可以看出,哨兵无需配置slave,只需要指定master,哨兵会自动发现slave)

5、从宕机及恢复

kill掉2826进程后,30秒后哨兵的控制台输出:

2989:X 05 Jun 20:09:33.509 # +sdown slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

说明已经监控到slave宕机了,那么,如果我们将3380端口的redis实例启动后,会自动加入到主从复制吗?

2989:X 05 Jun 20:13:22.716 * +reboot slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

2989:X 05 Jun 20:13:22.788 # -sdown slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

可以看出,slave从新加入到了主从复制中。-sdown:说明是恢复服务。

6、主宕机及恢复

哨兵控制台打印出如下信息:

2989:X 05 Jun 20:16:50.300 # +sdown master taotaoMaster 127.0.0.1 6379  说明master服务已经宕机

2989:X 05 Jun 20:16:50.300 # +odown master taotaoMaster 127.0.0.1 6379 #quorum 1/1 

2989:X 05 Jun 20:16:50.300 # +new-epoch 1

2989:X 05 Jun 20:16:50.300 # +try-failover master taotaoMaster 127.0.0.1 6379  开始恢复故障

2989:X 05 Jun 20:16:50.304 # +vote-for-leader 9059917216012421e8e89a4aa02f15b75346d2b7 1  投票选举哨兵leader,现在就一个哨兵所以leader就自己

2989:X 05 Jun 20:16:50.304 # +elected-leader master taotaoMaster 127.0.0.1 6379  选中leader

2989:X 05 Jun 20:16:50.304 # +failover-state-select-slave master taotaoMaster 127.0.0.1 6379 选中其中的一个slave当做master

2989:X 05 Jun 20:16:50.357 # +selected-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ taotaoMaster 127.0.0.1 6379  选中6381

2989:X 05 Jun 20:16:50.357 * +failover-state-send-slaveof-noone slave 127.0.0.1:6381 127.0.0.1 6381 @ taotaoMaster 127.0.0.1 6379  发送slaveof no one命令

2989:X 05 Jun 20:16:50.420 * +failover-state-wait-promotion slave 127.0.0.1:6381 127.0.0.1 6381 @ taotaoMaster 127.0.0.1 6379   等待升级master

2989:X 05 Jun 20:16:50.515 # +promoted-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ taotaoMaster 127.0.0.1 6379  升级6381为master

2989:X 05 Jun 20:16:50.515 # +failover-state-reconf-slaves master taotaoMaster 127.0.0.1 6379

2989:X 05 Jun 20:16:50.566 * +slave-reconf-sent slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

2989:X 05 Jun 20:16:51.333 * +slave-reconf-inprog slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

2989:X 05 Jun 20:16:52.382 * +slave-reconf-done slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6379

2989:X 05 Jun 20:16:52.438 # +failover-end master taotaoMaster 127.0.0.1 6379 故障恢复完成

2989:X 05 Jun 20:16:52.438 # +switch-master taotaoMaster 127.0.0.1 6379 127.0.0.1 6381  主数据库从6379转变为6381

2989:X 05 Jun 20:16:52.438 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ taotaoMaster 127.0.0.1 6381  添加6380为6381的从库

2989:X 05 Jun 20:16:52.438 * +slave slave 127.0.0.1:6379 127.0.0.1 6379 @ taotaoMaster 127.0.0.1 6381  添加6379为6381的从库

2989:X 05 Jun 20:17:22.463 # +sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ taotaoMaster 127.0.0.1 6381 发现6379已经宕机,等待6379的恢复

可以看出,目前,6381位master,拥有一个slave为6380.

接下来,我们恢复6379查看状态:

2989:X 05 Jun 20:35:32.172 # -sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ taotaoMaster 127.0.0.1 6381  6379已经恢复服务

2989:X 05 Jun 20:35:42.137 * +convert-to-slave slave 127.0.0.1:6379 127.0.0.1 6379 @ taotaoMaster 127.0.0.1 6381  将6379设置为6381的slave

7、配置多个哨兵

vim sentinel.conf

输入内容:

sentinel monitor taotaoMaster1 127.0.0.1 6381 1

sentinel monitor taotaoMaster2 127.0.0.1 6381 2
(0)

相关推荐

  • Redis集群模式

    Redis集群模式

  • Redis主从复制、哨兵模式、集群

    一.Redis主从复制 1.Redis主从复制的概念 主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器. 前者称为主节点(Master),后者称为从节点(Slave): 数据的 ...

  • Redis理解

    突然看到一篇关于Redis的理解.发现渐渐的随着工作开始成了一个copy工作者.每次发现错误或者需要用的东西就会跑来查询,查询以后就去测试然后应用.慢慢的在不知道的情况中忘记了当时学习的快乐. 此篇只 ...

  • 一不小心肝出了4W字的Redis面试教程

    本文脑图 redis基本数据结构 本文脑图 前言 Redis是基于c语言编写的开源非关系型内存数据库,可以用作数据库.缓存.消息中间件,这么优秀的东西客定要一点一点的吃透它. 这是关于Redis五种数 ...

  • redis学习

    邻近年底,决定辞职,自认为即使没有找到很满意的工作,也应该不会差.事实是有点自信回头,虽然找到了工作,但途中也受到了打击,不得不承认学习的激情不知何时,渐渐熄灭.直到认识一个女生,她让我对未来充满着信 ...

  • dotNetCore操作Redis(含CentOS7哨兵模式部署)

    现在说到使用缓存中间件基本就是 Redis 了,通常开发环境或测试环境部署一个单机版就可以运行了,但要上生产环境还需要进行高可用的方式来部署,本文说说在 CentOS7 中 Redis 高可用的部署以 ...

  • Redis系列之-Redis-Sentinel

    一主从复制高可用 123 #主从复制存在的问题:#1 主从复制,主节点发生故障,需要做故障转移,可以手动转移:让其中一个slave变成master#2 主从复制,只能主写数据,所以写能力和存储能力有限 ...

  • Redis宕机怎么解决?Python入门教程

    学Python找工作的时候,大家肯定都会遇到一些不知道如何回答的问题,比如关于Redis的问题.而且近期也有不少网友咨询小编这类问题,对此特整理了一篇文章,希望能够帮助到你们. Redis宕机怎么解决 ...

  • 面试官:Redis 内存数据满了,会宕机吗?

    背景 Redis 数据库内存数据满了,会宕机吗?答案是:不会让它出现存满的情况,在使用Redis的时候我们要配置Redis能使用的最大的内存大小,存到一定容量的时候还有Redis的内存淘汰策略呢,还有 ...

  • UpTime:供电、系统、网络、制冷——2020年数据中心宕机四大主因

    近日,Uptime Institute发布了2020年度数据中心掉线调查报告.报告结果并不意外,供电.系统.网络.制冷等四大因素依旧是宕机的最常见因素. 根据数据显示,在2020年发生的数据中心故障中 ...

  • 谜题攻略:全世界炉友都在解谜,把服务器搞宕机了!

    此次更新也上线了一张新卡背"凤凰之谜" 这张卡背是之前卡背设计的第二名 不过这张卡背需要解谜获得, 总共四个隐藏彩蛋, 只有四个都做完才能获得此卡背, 目前全球玩家都在解谜这四个隐 ...

  • 孩子学习又宕机?你可能忽略了这件最重要的事

    这段时间,妞妞在学跳绳.我发现她学跳绳的过程是件很有意思的事. 一开始妞妞会把腿缩的特别高,双臂摆动的姿势也不自然,感觉她的大脑在非常吃力的协调全身的动作,跳上十个就把自己累的够呛. 有趣的是,中间有 ...

  • 宕机?踩踏?6万人摇鸽盘下的限价三大怪 | 叶建英

    文丨叶建英 冲6万?登记延迟!杭州买房摇号历史头一次.   这是昨晚刷屏朋友圈的标题.   业内都不敢点开了,每点开一次,就有一个声音在刺激你:   你表姐夫的亲堂弟的远房亲戚都来问你了,你女同学的家 ...

  • 孩子学习又宕机? 你可能忽略了这件最重要的事

    这段时间,妞妞在学跳绳.我发现她学跳绳的过程是件很有意思的事. 一开始妞妞会把腿缩的特别高,双臂摆动的姿势也不自然,感觉她的大脑在非常吃力的协调全身的动作,跳上十个就把自己累的够呛. 有趣的是,中间有 ...

  • 操作系统宕机,MySQL数据找回记录

    一.概述 如果Linux操作系统宕机,启动不了,救援模式(rescue installed system)也行不通的时候,那么该机器上的MySQL数据还能恢复吗?如果能,怎么恢复呢?带着这个问题我们做 ...

  • 产线“宕机”?我看到的是诚意与底气

    IAUTO 速度 深度 态度 导|语 2021/04/09 以长城体系实力为底气,坦克300不仅以技术和产品的差异化,创造价值构建了一个新蓝海,更以"用户共创"的品牌文化,创造了一 ...