硬件硬件错误夯机案例分享_Mysql

硬件硬件错误夯机案例分享

　　最近几次比较郁闷，碰到几起服务器硬件故障或者存储故障，直接导致服务器系统夯住，mysql服务或多或少受到影响，有的影响是mysql服务自动重启，有的影响是整个linux系统重启的，这种硬件错误发生在6的系统居多。通常我们以为mysql服务使用了高可用架构，类似于mmm/mha这种能实现故障转移的架构，服务就能高枕无忧，可是最近发生的实事让我对高可用有了新的认识。

　　案例一：das存储碎文件过多，导致文件系统夯住，mysql服务自动重启。线上一个重要的业务线集群使用了mmm架构，其中master2使用了流式物理备份并二次压缩的方式进行物理备份，本地备份完后会在凌晨将备份文件传输到远端存储，这个das存储以nfs的方式挂载在服务器上，其实存储本身是一个windows的界面，夜里进行传输备份的时候会发生master2的mysql服务自动重启，发生的频率大概是两个月一次，尤其是存储的可用空间不到4t的时候，由于禁用了同步线程自动重启，夜里还需要人工操作并确认各服务正常。最初怀疑是系统的原因，6系统部分内核出现过文件系统夯死，mysql服务假死不能提供应用的现象，后来存储空间不够，更换了存储为gfs，连续观察了几天，从mmm的日志和系统日志都没有再看到错误输出信息（das存储的时候每天会输出一定的mmm错误日志）。解决这类外部因素要保证das存储碎文件或目录不宜过多，或者有条件可以更换质量更好的存储。

　　案例二：服务器内存错误，导致master1服务器文件系统夯住，集群mmm服务的agent与server不能正常通信，故障转移功能无法进行。服务器内存错误导致系统夯住，这种类型的错误导致夯机的危害相比上面案例更大，上面的错误mysql服务可以自动重启后继续提供应用连接，而内存错误会造成mmm/mha这种通过ssh方式进行通信和维护心跳机制的架构，容易出现进程类似sleep的现象，不仅故障无法自动转移，也会出现手动切换失败的可能（文件系统夯住导致mmm命令无法使用，长时间不能出来结果）。解决这类文件办法只能是重启硬件故障的服务器才能释放僵死的进程，mmm命令才能正常使用，临时解决这个期间问题的办法是手动添加应用连接的vip到master2，保证服务受到最小的影响。但是要注意脑裂，服务器恢复正常后，重启mmm的monitor和agent服务前，要删除手动添加的vip并进行一次arping广播。

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

超详细MySQL使用规范分享

最近涉及数据库相关操作较多，公司现有规范也不是太全面，就根据网上各路大神的相关规范，整理了一些自用的规范用法，万望指正。数据库环境dev: 开发环境开发可读写，... [阅读全文]

MySQL 如何查找并删除重复记录的实现

大家好，我是只谈技术不剪发的 tony 老师。由于一些历史原因或者误操作，可能会导致数据表中存在重复的记录；今天我们就来谈谈如何查找 mysql 表中的重复数据... [阅读全文]

MySQL8.0.20压缩版本安装教程图文详解

1、mysql下载地址；http://ftp.ntu.edu.tw/mysql/downloads/mysql-cluster-8.0/2、解压以后放在一个文件... [阅读全文]

MySQL 5.7.27下载安装配置的详细教程

前言在安装mysql的时候会遇到很多问题，博客上有很多解决问题的办法，在这里我附上一些链接，遇到问题的朋友们可以阅读参考哈~本文主要针对于刚接触数据库的小白，来... [阅读全文]

MySQL存储过程及常用函数代码解析

mysql存储过程的概念：存储在数据库当中可以执行特定工作（查询和更新）的一组sql代码的程序段。mysql函数的概念：函数是完成特定功能的sql语句，函数分为... [阅读全文]

使用QPainter画一个3D正方体

本文实例为大家分享了qpainter画一个3d正的具体代码，供大家参考，具体内容如下my3dbox .h#include <eigen/geometry&... [阅读全文]

利用mysql实现的雪花算法案例

一、为何要用雪花算法1、问题产生的背景现如今越来越多的公司都在用分布式、微服务，那么对应的就会针对不同的服务进行数据库拆分，然后当数据量上来的时候也会进行分表，... [阅读全文]

FastDFS及Nginx整合实现代码解析

fastdfs & nginx整合：跟踪器结合nginx，目的是为了负载均衡和高可用，只有一台track可以不配置nginx安装fastdfs-ngin... [阅读全文]

Ubuntu上Vim安装NERDTree插件的详细操作步骤

nerdtree是vim的文件系统浏览器，使用此插件，用户可以直观地浏览复杂的目录层次结构，快速打开文件以进行读取或编辑，以及执行基本的文件系统操作。nerdt... [阅读全文]

MySQL 4种常用的主从复制架构

一主多从复制架构在主库读取请求压力非常大的场景下，可以通过配置一主多从复制架构实现读写分离，把大量的对实时性要求不是特别高的读请求通过负载均衡分部到多个从库上(... [阅读全文]


验证码：

验证码：

硬件硬件错误夯机案例分享

2019年01月07日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论