当前位置：移动技术网 > IT编程>数据库>Mysql > MySQL最佳实践之分区表基本类型

MySQL最佳实践之分区表基本类型

2020年06月14日 | 移动技术网IT编程 | 我要评论

ca1150,现在金子多少钱一克,碧绿色房间

mysql分区表概述

随着mysql越来越流行，mysql里面的保存的数据也越来越大。在日常的工作中，我们经常遇到一张表里面保存了上亿甚至过十亿的记录。这些表里面保存了大量的历史记录。对于这些历史数据的清理是一个非常头疼事情，由于所有的数据都一个普通的表里。所以只能是启用一个或多个带where条件的delete语句去删除（一般where条件是时间）。这对数据库的造成了很大压力。即使我们把这些删除了，但底层的数据文件并没有变小。面对这类问题，最有效的方法就是在使用分区表。最常见的分区方法就是按照时间进行分区。分区一个最大的优点就是可以非常高效的进行历史数据的清理。

分区类型

目前mysql支持范围分区（range），列表分区（list），哈希分区（hash）以及key分区四种。下面我们逐一介绍每种分区：

range分区

基于属于一个给定连续区间的列值，把多行分配给分区。最常见的是基于时间字段. 基于分区的列最好是整型，如果日期型的可以使用函数转换为整型。本例中使用to_days函数

create table my_range_datetime(
 id int,
 hiredate datetime
) 
partition by range (to_days(hiredate) ) (
 partition p1 values less than ( to_days('20171202') ),
 partition p2 values less than ( to_days('20171203') ),
 partition p3 values less than ( to_days('20171204') ),
 partition p4 values less than ( to_days('20171205') ),
 partition p5 values less than ( to_days('20171206') ),
 partition p6 values less than ( to_days('20171207') ),
 partition p7 values less than ( to_days('20171208') ),
 partition p8 values less than ( to_days('20171209') ),
 partition p9 values less than ( to_days('20171210') ),
 partition p10 values less than ( to_days('20171211') )，
 partition p11 values less than (maxvalue) 
);

p11是一个默认分区，所有大于20171211的记录都会在这个分区。maxvalue是一个无穷大的值。p11是一个可选分区。如果在定义表的没有指定的这个分区，当我们插入大于20171211的数据的时候，会收到一个错误。

我们在执行查询的时候，必须带上分区字段。这样可以使用分区剪裁功能

mysql> insert into my_range_datetime select * from test;                                  
query ok, 1000000 rows affected (8.15 sec)
records: 1000000 duplicates: 0 warnings: 0

mysql> explain partitions select * from my_range_datetime where hiredate >= '20171207124503' and hiredate<='20171210111230'; 
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
| id | select_type | table       | partitions  | type | possible_keys | key | key_len | ref | rows  | extra    |
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
| 1 | simple   | my_range_datetime | p7,p8,p9,p10 | all | null     | null | null  | null | 400061 | using where |
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
1 row in set (0.03 sec)

注意执行计划中的partitions的内容，只查询了p7，p8，p9，p10三个分区，由此来看，使用to_days函数确实可以实现分区裁剪。

上面是基于datetime的，如果是timestamp类型，我们遇到上面问题呢？

事实上，mysql提供了一种基于unix_timestamp函数的range分区方案，而且，只能使用unix_timestamp函数，如果使用其它函数，譬如to_days，会报如下错误：“error 1486 (hy000): constant, random or timezone-dependent expressions in (sub)partitioning function are not allowed”。

而且官方文档中也提到“any other expressions involving timestamp values are not permitted. (see bug #42849.)”。

下面来测试一下基于unix_timestamp函数的range分区方案，看其能否实现分区裁剪。

针对timestamp的分区方案

创表语句如下：

create table my_range_timestamp (
  id int,
  hiredate timestamp
)
partition by range ( unix_timestamp(hiredate) ) (
  partition p1 values less than ( unix_timestamp('2017-12-02 00:00:00') ),
  partition p2 values less than ( unix_timestamp('2017-12-03 00:00:00') ),
  partition p3 values less than ( unix_timestamp('2017-12-04 00:00:00') ),
  partition p4 values less than ( unix_timestamp('2017-12-05 00:00:00') ),
  partition p5 values less than ( unix_timestamp('2017-12-06 00:00:00') ),
  partition p6 values less than ( unix_timestamp('2017-12-07 00:00:00') ),
  partition p7 values less than ( unix_timestamp('2017-12-08 00:00:00') ),
  partition p8 values less than ( unix_timestamp('2017-12-09 00:00:00') ),
  partition p9 values less than ( unix_timestamp('2017-12-10 00:00:00') ),
  partition p10 values less than (unix_timestamp('2017-12-11 00:00:00') )
);

插入数据并查看上述查询的执行计划

mysql> insert into my_range_timestamp select * from test;
query ok, 1000000 rows affected (13.25 sec)
records: 1000000 duplicates: 0 warnings: 0

mysql> explain partitions select * from my_range_timestamp where hiredate >= '20171207124503' and hiredate<='20171210111230';
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
| id | select_type | table       | partitions  | type | possible_keys | key | key_len | ref | rows  | extra    |
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
| 1 | simple   | my_range_timestamp | p7,p8,p9,p10 | all | null     | null | null  | null | 400448 | using where |
+----+-------------+-------------------+--------------+------+---------------+------+---------+------+--------+-------------+
1 row in set (0.00 sec)

同样也能实现分区裁剪。

在5.7版本之前，对于data和datetime类型的列，如果要实现分区裁剪，只能使用year() 和to_days()函数，在5.7版本中，又新增了to_seconds()函数。

list 分区

list分区

list分区和range分区类似，区别在于list是枚举值列表的集合，range是连续的区间值的集合。二者在语法方面非常的相似。同样建议list分区列是非null列，否则插入null值如果枚举列表里面不存在null值会插入失败，这点和其它的分区不一样，range分区会将其作为最小分区值存储，hash\key分为会将其转换成0存储，主要list分区只支持整形，非整形字段需要通过函数转换成整形.

create table t_list( 
　　a int(11), 
　　b int(11) 
　　)(partition by list (b) 
　　partition p0 values in (1,3,5,7,9), 
　　partition p1 values in (2,4,6,8,0) 
　　);

hash 分区

我们在实际工作中经常遇到像会员表的这种表。并没有明显可以分区的特征字段。但表数据有非常庞大。为了把这类的数据进行分区打散mysql 提供了hash分区。基于给定的分区个数，将数据分配到不同的分区，hash分区只能针对整数进行hash，对于非整形的字段只能通过表达式将其转换成整数。表达式可以是mysql中任意有效的函数或者表达式，对于非整形的hash往表插入数据的过程中会多一步表达式的计算操作，所以不建议使用复杂的表达式这样会影响性能。

hash分区表的基本语句如下：

create table my_member (
  id int not null,
  fname varchar(30),
  lname varchar(30),
  created date not null default '1970-01-01',
  separated date not null default '9999-12-31',
  job_code int,
  store_id int
)
partition by hash(id)
partitions 4;

注意：

hash分区可以不用指定partitions子句，如上文中的partitions 4，则默认分区数为1。
不允许只写partitions，而不指定分区数。
同range分区和list分区一样，partition by hash (expr)子句中的expr返回的必须是整数值。
hash分区的底层实现其实是基于mod函数。譬如，对于下表

create table t1 (col1 int, col2 char(5), col3 date) partition by hash( year(col3) ) partitions 4; 如果你要插入一个col3为“2017-09-15”的记录，则分区的选择是根据以下值决定的：

mod(year(‘2017-09-01'),4) = mod(2017,4) = 1

linear hash分区

linear hash分区是hash分区的一种特殊类型，与hash分区是基于mod函数不同的是，它基于的是另外一种算法。

格式如下：

create table my_members (
  id int not null,
  fname varchar(30),
  lname varchar(30),
  hired date not null default '1970-01-01',
  separated date not null default '9999-12-31',
  job_code int,
  store_id int
)
partition by linear hash( id )
partitions 4;

说明：它的优点是在数据量大的场景，譬如tb级，增加、删除、合并和拆分分区会更快，缺点是，相对于hash分区，它数据分布不均匀的概率更大。

key分区

key分区其实跟hash分区差不多，不同点如下：

key分区允许多列，而hash分区只允许一列。
如果在有主键或者唯一键的情况下，key中分区列可不指定，默认为主键或者唯一键，如果没有，则必须显性指定列。
key分区对象必须为列，而不能是基于列的表达式。
key分区和hash分区的算法不一样，partition by hash (expr)，mod取值的对象是expr返回的值，而partition by key (column_list)，基于的是列的md5值。

格式如下：

create table k1 (
  id int not null primary key,  
  name varchar(20)
)
partition by key()
partitions 2;

在没有主键或者唯一键的情况下，格式如下：

create table tm1 (
  s1 char(32)
)
partition by key(s1)
partitions 10;

总结：

mysql分区中如果存在主键或唯一键，则分区列必须包含在其中。

对于原生的range分区，list分区，hash分区，分区对象返回的只能是整数值。

分区字段不能为null，要不然怎么确定分区范围呢，所以尽量not null

到此这篇关于mysql最佳实践之分区表基本类型的文章就介绍到这了,更多相关mysql分区表基本类型内容请搜索移动技术网以前的文章或继续浏览下面的相关文章希望大家以后多多支持移动技术网！

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

mysql 触发器语法与应用示例

本文实例讲述了mysql 触发器语法与应用。分享给大家供大家参考，具体如下：例子：创建触发器，记录表的增、删、改操作记录//创建user表；drop table... [阅读全文]
MySQL触发器基本用法详解【创建、查看、删除等】

本文实例讲述了mysql触发器基本用法。分享给大家供大家参考，具体如下：一、mysql触发器创建：１、mysql触发器的创建语法：create　[definer... [阅读全文]
mysql 触发器创建与使用方法示例

本文实例讲述了mysql 触发器创建与使用方法。分享给大家供大家参考，具体如下：什么是触发器触发器用来在某些操作之后/之前，“自动”执行一些操作。（比如插入... [阅读全文]
MySQL日期加减函数详解

1. addtime()　　为日期加上指定秒数select addtime(now(),1); -- 加1秒2. adddate()　　有两种用法，第二个参数直... [阅读全文]
mysql累加计算实现方法详解

本文实例讲述了mysql累加计算。分享给大家供大家参考，具体如下：前言接了一个需求，产品想分析一下用户增长的曲线。也就是某个时间段的每日总人数列表。好对近期活动... [阅读全文]
MySQL 多表关联一对多查询实现取最新一条数据的方法示例

本文实例讲述了mysql 多表关联一对多查询实现取最新一条数据的方法。分享给大家供大家参考，具体如下：mysql 多表关联一对多查询取最新的一条数据遇到的问题多... [阅读全文]
MySQL分区表的最佳实践指南

前言：分区是一种表的设计模式，通俗地讲表分区是将一大表，根据条件分割成若干个小表。但是对于应用程序来讲，分区的表和没有分区的表是一样的。换句话来讲，分区对于应用... [阅读全文]
MySQL最佳实践之分区表基本类型

mysql分区表概述随着mysql越来越流行，mysql里面的保存的数据也越来越大。在日常的工作中，我们经常遇到一张表里面保存了上亿甚至过十亿的记录。这些表里面... [阅读全文]
MySQL自动停机的问题处理实战记录

最近帮别人做的一个项目机器上面跑mysql老是隔一段时间就自动停了。刚开始以为是以外停止，也没注意，就手动再启动。可是过了没两天又停止了。后来仔细查了查mysq... [阅读全文]
MySQL5.6.40在CentOS7 64下安装过程详解

mysql5.6.40在centos7 64下安装过程1）卸载之前安装的mysqlrm -rf /usr/local/mysqlrm -rf /etc/init... [阅读全文]

网友评论


验证码：

MySQL最佳实践之分区表基本类型

2020年06月14日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论