当前位置：移动技术网 > IT编程>数据库>MSSQL > （3）SQL Server表分区

（3）SQL Server表分区

2020年04月08日 | 移动技术网IT编程 | 我要评论

养黄粉虫,裴新华老公,严锦文

1.简介

当一个表数据量很大时候，很自然我们就会想到将表拆分成很多小表，在执行查询时候就到各个小表去查，最后汇总数据集返回给调用者加快查询速度。比如电商平台订单表，库存表，由于长年累月读写较多，积累数据都是异常庞大的，这时候，我们可以想到表分区这个做法，降低运维和维护成本，提高读写性能。比如将前半年订单放一个历史分区表，不活跃库存放一个历史分区表。截止到sql server 2016，一张表或一个索引最多可以有15000个分区。

2.表分区

2.1分区范围

分区范围是指在要分区的表中，根据业务选择表中的关键字段做为分区边界条件，分区后，数据所在的具体位置至关重要，这样才能在需要时只访问相应的分区。注意分区是指数据的逻辑分离，不是数据在磁盘上的物理位置，数据的位置由文件组来决定，所以一般建议一个分区对应一个文件组。

2.2分区键

分区表中的字段可以作为分区键，比如库存表中供应商id。对表和索引进行分区的第一步就是定义分区的关键数据。

2.3索引分区

除了对表的数据集进行分区之外，还可以对索引进行分区，使用相同的函数对表及其索引进行分区通常可以优化性能。

3.创建表分区

3.1创建文件组

在这里演示示例当中，我根据业务场景在testdb数据库新增三个文件组，而三个文件组分别对应三个分区。而多个文件组好处是可以按照不同业务场景将数据放在对应文件组当中，优化性能同时好维护数据。文件组数量由硬件决定，最好是一个文件组对应一个分区，好维护。而通常文件组都处于不同磁盘上的，但是由于是演示，我只在一个磁盘中存放。

--创建四个文件组
alter database [testdb] add filegroup supidgroup1
alter database [testdb] add filegroup supidgroup2
alter database [testdb] add filegroup supidgroup3

3.2指定文件组存放路径

在创建文件组之后，指定文件组存放磁盘位置，文件大小。

--创建四个ndf文件，对应到各文件组中，filename文件存储路径
alter database [testdb] add file(
name='supidgroupfile1',
filename='d:\microsoft sql server\mssql11.mssqlserver\mssql\data\supidgroupfile1.ndf',
size=10mb,
filegrowth=10mb)
to filegroup supidgroup1

alter database [testdb] add file(
name='supidgroupfile2',
filename='d:\microsoft sql server\mssql11.mssqlserver\mssql\data\supidgroupfile2.ndf',
size=10mb,
filegrowth=10mb)
to filegroup supidgroup2

alter database [testdb] add file(
name='supidgroupfile3',
filename='d:\microsoft sql server\mssql11.mssqlserver\mssql\data\supidgroupfile3.ndf',
size=10mb,
filegrowth=10mb)
to filegroup supidgroup3

注（附上删除文件组t-sql）：

alter database [testdb] remove file supidgroupfile3

可以通过以下t-sql语句查看文件组存放相关信息：

select file_id,type,type_desc,data_space_id,name,physical_name,state_desc,size,growth
from sys.database_files

3.3创建分区函数

如何创建表分区边界值，我们肯定要根据业务场景来决定。比如我测试库库存表有36万左右数据，而有些供应商的库存数据远远比其他供应商大，那么我可以考虑使用供应商id字段作为边界值分区。例如：根据t-sql统计，18080供应商库存数据最大，那么我可以根据18080供应商上下分为三个区。

第一个分区范围记录：供应商id小于等于13570的39097条库存数据。

第二个分区范围记录：供应商id大于13570和小于等于18079的45962条库存数据。

第三个分区范围记录：供应商id大于18079小于等于18080的164937条库存数据。

第四个分区范围记录：供应商id大于18080的111116条库存数据。

根据上述分区范围记录，我们可以将供应商id作为边界值设置，执行以下t-sql语句设置边界值：

--设置边界值
create partition function pf_supplierid(int)
as range left for values (13570,18079,18080)

执行完毕后如图所示：

3.4创建分区方案

执行以下t-sql语句创建分区方案：

--创建分区方案
create partition scheme ps_supplierid
as partition pf_supplierid to ([primary], [supidgroup1],[supidgroup2],[supidgroup3])

执行完毕后如图所示：

3.5创建分区表

上面那些分区步骤都是为了接下来创建分区表这一步骤而准备的。废话不多说，现在我们来看看如何创建分区表。右键需要分区的表->储存->创建分区，具体步骤如下图所示：

3.6创建分区索引

--创建分区索引
create nonclustered index [nci_supplierid] on dbo.stock
(
    supplierid asc
)
include ( [model],[brand],[encapsulation]) with (pad_index = off, statistics_norecompute = off, sort_in_tempdb = off, ignore_dup_key = off, drop_existing = off, online = off, allow_row_locks = on, allow_page_locks = on)
go

或者

执行完毕后如图所示：

创建好索引之后，我们来看看分区情况：

--查看各分区有多少行数据
select * from (
select $partition.pf_supplierid([supplierid]) as patition,count(*) as countrows from dbo.stock
group by $partition.pf_supplierid([supplierid])
)tb order by patition

最后我们来看看加了索引之后表数据查询情况：

4.表分区的优缺点

优点：
●改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索速度。
●增强可用性：如果表的某个分区出现故障，表在其他分区的数据仍然可用。
●维护方便：如果表的某个分区出现故障，需要修复数据，只修复该分区即可。
●均衡i/o：可以把不同的分区映射到不同磁盘以平衡i/o，改善整个系统性能。
缺点：
分区表相关：已经存在的表没有方法可以直接转化为分区表。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

YourSQLDba低版本的一个Bug的浅析

帮人分析解决一个YourSQLDba备份报错问题，个人觉得有点意思，顺手记录一下分析思路，大体解决思路如下：首先，找到YourSQLDba作业Your... [阅读全文]
sql某个日期是当年的第几周

/* *周一作为一周的开始 *当年的1月1号所在的周算作第一周 */ CREATE function GetWeekIndexFirstDate ( @... [阅读全文]
sqlserver 数据库迁移

业务情景客户环境是系统A的1.0版本，开发环境是系统A的2.0版本。2.0版本对于数据库有部分变更（主要是新增表和字段，不涉及字段删除和变更）。这个时... [阅读全文]
数据库SQL---范式

1、数据冗余导致的问题：冗余存储、更新异常、插入异常、删除异常。 2、函数依赖：一种完整性约束。在关系模式r(R)中，α属于R，β属于R。 1）α函数... [阅读全文]
sql server如何用不同语种语言显示报错的错误消息

问题：生产环境的操作系统和数据库可能是英文版的，而我们的母语是中文，如果英语能力差点，可能有时对英语环境下的数据库脚本报错的英文提示看不懂，如果直接拿英... [阅读全文]
数据库SQL---查询

1、查询所有列 select *from emp;--*表示所有的，from emp表示从emp表中查询。 2、查询指定列 select empno,e... [阅读全文]
数据库SQL---数据库、基本表、视图、索引的定义、修改、删除

1、SQL（结构化查询语言）的组成：数据定义语言DDL、数据操纵语言DML、数据控制语言DCL、其他。 2、SQL语言的功能： 1）数据查询：SELEC... [阅读全文]
对比索引、视图、游标、存储过程和触发器

1、索引 1-1、索引的概述我们把一个表中的一列或者多列和列中元素所在表中记录的物理地址组合成一个新的表。这个表的记录大致为列的内容和该列所在记录的物... [阅读全文]
在 Azure CentOS VM 中配置 SQL Server 2019 AG - (上)

前文假定您对Azure和SQL Server HA具有基础知识假定您对Azure Cli具有基础知识目标是在Azure Linux VM上创建一个... [阅读全文]
在 Azure CentOS VM 中配置 SQL Server 2019 AG - (下)

配置 Internal Load Balancer 创建load balancer 我的三台VM都位于sqldemoVNET/linuxsubnet子网... [阅读全文]

网友评论


验证码：