当前位置：移动技术网 > IT编程>数据库>Mysql > MySQL优化（3）：索引

MySQL优化（3）：索引

2020年03月11日 | 移动技术网IT编程 | 我要评论

mysql优化中，最重要的优化手段就是索引，也是最常用的优化手段

索引简介：

索引：关键字与数据位置之间的映射关系

关键字：从数据中提取，用于标识，检索数据的特定内容

目的：加快检索

索引检索为什么快：

（1）关键字相对于数据本身，量较小

（2）关键字都是排序好的

mysql中索引的类型：

普通索引，唯一索引，主键索引，全文索引

不同的类型只是对关键字的限制不同

普通索引：多索引关键字没限制，有长度限制

唯一索引：要求记录提供的关键字不能重复

主键索引：要求关键字不能重复而且不能为null

全文索引：不支持中文，后续细讲

索引的语法：

查看索引：

show create table [table-name];

比如查到primary key(‘id’)，就是一个主键索引

创建索引：需要修改表结构和创建表时候完成，基于不同的类型，方式也不同

同时创建四个索引，由于使用到了全文索引，这里使用myisam引擎

create table user(
id int auto_increment primary key,
first_name varchar(16),
last_name varchar(16),
sn varchar(16),
information text,
key(first_name,last_name),
unique key(sn),
fulltext key(information)
)engine=myisam;

索引可以命名，比如key name (first_name,last_name)

这句话创建了一个基于first_name和last_name的复合普通索引

unique key(sn) 创建了基于sn的唯一索引，默认以字段名命名索引

最后一个全文索引很鸡肋，基本不会用

在修改表结构的时候创建索引：

alter table user(
add key(first_name,last_name),
add unique key(sn),
add fulltext key(information)
)

删除索引：

alter table [table-name] drop primary key;
alter table [table-name] drop key [key-name];

一般不简易删除主键索引，记录是按照主键来排序的，设计主键要注意一定与业务逻辑无关

执行计划：

执行计划：当mysql执行sql语句时，会分析、优化、形成执行计划后按照执行计划来执行

在执行计划中可以清楚的看到当前的查询是否需要用到索引：

explain select * from [table-name] where id<20;

结果中有一样：key:primary，代表该查询语句会用到主键索引

索引使用的场景：

如果两张表，学生和班级表，多对一的关系，导入较多的记录来测试

（1）where查询

explain select * from student where id=123456

和上面的例子一样，可以看到使用到了主键索引

explain select * from student where username="xxx"

这句话执行后会发现：key:null，没有索引

我们给它加上索引：（这里的index和上文的key都可以）

alter table student add index (username);

查看执行计划后可以发现：key:username，说明使用到了新建的索引

（2）order by排序

我们有可能会遇到以下的情况：

select * from student order by username;

查看执行计划后可以发现没有使用到任何索引，并且看到了extra:using filesort，使用到了外部文件排序，性能更低，需要先将数据读取到内存，分段读取合并排序

提高效率的方式是增加索引：

alter table student add index (username);

现在查看执行计划后，可以发现使用到了username索引，并且没有使用外部文件排序，性能会有明显提升

（3）join 连接

使用到这条语句：

select c.* count(s.id) from class c join student s on c.id=s.class_id group by c.id;

当数据量巨大的时候，这句话要执行5s以上

查看执行计划后，发现其中一张表没有索引，且使用到了外部文件排序

解决：

alter table student add index (class_id);

执行后发现速度明显提升，并且两张表都使用到了索引，没有外部文件排序

（4）索引覆盖

前三条很重要，是必须做的优化，这条只是一个现象

比如我们使用这条语句：建立一个复合索引

alter table student add index (firstname,lastname);

然后再执行：这句话没有使用到以上三种情况

select firstname,lastname from student;

但是查看计划后，发现还是使用到了索引，并且extra:using index，说明这句话只使用了索引来完成

如果执行这句话

select firstname,lastname,user from student;

再查看计划后发现没有使用到了索引，并且进行了全表扫描

两次的差异只是多了一个user字段，而复合索引没有包含该字段

总结：mysql的查询优先使用了索引，由于索引覆盖，建议select后面只写有必要的字段，被覆盖的可能性就会提升，尽可能地优化

语法注意细节：

（1）字段需要独立出现

select * from student where id+1=20;

这句话是能执行成功的，id是主键，查看计划后却没有使用到主键索引

字段没有独立出现，不能触发该字段上的索引，避免这种情况

（2）like查询不能以通配符开头

select * from student where username like '%a%';

这句话无法使用到索引，如果是以下的情况，那么会用到索引

select * from student where username like 'a%';

字符串比较中，不能使用包含的逻辑，比如查询包含java的字符串，不能写'%java%'，效率过低

解决办法：全文索引，但是mysql全文索引很鸡肋，应该使用第三方的比如es，solr

（3）复合索引的右侧字段不能独立使用索引

已有index name(firstname,lastname);

使用语句，这句话使用到了索引

select * from student where firstname='xxx';

而下面这句话没有使用到索引

select * from student where lastname='xxx';

原因：复合索引是按照左侧字段排序的，如果左侧字段相同再用右侧字段排序，总体上来看，右侧字段是未排序的

既然这样为什么还要建复合索引呢？以下这种情况

select * from student where firstname like 'xx%' and lastname like 'xx%';

这句话如果建立两个索引，那么计算两个索引的交集会更慢，所以需要复合索引

如果遇到上面的情况，再给lastname建立一个索引即可

（4）早期版本null值无法使用索引

select * from student where firstname=null;

新版本无需关心这一条

（5）or语法保证两边的条件都有索引可用

select * from student where firstname like 'xx%' or user like 'xx%';

如果user没有索引，那么还是会全表查询

（6）状态值不容易使用到索引

gender 0,1,2表示男，女，未知

即使在字段上增加了索引，通常也不会起作用

select * from student where gender in (0,1);

原因：状态值往往导致一个状态值匹配大量记录，查询大量记录的时候，mysql认为使用索引开销比全表扫描都要大

如何创建索引：

（1）where,order by,join字段上建立索引

（2）组合索引的建立：基于业务逻辑

（3）如果条件经常出现在一起，多字段索引可以升级为复合索引

（4）如果通过增加个别字段，就可以出现索引覆盖，那么增加个别字段

（5）不会用到的索引应该删掉

（6）常规情况下我们建立的数据库系统本身性能就不差了

（7）有些字段是否只使用前缀就能完成，使用前缀索引

前缀索引：index(field(10))

使用字段field的前10个字符建立索引，默认是使用字段全部内容建立索引

使用：git的commit_id；密码字段

索引的存储结构：

btree索引，hash索引，聚簇索引

以上概念指的是索引的存储结构，数据结构上的概念，实际使用无需关心，了解即可

btree索引：

索引存储在磁盘上所用的基础的通用的存储结构

特征：磁盘上的数据结构，不是二叉树，一定要一个中文，那就是多路平衡查找树

特点：一个btree节点，存储多个索引关键字，多少由节点大小和关键字来确定的，

节点大小是固定的，由计算机文件系统来确定，一次性磁盘读取内存量，就是一个节点大小

由于一个节点的大小是固定的，一个节点无法容纳大量关键字，所以分散在多个节点来存储关键字

这时候如何进行排序呢？通过上层节点的子节点指针指向下层节点，用来关联所有的节点，子节点指针位于关键字之间

例如每个节点存储1000个关键字，深度为2的两层btree大概可以存储1000000（1000*1000）个关键字

查找一个关键字，需要读取几个节点的内容呢？从根开始，确定下级节点，仅仅两次的磁盘读取就可以做到

btree的意义在于可以遍历大量关键字，减少磁盘读取量的开销

聚簇索引：

关键字和记录在一起进行存储

是升级后的btree，数据结构上的b+tree

mysql中只有innodb的主键索引是聚簇结构

hash索引：

当索引被载入到内存后采用的存储结构，采用哈希结构存储了，类似java的map，key-value

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

五子棋代码C语言实现

五子棋代码C语言实现（数据结构实训）这是我大一时候组队合作写的五子棋小游戏代码，实现了人人对战，人机对战，悔棋，... [阅读全文]
unity22——DO Tween 常用简单操作

我们在unity开发中，经常会遇到一些界面的简单动画，场景的简单动画。我们一般会用animation去穿动画帧解... [阅读全文]
Dijkstra贪心算法求单源最短路径

给定一个带权有向图G=（V,E），其中每条边的权是一个非负实数。另外，还给定V中的一个顶点，称为源。现在要计算从... [阅读全文]
Unity使用Vuforia实现AR脱卡功能

AR脱卡功能话不多说，思路如下实现脱卡功能主要是改变官方原脚本里的OnTrackingLost()这个方法在识别... [阅读全文]
unity连接mysql

记录一下unity连接mysql数据库所遇到的大坑子准备事项：1、安装mysql、unity、visual st... [阅读全文]
2020.07笔记本选购指南

前言、本文包括1、笔记本买什么好？2、笔记本品牌扫盲！3、笔记本硬件扫盲！4、笔记本良心推荐！1、笔记本买什么好... [阅读全文]
LeeCode 188 DP + 贪心

题意传送门 LeeCode 188题解dp[i][j][k]dp[i][j][k]dp[i][j][k] 代表第... [阅读全文]
双圆弧插值算法（一）

双圆弧插值算法（一）Biarc Interpolation在游戏开发中经常出现两点间的插值问题。大多数情况下，只... [阅读全文]
起底B站、西瓜抢人之争

配图来自Canva近日，巫师财经在西瓜视频上传一条主题为《重启》的视频，谈及世界各个领域经济重启与个人发展的重启... [阅读全文]
ui设计是什么？从UI设计的角度，王者荣耀马超限定皮肤另有亮点！

王者荣耀马超限定皮肤另有亮点！【摘要】：在不少王者荣耀的玩家眼中，一款皮肤的美术设计是好是坏，会有各种角度的判定... [阅读全文]