当前位置: 移动技术网 > IT编程>数据库>Mysql > MySQL中聚合函数count的使用和性能优化技巧

MySQL中聚合函数count的使用和性能优化技巧

2019年05月30日  | 移动技术网IT编程  | 我要评论
本文的环境是windows 10,mysql版本是5.7.12-log 一、 基本使用 count的基本作用是有两个: 统计某个列的数据的数量; 统计结

本文的环境是windows 10,mysql版本是5.7.12-log

一、 基本使用

count的基本作用是有两个:

  • 统计某个列的数据的数量;
  • 统计结果集的行数;

用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况,比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。

示例表如下:

create table `newtable` (
`id` int(11) null default null ,
`name` varchar(30) null default null ,
`country` varchar(50) null default null ,
`province` varchar(30) null default null ,
`city` varchar(30) null default null 
)engine=innodb

这里写图片描述

1.1 不计算null的值

如果有null值,在返回的结果中会被过滤掉

select count(country) from person;

返回结果如下:

这里写图片描述

如果满足条件的数据项不存在,则结构返回0,经常通过这种方式判断是否有满足条件的数据存在;返回的数据类型是bigint。

1.2 对count(*)的处理

count(*)的处理是有点不同的,它会返回所有数据的数量,但是不会过滤其中的null值,它也并不是相当于展开成所有的列,而是直接会忽略所有的列而直接统计所有的行数。语句如下:

select count(*) from person;

返回结果如下:

这里写图片描述

当想要返回所有的数据的数量的时候,但是又不想包括全部是null的列,使用count(*)是不可能做到的,但是在1.1中说到count作用于列的时候会过滤null,那么直接这么写是不是对?

select count(id, `name`, country, province, city) from person;

那就错了,count只能作用于单列,不能作用于多列 ,所以上面的写法是错误的。

另外针对count(*)语句,在myisam存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,比如innodb中,因为会涉及到多个事务;

1.3 对count(distinct …)的处理

count(distinct …)会返回彼此不同但是非null的数据的行数。这一点和只使用distinct是有区别的,因为distinct是不过滤null值的,详见mysql中distinct的使用方法 。

- 如果没有符合条件的数据则返回0;
- 该语句可以作用于多列,是当各个列之间有一个不同,就认为整行数据不同,与distinct作用于多列时效果相同;

select count(distinct country) from person;

返回结果如下:

这里写图片描述

但是对于count(*)和count(distinct )两者的结合,如下:

select count(distinct *) from person;

该语句是错误的,无法执行,因此与select count(distinct *) from person 还是有区别的。

二、 性能优化

通常情况下,count(*)操作需要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。

2.1 在数据库的层次上优化

2.1.1 针对count(*)

在mysql内部已经针对count(*)进行了优化,使用explain查询如下:

explain select count(*) from person;

这里写图片描述

从中可以看出该查询没有使用全表扫描也没有使用索引,甚至不需要查询数据表,在上面的示例数据库中得知,该库的存储引擎是innodb ,而且其中既没有主键也没有索引。

2.2 针对单个列进行count

查询如下:

explain select count(country) from person where id > 2;

这里写图片描述

发现在没有主键和索引的情况下,对全表进行了扫描。在数据中避免大量扫描数据行,一个最直接的方法使用索引:

当对id设置为一般索引 :index abc (id) using btree 。

执行查询如下:

explain select count(country) from person where id > 2;

结果如下:

这里写图片描述

此时发现并没有使用索引,仍然进行的是全表扫描,当执行如下时:

explain select count(country) from person where id > 4;

结果如下:

这里写图片描述

这是使用了索引进行了范围查询,显然比上面的要好。

但是问题来了,为什么有时候使用索引,有时候不用索引?在上面的第一次查询中已经能够检测出可能的key但是并没有使用?如果有知道的大神给解读一下!

对id设置为主键,执行查询如下:

explain select count(country) from person where id > 2;

结果如下:

这里写图片描述

2.2 在应用的层次上优化

在应用的层次上优化,可以考虑在系统架构中引入缓存子系统,比如在过去中常用的memcached,或者现在非常流行的redis, 但是这样会增加系统的复杂性。

mysql group by与聚合函数(sum,count等)实例

首先我们先来了解一下mysql聚合函数

mysql中一种特殊的函数:聚合函数,sum, count, max, min, avg等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如:

select sum(score) from table

这个sql的意思是查询表table里面所有score列的总和。

接着我们通过一个实例来讲解group by语句中如何使用聚合函数。

book表如下:

id first_name last_name city
1 jason martin toronto
2 alison mathews vancouver
3 james mathews vancouver
4 celia rice vancouver
5 david larry new york

现在我们要对city进行分组查询,并获取每个分组有多少条数据,我们需要count聚合函数。

select *,count(*) from book group by city

结果为:

id first_name last_name city count(*)
1 jason martin toronto 1
2 alison mathews vancouver 3
5 david larry new york 1

先以city把返回记录分成多个组,这就是group by的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

如您对本文有疑问或者有任何想说的,请 点击进行留言回复,万千网友为您解惑!

相关文章:

  • Ubuntu上Vim安装NERDTree插件的详细操作步骤

    Ubuntu上Vim安装NERDTree插件的详细操作步骤

    nerdtree是vim的文件系统浏览器,使用此插件,用户可以直观地浏览复杂的目录层次结构,快速打开文件以进行读取或编辑,以及执行基本的文件系统操作。nerdt... [阅读全文]
  • MySQL 4种常用的主从复制架构

    MySQL 4种常用的主从复制架构

    一主多从复制架构在主库读取请求压力非常大的场景下,可以通过配置一主多从复制架构实现读写分离,把大量的对实时性要求不是特别高的读请求通过负载均衡分部到多个从库上(... [阅读全文]
  • 浅析MySQL 备份与恢复

    1、简介数据无价,mysql作为一个数据库系统,其备份自然也是非常重要且有必要去做。备份的理由千千万,预防故障,安全需求,回滚,审计,删了又改的需求等等,备份的... [阅读全文]
  • 保障MySQL数据安全的一些建议

    数据是企业核心资产,数据对企业而言是最重要的工作之一。稍有不慎,极有可能发生数据无意泄露,甚至被黑客恶意窃取的风险。每年业界都会传出几起大事件,某知名或不知名的... [阅读全文]
  • MySQL如何快速修改表的表结构

    快速修改mysql某张表的表结构--摘录自《mysql管理之道》alter table 表名 modify 列名 数据类型; 这个命令可以修改表结构此外,也可以... [阅读全文]
  • MySQL 行锁和表锁的含义及区别详解

    一、前言对于行锁和表锁的含义区别,在面试中应该是高频出现的,我们应该对mysql中的锁有一个系统的认识,更详细的需要自行查阅资料,本篇为概括性的总结回答。mys... [阅读全文]
  • MySQL 如何查询当前最新事务ID

    写在前面:在个别时候可能需要查看当前最新的事务 id,以便做一些业务逻辑上的判断(例如利用事务 id 变化以及前后时差,统计每次事务的响应时长等用途)。通常地,... [阅读全文]
  • 如何优雅、安全的关闭MySQL进程

    前言本文分析了 mysqld 进程关闭的过程,以及如何安全、缓和地关闭 mysql 实例,对这个过程不甚清楚的同学可以参考下。关闭过程1、发起 shutdown... [阅读全文]
  • 详解MySQL8.0​ 字典表增强

    详解MySQL8.0​ 字典表增强

    mysql中数据字典是数据库重要的组成部分之一,information_schema首次引入于mysql 5.0,作为一种从正在运行的mysql服务器检索元数据... [阅读全文]
  • 简述MySQL InnoDB存储引擎

    前言:存储引擎是数据库的核心,对于 mysql 来说,存储引擎是以插件的形式运行的。虽然 mysql 支持种类繁多的存储引擎,但最常用的当属 innodb 了,... [阅读全文]
验证码:
移动技术网