当前位置: 移动技术网 > IT编程>数据库>Mysql > mysql实现随机查询经验谈

mysql实现随机查询经验谈

2017年12月12日  | 移动技术网IT编程  | 我要评论

一、随机查询一条数据

方法一:select * from `table` order by rand() limit 1

评价:不建议使用,效率非常低,官方文档中进行说明:order by和rand()连用,会多次扫描表,导致速度变慢。

方法二:select * from `table`
  where id >= (select floor(rand() * (select max(id) from `table`))) 
  order by id limit 1;

      解释:select max(id) from `table` 这句话查询出最大的id值

               select floor(rand() * (select max(id) from `table`)) 这句获取一个小于max(id)的随机数

where id >= (select floor(rand() * (select max(id) from `table`))) 这句话筛选出所有的大于生成随机数的id的行

    然后最后就把大于这个随机id的行查询出来,然后按照id排序,选择第一个,就相当与获取了所有行中随机的一行。

         评价:有问题,如果id不是从0开始的话,比如从10000开始自增,那么 select floor(rand() * (select max(id) from `table`)) 得到的将是会哟很大概率得到小于10000的值,经过where限定的查询结果将会是所有的查询结果的几率变大,最后limit 1获取的是第一行数据的几率变高。

方法三:select * from `table`
where id >= (select floor( rand() * ((select max(id) from `table`)-(select min(id) from `table`)) + (selectmin(id) from `table`)))   order by id limit 1;

方法四:select *
from `table` as t1 join (select round(rand() * ((select max(id) from `table`)-(select min(id) from `table`))+

(select min(id) from `table`)) as id) as t2
where t1.id >= t2.id
order by t1.id limit 1;

评价:解决了方法二中max(id)的问题,rand() * ((select max(id) from `table`)-(select min(id) from `table`)) + (selectmin(id) from `table`)可以获取max(id)和min(id)中的随机数。

方法四要比方法三稍快一点, 这篇文章指出,15w条数据前者花费时间 0.147433 秒,后者花费时间 0.015130 秒。

以上解决方案都默认有一个不重复的数字字段,其实现在很多表的设计都是以一个自增段作为主键,当然还有一些是以uuid作为主键的,而没有数字键,这样的话,可以用mysql的函数将uuid的字符串转换成数字。而且还有一个问题,如果id字段的数字分布不均匀的话(比如按照1,4,5,6,7,8,45这样分布),也会造成随机查询的不合理,但是这里就不讨论那么复杂的问题了。

二、随机查询多条数据

方法一:把随机查询一条数据的limit 1修改成limit 5

评价:这样获取的数据会是连续的。

方法二:

select *

from `table` as t1 join (

select round(rand() * ((select max(id) from `table`)-(select min(id) from `table`))+(select min(id) from `table`)) as id

from `table` limit 50) as t2 on t1.id=t2.id

order by t1.id limit 1;

解释:

select round(rand() * ((select max(id) from `table`)-(select min(id) from `table`))+(select min(id) from `table`)) as id

from `table` limit 50)这样会获取50个随机数字,然后on t1.id=t2.id会挑选出不大于50行的随机数据,然后取5条就好了。

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网