当前位置: 移动技术网 > IT编程>数据库>Mysql > 对MySQL子查询的简单改写优化

对MySQL子查询的简单改写优化

2017年12月12日  | 移动技术网IT编程  | 我要评论

使用过oracle或者其他关系数据库的dba或者开发人员都有这样的经验,在子查询上都认为数据库已经做过优化,能够很好的选择驱动表执行,然后在把该经验移植到mysql数据库上,但是不幸的是,mysql在子查询的处理上有可能会让你大失所望,在我们的生产系统上就由于碰到了这个问题:

select i_id, sum(i_sell) as i_sell

from table_data

where i_id in (select i_id from table_data where gmt_create >= '2011-10-07 00:00:00′)

group by i_id;

(备注:sql的业务逻辑可以打个比方:先查询出10-07号新卖出的100本书,然后在查询这新卖出的100本书在全年的销量情况)。

这条sql之所以出现的性能问题在于mysql优化器在处理子查询的弱点,mysql优化器在处理子查询的时候,会将将子查询改写。通常情况下,我们希望由内到外,先完成子查询的结果,然后在用子查询来驱动外查询的表,完成查询;但是mysql处理为将会先扫描外面表中的所有数据,每条数据将会传到子查询中与子查询关联,如果外表很大的话,那么性能上将会出现问题;

针对上面的查询,由于table_data这张表的数据有70w的数据,同时子查询中的数据较多,有大量是重复的,这样就需要关联近70w次,大量的关联导致这条sql执行了几个小时也没有执行完成,所以我们需要改写sql:

select t2.i_id, sum(t2.i_sell) as sold

from (select distinct i_id from table_data

where gmt_create >= '2011-10-07 00:00:00′) t1, table_data t2

where t1.i_id = t2.i_id group by t2.i_id;

我们将子查询改为了关联,同时在子查询中加上distinct,减少t1关联t2的次数;

改造后,sql的执行时间降到100ms以内。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网