当前位置: 移动技术网 > IT编程>数据库>MSSQL > SQLServer 优化SQL语句 in 和not in的替代方案

SQLServer 优化SQL语句 in 和not in的替代方案

2017年12月12日  | 移动技术网IT编程  | 我要评论

用名字查身份证,李又兰,杨敬农简历

但是用in的sql性能总是比较低的,从sql执行的步骤来分析用in的sql与不用in的sql有以下区别:
sql试图将其转换成多个表的连接,如果转换不成功则先执行in里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用in的sql至少多了一个转换的过程。一般的sql都可以转换成功,但对于含有分组统计等方面的sql就不能转换了。 推荐在业务密集的sql当中尽量不采用in操作符
not in 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用not exists 或(外连接+判断为空)方案代替
  在数据库中有两个表,一个是当前表info(id,pname,remark,impdate,upstate),一个是备份数据表bakinfo(id,pname,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
  首先,添加10万条测试数据
复制代码 代码如下:

create procedure adddata
as
declare @id int
set @id=0
while(@id<100000)
begin
insert into dbo.info(id,pname,remark,impdate,upstate)
values(@id,convert(varchar,@id)+'0','abc',getdate(),0)
set @id=@id+1
end
exec adddata

使用not in 和in操作:
复制代码 代码如下:

set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from dbo.info
where id not in(select id from dbo.bakinfo)
go
set statistics time off

此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 3 毫秒。
sql server 执行时间:
cpu 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1 where id in(select id from dbo.bakinfo)

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 62 毫秒,占用时间 = 79 毫秒。
sql server 执行时间:
cpu 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from info where upstate=1 and id in(select id from dbo.bakinfo)

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 183 毫秒,占用时间 = 183 毫秒。
sql server 执行时间:
cpu 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  使用join连接替代方案:
复制代码 代码如下:

set statistics time on
go
--备份数据
insert into bakinfo(id,pname,remark,impdate,upstate)
select id,pname,remark,impdate,upstate from
(select info.id,info.pname, info.remark, info.impdate,info.upstate, bakinfo.id as bakid
from info left join
bakinfo on info.id = bakinfo.id ) as t
where t.bakid is null and t.upstate=0
go
set statistics time off;

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 247 毫秒,占用时间 = 247 毫秒。
sql server 执行时间:
cpu 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update info set upstate=1
from info inner join
bakinfo on info.id = bakinfo.id

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 4 毫秒,占用时间 = 4 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

--删除当前表数据
复制代码 代码如下:

delete from info
from info inner join
bakinfo on info.id = bakinfo.id
where info.upstate=1

  此操作执行时间:
复制代码 代码如下:

sql server 分析和编译时间:
cpu 时间 = 177 毫秒,占用时间 = 177 毫秒。
sql server 执行时间:
cpu 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
sql server 分析和编译时间:
cpu 时间 = 0 毫秒,占用时间 = 1 毫秒。

  可以看出使用join方案比使用not in 和in执行时间要短很多了

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网