in和exists的区别与执行效率问题解析

豆豆网   技术应用频道   2008年01月18日  【字号: 收藏本文

内容摘要:本文对in和exists的区别与执行效率的问题进行了全面整理分析……

  表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

  (1 行受影响)

  (419 行受影响)

  表 'syscolpars '。扫描计数 1,逻辑读取 10 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

  表 'sysschobjs '。扫描计数 1,逻辑读取 3 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

  (1 行受影响)

  测试结果(总体来讲exists比in的效率高):

  效率:条件因素的索引是非常关键的

  把syscolumns 作为条件:syscolumns 数据大于sysobjects

  用in

  扫描计数 47,逻辑读取 97 次,

  用exists

  扫描计数 1,逻辑读取 3 次

  把sysobjects作为条件:sysobjects的数据少于syscolumns

  exists比in多预读 15 次

  对此我记得还做过如下测试:

  表

  test

  结构

  id int identity(1,1), --id主键自增

  sort int, --类别,每一千条数据为一个类别

  sid int --分类id

  插入600w条数据

  如果要查询每个类别的最大sid 的话

  select*fromtesta
  wherenotexists(select1fromtestwheresort=a.sortandsid>a.sid)

  比

  select*fromtesta
  wheresidin(selectmax(sid)fromtestwheresort=a.sort)

  的效率要高三倍以上。具体的执行时间忘记了。但是结果我记得很清楚。在此之前我一直推崇第二种写法,后来就改第一种了。

  现在再举一个例子:

来源:IT专家网    作者:Peak Wong    责编:豆豆技术应用

正在加载评论...