SELECT TOP N 问题

  • 作者:未知 来源:未知 添加时间:2006年7月3日 字体:

  • Hi, everyone:
        本贴讨论SELECT TOP N问题.
        现在正在一家计算机公司兼职,开发ASP应用. 在最近的一个商业项目里有这样一个需求:用户在查询时,只需要按照某(些)列排序后TOP 20的纪录. SQL SERVER 7很好地支持了TOP N 操作,但考虑到系统移植问题, 我又考虑在其他几个主流DBMSs中如何实现. 鉴于只有DB2 UDB 7,ORACLE 8i,SQL SERVER 7,本贴仅讨论这三个DBMS.
        简单地说,TOP N问题就是:在SELECT中,仅选择按照某(些)列排序后TOP N的纪录. 考虑到等值问题,又可以分为两种: 一是仅仅返回N条纪录(M 1), 二是还包括所有于第N条等值的纪录(M 2). 当然最内层的子查询也可以有其他的子句, 或者TOP N也可以应用在没有ORDER BY的情况下,这样更简单.

    1. SQL SERVER 7: 用 TOP N (WITH TIES)
    M1:
    SELECT TOP N * FROM MYTABLE ORDER BY ORD_COL;


    M2:
    SELECT TOP N  WITH TIES * FROM MYTABLE ORDER BY ORD_COL;
    注: SQL SERVER 7提供了PERCENT N WITH TIES, ACCESS 中提供了TOP N,但含义是M 2.


    2. ORACLE 8i: 用 ROWNUM<=N
    M1:
    SELECT * FROM
         ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC)
    WHERE ROWNUM<=N
    M2:
    SELECT * FROM MYTABLE WHERE ORD_COL>=
       (SELECT MIN(ORD_COL) FROM
            ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC)
        WHERE ROWNUM<=N)
    ORDER BY ORD_COL DESC
    注意以下两种错误用法:
    WRONG 1:
    SELECT * FROM MYTABLE
    WHERE  ROWID<=N
    ORDER BY ORD_COL DESC;


    WRONG 2:(因为WHERE ROWNUM<=N 在ORDER BY 前执行)
    SELECT * FROM MYTABLE
    WHERE  ROWNUM<=N
    ORDER BY ORD_COL DESC;


    3: DB2
    用FETCH FIRST N ROWS ONLY
    M1:
    SELECT * FROM MYTABLE
    ORDER BY ORD_COL DESC
    FETCH FIRST N ROWS ONLY
    M2:
    没有找到,因为DB2不允许在FROM中嵌套有ORDER BY子句的子查询.


    还不清楚ORACLE的M 2有没有更好的办法,以及其他的DBMS如何实现TOP N操作,请其他朋友补充.
    ----------------------------------------------------------------------------------
    各语句已经测试过, EXAMPLE:
    create table mytable(mykey int, ord_col int);
    insert into mytable &#118alues(1, 100);
    insert into mytable &#118alues(2, 100);
    insert into mytable &#118alues(3, 99);
    insert into mytable &#118alues(4, 101);
    insert into mytable &#118alues(5, 101);

    今天继续讨论SELECT TOP N问题.
    1. DB2的M 2
    在前一篇讨论中提到,由于DB2的SUBQUERY不支持ORDER BY子句,因此无法构造M2. 实际上,DB2提供了一组新的函数,称为 OLAP FUNCTIONS, 可以很好的支持TOP N问题.
    M2:
    SELECT * FROM
       (    SELECT MYKEY,RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
            FROM MYTABLE ) AS RANKED_TABLE
    WHERE MYRANK<=N

    利用OLAP函数,除了上一篇中所提方法,DB2的M1又可以表示为:
    SELECT * FROM
       (    SELECT MYKEY,ROW_NUMBER() OVER (ORDER BY ORD_COL DESC) AS MYRANK
            FROM MYTABLE ) AS RANKED_TABLE
    WHERE MYRANK<=N


    2. 除了M1, M2两种TOP N外,还有一种被DB2称为 DENSE_RANK, (M3). 通过下例分别说明.
    M1: TOP 3 -- 1(4,101), 2(5,101), 3(1, 100) 或者1(4,101), 2(5,101), 3(2, 100)
    M2: TOP 3 -- 1(4,101), 1(5,101), 3(1, 100), 3(2, 100)
    M3: TOP 3 -- 1(4,101), 1(5,101), 2(1, 100), 2(2, 100), 3(3,99)
    在DB2中, M3如此实现:
    SELECT * FROM
       (  SELECT MYKEY,DENSE_RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
          FROM MYTABLE ) AS RANKED_TABLE
    WHERE MYRANK<=N


    3. 为避免DBMSs的方言问题, M2,M3可以有如下标准(SQL 92)表示:
    M2:
    SELECT * FROM MYTABLE M1 WHERE N>
       (   SELECT COUNT(*) FROM MYTABLE M2
           WHERE M2.ORD_COL>M1.ORD_COL);
    注意: 两个比较符都是 >
    M3:
    SELECT * FROM MYTABLE M1 WHERE N>
       (   SELECT COUNT(DISTINCT M2.ORD_COL) FROM MYTABLE M2
           WHERE M2.ORD_COL>M1.ORD_COL);
    注意: 与M2的不同在于DISTINCT的使用
    至于M1, 我目前还没有想到合适的标准写法,请补充.


    4. 关于MYSQL
    相对于各主流RDBMS来说,MYSQL要简单,幼稚地多. 在运行MYSQL时发现居然不支持SUBQUERY. 因此MYSQL中的TOP N问题要复杂一些.
    SELECT * FROM MYTABLE, MYTABLE M2
    WHERE M2.ORD_COL>=M1.ORD_COL
    GROUP BY M1.MYKEY
    HAVING COUNT(M2.ORD_COL) <=N
    但是,这个语句是有问题的. 一个极端的例子: 当所有的ORD_COL的数值都一样时. 如果哪位想到了如何解决这个问题,请补充.


    ----------------------------------------------------------------------------------
    各语句已经测试过, EXAMPLE:
    create table mytable(mykey int, ord_col int);
    insert into mytable &#118alues(1, 100);
    insert into mytable &#118alues(2, 100);
    insert into mytable &#118alues(3, 99);
    insert into mytable &#118alues(4, 101);
    insert into mytable &#118alues(5, 101)

  • 上一篇:如何得到一个数据库中每个表格的数据数目
  • 下一篇:Microsoft SQL Server 7.0安装问题
  • 最后更新时间:2024年12月22日
  • 返回页面顶端
ppdesk