CUBE组合查询大计算

一、GROUP
BY的理解

 

GROUP
BY是SELECT语句的从句,用来指定询问分组条件,首要用来对查询的结果进行分组,相同组合的分组条件在结果集中只突显一行记录。使用GROUP
BY从句时候,通过丰盛聚合函数(首要有COUNT()、SUM、MAX()、MIN()等)可以使数据聚合。

GROUP BY插叙列中使用聚合函数是指向每个分组的。例如:

 

SELECT SUBSTR(A.HYLB_DM,1,2),COUNT(*)

FROM DJ_ZT A

GROUP BY SUBSTR(A.HYLB_DM,1,2);


01      2071

02      679

03      17952

04      150

05      5921

06      11406

07      3030

08      51308

09      3940

10      1229

11      3548

12      6916

13      1003

14      537

15      11471

16      44

17      135

18      676

19      5747

‘[Null]’        84

 

GROUP
BY用来指定分组条件,是一个数学集合的定义,比如针对一列举行分组,则构成分组条件的集合数为1。要是有八个分组条件,则构成分组条件的集合数为2。因而带有GROUP
BY的询问一般成为分组查询,也叫组合查询。组合记录的多少取决于组合集合(不分包重复元素)中元素的个数。例如,组合条件为一列,则查询结果集记录条数应该等于那个列所有字段所结合(数学意义上的)集合的要素个数(NULL字段也算一个)。要是有八个组合列,则记录数等于实际中设有的多少个列所结合的数额。

 

SELECT XZ,DFMC
FROM ODS.DM_RPT_QYHF
WHERE XZ=’02’

GROUP BY XZ,DFMC;

02 ‘中外合营’
02 ‘中外合营’
02 ‘中外股份’
02 ‘外商投资’
02 ‘国外及港澳台地区在境经营’
02 ‘海外及港澳台地区常驻代表机关’

SELECT XZ,DFMC
FROM ODS.DM_RPT_QYHF

GROUP BY XZ,DFMC;

01 ‘其他’
01 ‘内资集团’
01 ‘国有’
01 ‘股份合作’
01 ‘集体’
02 ‘中外合营’
02 ‘中外合营’
02 ‘中外股份’
02 ‘外商投资’
02 ‘国外及港澳台地区在境经营’
02 ‘国外及港澳台地区常驻代表机关’
03 ‘个人合资’
03 ‘合伙公司’
03 ‘合营有限’
03 ‘独资股份’
‘[Null]’ ‘[Null]’

 

SELECT XZ,DFDM,DFMC,COUNT(*)
FROM ODS.DM_RPT_QYHF
GROUP BY XZ,DFDM,DFMC;


01      01      ‘国有’  4
01      02      ‘集体’  4
01      03      ‘股份合作’      3
01      04      ‘内资公司’      26
01      05      ‘其他’  2
02      01      ‘中外独资’      2
02      02      ‘中外合作’      4
02      03      ‘外商投资’      28
02      04      ‘中外股份’      4
02      06      ‘海外及港澳台地区在境经营’      1
02      07      ‘海外及港澳台地区常驻代表机构’  1
03      01      ‘独资有限’      6
03      02      ‘独资股份’      4
03      03      ‘个人独资’      1
03      04      ‘合伙集团’      1
‘[Null]’        ‘[Null]’        ‘[Null]’        43

 

GROUP
BY组合列必须出现查询的SELECT关键字背后,相同组合条件的动静下单独保留一个。因而,通过SELECT…GROUP
BY查询出的种种列都应该是数额相同,要高达同等的目标,有二种途径:一种是即将查询的字段方到组合条件中,一种是在非组合条件的字段上利用聚合函数,当然也得以在组成列上聚合函数。处子之外,别无它法!假若查询的逐一列结果数目不对等,则结果集会合世“不能够对齐”的荒谬。
由此,将非组合条件的列在不利用聚合函数条件下放到要询问的列中,那种做法是截然错误的。

 

SELECT XZ

FROM ODS.DM_RPT_QYHF

GROUP BY XZ;


01

02

03

‘[Null]’

 

GROUP
BY在做结合查询的时候,会对NULL的分组单独形成一行,举行总结。参看上边的SQL。

 

GROUP
BY对构成条件列来说,本身就会活动分组(剔除重复的列),因而在结合条件的列上应用DISTINCT关键字是多于的。可是用在非组合条件(都有聚合函数)的列上使用DISTINCT却不是剩下的。

 

SELECT COUNT(DISTINCT(A.QYLX_ZL))

FROM DJ_ZT A

GROUP BY SUBSTR(A.QYLX_ZL,1,1);


1       3       11

2       2       9

3       6       2

4       5       10

5       3       9

6       1       6

7       2       2

8       2       1

9       3       2

 

GROUP BY不但可以对列组合,还足以对列的表明式举办结合。

 

例如:

SELECT

COUNT(A.BS) AS HS,

B.HYML_DM AS HYML_DM,

(SELECT HYML_MC FROM DM_HYML WHERE HYML_DM=B.HYML_DM) AS HYML_MC

FROM DJ_ZT A RIGHT OUTER JOIN DM_HYML B

ON SUBSTR(A.HYLB_DM,1,2)=B.HYML_DM

GROUP BY B.HYML_DM;


2071    01      ‘农、林、牧、渔业’

17952   03      ‘制造业’

679     02      ‘采矿业’

150     04      ‘电力、燃气及水的生产和供应业’

5921    05      ‘建筑业’

11406   06      ‘交通运输、仓储和邮政业’

3030    07      ‘音信传输、总计机服务和软件业’

51308   08      ‘批发和零售业’

3940    09      ‘住宿和餐饮业’

1229    10      ‘金融业’

3548    11      ‘房地产业’

6916    12      ‘租费和商务服务业’

1003    13      ‘科学钻探、技术服务和地质勘查业’

537     14      ‘水利、环境和公共设施管理业’

11471   15      ‘居民服务和其余服务业’

44      16      ‘教育’

135     17      ‘卫生、社会保险和社会福利业’

676     18      ‘文化、体育和游戏业’

5747    19      ‘公共管理和社会团体’

0       20      ‘国际社团’

 

可以在SELECT … GROUP BY
分组后筛选数据。筛选的要害字是HAVING。HAVING的作用和WHERE类似。都是用来过滤查询的中间记录。不过,HAVING从句指定的每个列规范必须出现在一个聚合函数内,或者出现在GROUP
BY从句命名的列中。与WHERE分歧的是:WHERE是在分组前(查询后)筛选数据;HAVING是在分组后筛选数据。

例如:

 

SELECT

SUBSTR(A.HYLB_DM,1,2),

COUNT(*),

SUM(A.ZCZB)

FROM DJ_ZT A

GROUP BY SUBSTR(A.HYLB_DM,1,2)

HAVING MAX(YEAR(A.CJRQ))<>2007;


08      51308   2988475.0376

 

SELECT

SUBSTR(A.HYLB_DM,1,2),

COUNT(*),

SUM(A.ZCZB)

FROM DJ_ZT A

GROUP BY SUBSTR(A.HYLB_DM,1,2)

HAVING MAX(YEAR(A.CJRQ))<>2007 AND COUNT(*)>2;


08      51308   2988475.0376

 

 

再如一个相比新鲜的例子,相比较一下探访:

SELECT SUBSTR(HY_DM,1,2), COUNT(HY_DM)

FROM DM_HY 

GROUP BY SUBSTR(HY_DM,1,2)

ORDER BY SUBSTR(HY_DM,1,2);


01      53

02      44

03      620

04      14

05      15

06      58

07      21

08      117

09      10

10      21

11      6

12      37

13      30

14      26

15      21

16      18

17      22

18      38

19      34

20      2

 

SELECT SUBSTR(HY_DM,1,2), COUNT(HY_DM)

FROM DM_HY 

GROUP BY SUBSTR(HY_DM,1,2)

HAVING COUNT(*)>100

ORDER BY SUBSTR(HY_DM,1,2);


03      620

08      117

 

事后可以看出COUNT(*)是对每一个分组的。

 

除此以外,有时候可以在分组以前开展数量筛选并排序,比如:

SELECT SUBSTR(A.HY_DM,1,2)

FROM DM_HY A

WHERE SUBSTR(A.HY_DM,1,2) NOT LIKE ’01’

GROUP BY SUBSTR(A.HY_DM,1,2)

ORDER BY SUBSTR(A.HY_DM,1,2) ASC;


02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

 

 

二、GROUP
BY的尖端用法

** 

1、GROUP BY … WITH ROLLUP 上滚总结

 

SELECT SUBSTR(A.HYLB_DM,1,2),COUNT(*)

FROM DJ_ZT A

GROUP BY SUBSTR(A.HYLB_DM,1,2) WITH ROLLUP;


‘[Null]’        127847

01      2071

02      679

03      17952

04      150

05      5921

06      11406

07      3030

08      51308

09      3940

10      1229

11      3548

12      6916

13      1003

14      537

15      11471

16      44

17      135

18      676

19      5747

‘[Null]’        84

 

2、GROUP BY … WITH CUBE

 

本条查询对于一个构成条件时候和上滚查询的结果一律,但有三个组成条件时候,此语句会发生用NULL和各类组合字段举行匹配,形成新的记录行,并举办计算。那么些函数平日很不常用。

 

一个构成条件的动静:

SELECT SUBSTR(A.HYLB_DM,1,2),COUNT(*)

FROM DJ_ZT A

WHERE A.ZCZB>100

GROUP BY SUBSTR(A.HYLB_DM,1,2) WITH CUBE;


‘[Null]’        11026

01      350

02      18

03      2721

04      47

05      1228

06      235

07      292

08      2477

09      212

10      135

11      1430

12      420

13      116

14      86

15      988

16      8

17      9

18      68

19      182

‘[Null]’        4

 

 

八个结合条件,相比一下,一目精晓:

 

第一种:不加WITH CUBE条件:

SELECT SUBSTR(A.HYLB_DM,1,2),SUBSTR(A.QYLX_ZL,1,1),COUNT(*)

FROM DJ_ZT A

WHERE A.ZCZB>100

AND A.HYLB_DM IS NOT NULL

AND A.QYLX_ZL IS NOT NULL

AND SUBSTR(A.HYLB_DM,1,2) NOT
IN(’03’,’04’,’05’,’06’,’07’,’08’,’09’,’10’,’11’,’12’,’13’,’14’,’15’,’16’,’17’,’18’,’19’,’20’)

AND A.QYLX_DM=’01’

GROUP BY SUBSTR(A.HYLB_DM,1,2),SUBSTR(A.QYLX_ZL,1,1);


01      1       41

01      3       18

02      1       4

 

第二种:加上WITH CUBE条件:

SELECT SUBSTR(A.HYLB_DM,1,2),SUBSTR(A.QYLX_ZL,1,1),COUNT(*)

FROM DJ_ZT A

WHERE A.ZCZB>100

AND A.HYLB_DM IS NOT NULL

AND A.QYLX_ZL IS NOT NULL

AND SUBSTR(A.HYLB_DM,1,2) NOT
IN(’03’,’04’,’05’,’06’,’07’,’08’,’09’,’10’,’11’,’12’,’13’,’14’,’15’,’16’,’17’,’18’,’19’,’20’)

AND A.QYLX_DM=’01’

GROUP BY SUBSTR(A.HYLB_DM,1,2),SUBSTR(A.QYLX_ZL,1,1) WITH CUBE;


‘[Null]’        1       45

‘[Null]’        3       18

‘[Null]’        ‘[Null]’        63

01      ‘[Null]’        59

02      ‘[Null]’        4

01      1       41

01      3       18

02      1       4

 

三、大旨原理

 

唯有尖锐精晓那些讲话执行的进程才能成功心中有数,明明白白写SQL。下面是带有WHERE和HAVING的SELECT语句执行进程:

 

1、执行WHERE筛选数据

2、执行GROUP
BY分组形成中间分组表

3、执行WITH
ROLLUP/CUBE生成计算分析数据记录并进入中间分组表

4、执行HAVING筛选中间分组表

5、执行ORDER BY排序

发表评论

电子邮件地址不会被公开。 必填项已用*标注