PostgreSQL -GROUP BY

PostgreSQL GROUP BY子句与 SELECT 语句配合使用,将表中具有相同数据的行组合在一起。这样做是为了消除适用于这些组的输出和/或计算聚合中的冗余。


GROUP BY 子句在 SELECT 语句中的 WHERE 子句之后,并在 ORDER BY 子句之前。

语法

下面给出了 GROUP BY 子句的基本语法。GROUP BY 子句必须跟在 WHERE 子句中的条件之后,并且必须在 ORDER BY 子句之前(如果使用)。

SELECT column‐list
FROM table_name
WHERE [ conditions ]
GROUP BY column1, column2....columnN
ORDER BY column1, column2....columnN

您可以在 GROUP BY 子句中使用多个列。确保您使用的任何列进行分组,该列应该在列列表中可用。

例子

考虑表pgccc_COMPANY 的记录如下

# select * from pgccc_COMPANY;
id | name | age | address | salary
‐‐‐‐+‐‐‐‐‐‐‐+‐‐‐‐‐+‐‐‐‐‐‐‐‐‐‐‐+‐‐‐‐‐‐‐‐
1 | Paul | 32 | California| 20000
2 | Allen | 25 | Texas | 15000
3 | Teddy | 23 | Norway | 20000
4 | Mark | 25 | Rich‐Mond | 65000
5 | David | 27 | Texas | 85000
6 | Kim | 22 | South‐Hall| 45000
7 | James | 24 | Houston | 10000
(7 rows)

如果您想知道每个客户的工资总额,那么 GROUP BY 查询将如下 \

LNXDB=# SELECT NAME, SUM(SALARY) FROM pgccc_COMPANY GROUP BY NAME;

这将产生以下结果

name | sum
‐‐‐‐‐‐‐+‐‐‐‐‐‐‐
Teddy | 20000
Paul | 20000
Mark | 65000
David | 85000
Allen | 15000
Kim | 45000
James | 10000
(7 rows)

现在,让我们使用以下 INSERT 语句在 pgccc_COMPANY 表中再创建三个记录

INSERT INTO pgccc_COMPANY VALUES (8, 'Paul', 24, 'Houston', 20000.00);
INSERT INTO pgccc_COMPANY VALUES (9, 'James', 44, 'Norway', 5000.00);
INSERT INTO pgccc_COMPANY VALUES (10, 'James', 45, 'Texas', 5000.00);

现在,我们的表有以下重复名称的记录

id | name | age | address | salary
‐‐‐‐+‐‐‐‐‐‐‐+‐‐‐‐‐+‐‐‐‐‐‐‐‐‐‐‐‐‐‐+‐‐‐‐‐‐‐‐
1 | Paul | 32 | California | 20000
2 | Allen | 25 | Texas | 15000
3 | Teddy | 23 | Norway | 20000
4 | Mark | 25 | Rich‐Mond | 65000
5 | David | 27 | Texas | 85000
6 | Kim | 22 | South‐Hall | 45000
7 | James | 24 | Houston | 10000
8 | Paul | 24 | Houston | 20000
9 | James | 44 | Norway | 5000
10 | James | 45 | Texas | 5000
(10 rows)

同样,让我们使用相同的语句对使用 NAME 列的所有记录进行分组,如下所示

LNXDB=# SELECT NAME, SUM(SALARY) FROM pgccc_COMPANY GROUP BY NAME ORDER BY NAME;

这将产生以下结果

name | sum
‐‐‐‐‐‐‐+‐‐‐‐‐‐‐
Allen | 15000
David | 85000
James | 20000
Kim | 45000
Mark | 65000
Paul | 40000
Teddy | 20000
(7 rows)

让我们使用 ORDER BY 子句和 GROUP BY 子句如下

LNXDB=# SELECT NAME, SUM(SALARY)
FROM pgccc_COMPANY GROUP BY NAME ORDER BY NAME DESC;

这将产生以下结果

name | sum
‐‐‐‐‐‐+‐‐‐‐‐‐‐
Teddy | 20000
Paul | 40000
Mark | 65000
Kim | 45000
James | 20000
David | 85000
Allen | 15000
(7 rows)