17370845950

SQL 中 count () over partition by 用法_sql 中 count () over 分区计数方法

count() over(partition by ...) 是一种 sql 窗口函数,用于在不合并行的前提下按指定字段分组统计行数。它保留原始数据每一行,并在每行显示所属分组的计数值,相比 group by 更灵活,适合带明细的统计场景。1. 常用于统计每个类别或人员的数量,如每个部门的员工人数;2. 可结合 order by 实现累计统计,如计算截止某日的订单总数;3. 支持在 where 过滤后进行计数,如统计用户最近一个月登录次数。使用时需注意 count(字段) 会忽略 null 值,count(*) 则统计所有行,partition by 可跟多个字段,且需关注大数据量下的性能问题。

在 SQL 查询中,COUNT() OVER(PARTITION BY ...) 是一种窗口函数的用法,它能让你在不改变原始数据行的前提下,对数据进行分组统计。相比传统的 GROUP BY,它更灵活,尤其适合做带明细的统计。


什么是 COUNT() OVER(PARTITION BY ...)

简单来说,它是把数据按照某个字段(或多个字段)分区,然后在每个分区内独立计算行数。结果会保留每一行的数据,并在每行上加上该分区内的计数值。

举个例子:你有一张销售记录表,里面有销售人员和订单信息。你想知道每位销售员有多少条订单记录,但又不想合并行,这时候就可以用这个方法。

语法如下:

COUNT(字段名) OVER(PARTITION BY 分组字段)

比如:

SELECT name, order_id,
       COUNT(order_id) OVER(PARTITION BY name) AS total_orders
FROM sales;

这样就能看到每个人的订单数量,同时保留每一条订单记录。


常见使用场景

1. 统计每个人或每类别的记录数量

这是最常见的一种用途。例如统计每个部门员工数量,但又想保留所有员工的信息。

SELECT employee_id, department,
       COUNT(employee_id) OVER(PARTITION BY department) AS dept_count
FROM employees;

这样每行都会显示所属部门的总人数。

2. 结合排序做累计统计

除了单纯计数,还可以配合 ORDER BYROWS BETWEEN 实现动态累计值。

比如查看某销售每天的订单量并计算截止当天的总订单数:

SELECT name, order_date,
       COUNT(order_id) OVER(PARTITION BY name ORDER BY order_date) AS cum_orders
FROM sales;

这在分析趋势时很有用。

3. 配合 WHERE 条件过滤后计数

有时候我们只关心满足特定条件的数据计数,可以在主查询中加 WHERE 过滤后再使用 OVER(PARTITION BY...)

例如:统计每位用户最近一个月内的登录次数:

SELECT user_id, login_time,
       COUNT(login_time) OVER(PARTITION BY user_id) AS recent_logins
FROM logins
WHERE login_time >= DATE_SUB(CURRENT_DATE, INTERVAL 1 MONTH);

使用时需要注意的地方

  • COUNT 的字段是否为 NULL
    如果你写的是 COUNT(*),那会统计所有行;如果是 COUNT(字段),则只会统计该字段非空的行。

  • PARTITION BY 后面可以跟多个字段
    比如按地区和地区类型一起分区:

    COUNT(*) OVER(PARTITION BY region, region_type)
  • 性能问题要注意
    尤其是在大数据量下,窗口函数可能会比较慢,建议合理使用索引和分区。


总结

COUNT() OVER(PARTITION BY ...) 是一个非常实用的 SQL 技巧,尤其适合需要保留明细的同时做分组统计的场景。掌握它的基本用法和几个关键细节,能大大提升你的数据分析效率。

基本上就这些了,用多了你会发现它比 GROUP BY 更灵活,也更适合复杂报表场景。