返回顶部
首页 > 资讯 > 数据库 >分析函数— —统计
  • 845
分享到

分析函数— —统计

2024-04-02 19:04:59 845人浏览 泡泡鱼
摘要

很多需求中都涉及到统计:均值、累计、范围均值、相邻记录比较等。这些操作会统计多次,或有明确的统计范围,或返回的记录统计的数据集不同...根据场景不同可分为如下几类:     &

很多需求中都涉及到统计:均值、累计、范围均值、相邻记录比较等。
这些操作会统计多次,或有明确的统计范围,或返回的记录统计的数据集不同...

根据场景不同可分为如下几类:   
    1. 全统计
    2. 滚动统计
    3. 范围统计
    4. (相邻)行比较


构建测试数据:
sql> desc criss_sales;
Name       Type        Nullable Default Comments 
---------- ----------- -------- ------- -------- 
DEPT_ID    VARCHAR2(6) Y                         
SALE_DATE  DATE        Y                         
GoODS_TYPE VARCHAR2(4) Y                         
SALE_CNT   NUMBER(10)  Y 


SQL> select * from criss_sales order by dept_id,sale_date desc;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT
------- ----------- ---------- -----------
D01     2014/5/4    G02                 80
D01     2014/4/30   G03                800
D01     2014/4/8    G01                200
D01     2014/3/4    G00                700
D02     2014/5/2    G03                900
D02     2014/4/27   G01                300
D02     2014/4/8    G02                100
D02     2014/3/6    G00                500


一.全统计
最常用的全统计就是均值或求和,有时会要求同一行记录包含不同范围的全统计。

例:
为数据集统计部门销售总和,全公司销售总和,部门销售均值,全公司销售均值

SQL> select
  2    dept_id
  3   ,sale_date
  4   ,goods_type
  5   ,sale_cnt
  6   ,sum(sale_cnt) over (partition by dept_id) dept_total
  7   ,sum(sale_cnt) over() cmp_total
  8   ,avg(sale_cnt) over (partition by dept_id) avg_dept
  9   ,avg(sale_cnt) over() avg_cmp
 10  from criss_sales
 11  ;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT DEPT_TOTAL  CMP_TOTAL   AVG_DEPT    AVG_CMP
------- ----------- ---------- ----------- ---------- ---------- ---------- ----------
D01     2014/5/4    G02                 80       1780       3580        445      447.5
D01     2014/4/8    G01                200       1780       3580        445      447.5
D01     2014/4/30   G03                800       1780       3580        445      447.5
D01     2014/3/4    G00                700       1780       3580        445      447.5
D02     2014/5/2    G03                900       1800       3580        450      447.5
D02     2014/4/8    G02                100       1800       3580        450      447.5
D02     2014/3/6    G00                500       1800       3580        450      447.5
D02     2014/4/27   G01                300       1800       3580        450      447.5 


这样在同一行记录,就得到了部门范围的全统计(均值/求和)和公司范围的全统计(均值/求和)。


二.滚动统计
滚动统计最常用的一个场景之一是累计。


例:
   计算部门和全公司的销售树量累计值。


SQL> select
  2    dept_id
  3   ,sale_date
  4   ,goods_type
  5   ,sale_cnt
  6   ,sum(sale_cnt) over(partition by dept_id order by dept_id,sale_date rows between unbounded preceding and current row) dept_cur_total
  7   ,sum(sale_cnt) over(order by dept_id,sale_date rows between unbounded preceding and current row) cmp_cur_total
  8  from criss_sales
  9  ;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT DEPT_CUR_TOTAL CMP_CUR_TOTAL
------- ----------- ---------- ----------- -------------- -------------
D01     2014/3/4    G00                700            700           700
D01     2014/4/8    G01                200            900           900
D01     2014/4/30   G03                800           1700          1700
D01     2014/5/4    G02                 80           1780          1780
D02     2014/3/6    G00                500            500          2280
D02     2014/4/8    G02                100            600          2380
D02     2014/4/27   G01                300            900          2680
D02     2014/5/2    G03                900           1800          3580

当然,滚动查询也可以计算当前平均值~这里就不在赘述了 


三.范围统计
有时候,我们往往关注一定范围内的数据,例如时间范围(一周内的数据),记录范围(前三条记录到当前记录)。

例:按日期排序,求相相邻三次销售记录的和
SQL> select
  2    dept_id
  3   ,sale_date
  4   ,goods_type
  5   ,sale_cnt
  6   ,sum(sale_cnt) over(order by sale_date rows between 1 preceding and 1 following) CON_1_CNT
  7  from criss_sales
  8  ;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT  CON_1_CNT
------- ----------- ---------- ----------- ----------
D01     2014/3/4    G00                700       1200
D02     2014/3/6    G00                500       1400
D01     2014/4/8    G01                200        800
D02     2014/4/8    G02                100        600
D02     2014/4/27   G01                300       1200
D01     2014/4/30   G03                800       2000
D02     2014/5/2    G03                900       1780
D01     2014/5/4    G02                 80        980


时间范围例子:
按日期排序,求当前记录日期前三天到后天三的销售数量和


SQL> select
  2    dept_id
  3   ,sale_date
  4   ,goods_type
  5   ,sale_cnt
  6   ,sum(sale_cnt) over(order by sale_date range
  7                                          between interval '3' day preceding
  8                                              and interval '3' day following) sum_7_days
  9  from criss_sales
 10  ;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT SUM_7_DAYS
------- ----------- ---------- ----------- ----------
D01     2014/3/4    G00                700       1200
D02     2014/3/6    G00                500       1200
D01     2014/4/8    G01                200        300
D02     2014/4/8    G02                100        300
D02     2014/4/27   G01                300       1100
D01     2014/4/30   G03                800       2000
D02     2014/5/2    G03                900       1780
D01     2014/5/4    G02                 80        980


四.(相邻)行比较
其实用over(order by xxx rows between 1 preceding and 0 following)也能实现相邻行的对比。
但是,oracle提供更方便的两个函数 
lead() 与后面某一行对比
lag()  与前面一行对比

按时间排序,显示当前记录的数量以及前后相邻记录的销售数量

SQL> select
  2    dept_id
  3   ,sale_date
  4   ,goods_type
  5   ,sale_cnt
  6   ,lag(sale_cnt,1) over(order by sale_date) lag_1
  7   ,lead(sale_cnt,1) over(order by sale_date) lead_1
  8   ,first_value(sale_cnt) over(order by sale_date rows between 1 preceding and 0 following)
  9  from criss_sales
 10  ;
 
DEPT_ID SALE_DATE   GOODS_TYPE    SALE_CNT      LAG_1     LEAD_1 FIRST_VALUE(SALE_CNT)OVER(ORDE
------- ----------- ---------- ----------- ---------- ---------- ------------------------------
D01     2014/3/4    G00                700                   500                            700
D02     2014/3/6    G00                500        700        200                            700
D01     2014/4/8    G01                200        500        100                            500
D02     2014/4/8    G02                100        200        300                            200
D02     2014/4/27   G01                300        100        800                            100
D01     2014/4/30   G03                800        300        900                            300
D02     2014/5/2    G03                900        800         80                            800
D01     2014/5/4    G02                 80        900                                       900

最后一列是利用over(order by xxx rows between 1 preceding and 0 following)与 lag做对比。同样可以得到我们希望看到的结果

您可能感兴趣的文档:

--结束END--

本文标题: 分析函数— —统计

本文链接: https://lsjlt.com/news/51391.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 分析函数— —统计
    很多需求中都涉及到统计:均值、累计、范围均值、相邻记录比较等。这些操作会统计多次,或有明确的统计范围,或返回的记录统计的数据集不同...根据场景不同可分为如下几类:     &...
    99+
    2024-04-02
  • 【数据分析之道-Numpy(八)】numpy统计函数
    文章目录 专栏导读1、np.mean()2、np.median()3、np.std()4、np.var()5、np.min()6、np.max()7、np.sum()8、np.prod()9...
    99+
    2023-09-25
    numpy python
  • PHP 数组分组函数在统计分析中的应用
    使用 php 的 array_group_by() 函数可以对数组中的数据进行分组,从而方便进行统计分析,包括:分组后,可以通过 array_map() 函数计算每个组中的元素数量。还可...
    99+
    2024-05-02
    php 数组分组
  • MySql中流程控制函数/统计函数/分组查询用法解析
    路漫漫其修远兮,吾将上下而求索,又到了周末,我继续带各位看官学习回顾Mysql知识。 上次说到了流程控制函数,那就从流程控制函数来继续学习吧! #五.流程控制函数 #1.if函数:if else的效果 IF(条件...
    99+
    2022-05-21
    MySql 流程控制函数 统计函数 分组查询
  • 分析函数
    --row_numberSELECT ename,       deptno,       rownum, ...
    99+
    2024-04-02
  • PHP函数的数据统计函数
    随着互联网技术的不断发展和应用,开发人员需要在Web应用程序中使用各种数据统计和分析功能来了解其应用程序的性能和用户行为。PHP是一种流行的Web编程语言,具有丰富的函数库,包括许多用于数据统计和分析的函数。这篇文章将介绍PHP函数中常用的...
    99+
    2023-05-18
    函数 数据统计 PHP函数
  • Python数据分析与处理(一)--北京高考分数线统计分析
    目录1.1 数据爬取1.2 最高分最低分统计1.3 一本二本理科差值统计1.4 2006—2019年近14年每科分数线的平均值统计前言: 为了帮助广大考生和家长了解高考历...
    99+
    2024-04-02
  • NumPy进行统计分析
    目录1 读/写文件1、二进制的文件读写2、读取文本格式的数据2 使用数组进行简单统计分析1、排序2、去重与重复数据3、常用的统计函数1 读/写文件 NumPy文件读写主要有二进制的文...
    99+
    2023-05-20
    NumPy 统计分析 NumPy 统计
  • oracle 函数之分析函数
    1.分析函数有4个 over row_number dense_rank rank 四个 不能单独使用2.select empno, sal ,deptno,sum(sal) over(o...
    99+
    2024-04-02
  • python DataFrame数据分组统计groupby()函数的使用
    目录groupby()函数1. groupby基本用法1.1 一级分类_分组求和1.2 二级分类_分组求和1.3 对DataFrameGroupBy对象列名索引(对指定列统计计算)2...
    99+
    2024-04-02
  • Oracle分析函数
        聚合函数可以在分析模式或非分析模式下来进行运算。非分析模式下的聚合函数将结果集削减为较少的数据行。然而,在分析模式下,聚合函数并不减少输出结果行数。并且,聚合函数能够在...
    99+
    2024-04-02
  • OpenCV连通域数量统计实例分析
    本文小编为大家详细介绍“OpenCV连通域数量统计实例分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“OpenCV连通域数量统计实例分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。核心代码int ...
    99+
    2023-07-02
  • PHP函数的数据分析函数
    PHP是一种高性能、开源的脚本语言,广泛应用于Web开发中。随着数据分析技术的发展,越来越多的数据需要被处理和分析。PHP提供了一些数据分析函数,可用于处理各种类型的数据。本文将介绍PHP数据分析函数的使用方法和示例。一、统计函数count...
    99+
    2023-05-18
    数据分析 函数 PHP函数
  • 客情分析系统商超顾客年龄性别分析到店次数统计
    智能客行分析平台是基于深度学习的视频结构化分析平台, 它能够为商超、品牌、店铺、展厅提供精确的客流分析。通过量化用户的线下行为,结合大数据分析平台,实现线下线上的相互导流。系统具有准确率高、速度快等性能优势...
    99+
    2024-04-02
  • PHP商城开发中的数据统计分析
    PHP商城开发中的数据统计分析在今天的电商市场中,PHP商城已经成为主流之一。PHP商城不仅仅保证了高效稳定的商城操作,还能为管理员和用户们提供了多种数据统计分析服务。在PHP商城的开发过程中,数据统计分析的重要性不容忽视。本文将详细介绍P...
    99+
    2023-05-23
    PHP 商城 数据统计
  • MySql的回顾三:流程控制函数/统计函数/分组查询
    路漫漫其修远兮,吾将上下而求索,又到了周末,我继续带各位看官学习回顾Mysql知识。 上次说到了流程控制函数,那就从流程控制函数来继续学习吧! #五.流程控制函数 #1.if函数:if else的效果 IF(条件表达式,成立返回...
    99+
    2021-11-26
    MySql的回顾三:流程控制函数/统计函数/分组查询
  • 一条sql实现统计总数、分组分别统计总数
    wshanshi:个人使用记录… 一、 方法一 SELECT COALESCE( sex, '总数' ),COUNT( id ) '人数'FROMtestGROUP BYsex WIT...
    99+
    2023-09-02
    sql 数据库 mysql
  • Oracle分析函数Over()
    Over()分析函数   说明:聚合函数(如sum()、max()等)可以计算基于组的某种聚合值,但是聚合函数对于某个组只能返回一行记录。若想对于某组返回多行记录,则需要使用分析函数。 rank()/dense_rank over...
    99+
    2015-01-23
    Oracle分析函数Over()
  • PHP函数的性能分析函数
    PHP作为一门高度可扩展的编程语言,其强大的函数库拥有众多的特色函数,能够大大提升开发效率。但是在PHP程序性能提升的过程中,我们不仅仅需要考虑优化算法,还需要通过性能分析函数深入挖掘性能瓶颈,提高程序的执行效率。一、函数性能优化的必要性在...
    99+
    2023-05-20
    函数 性能分析 PHP函数
  • 文本分析-使用Python做词频统计分析
    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬...
    99+
    2023-09-01
    数据分析 python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作