数据库

 首页 > 数据库 > Oracle > oracle函数(评级函数、窗口函数等)分析

oracle函数(评级函数、窗口函数等)分析

分享到:
【字体:
导读:
         摘要:1.评级函数:用于等级、百分点、n分片等。函数说明RANK()返回数据项在分组中的排名,排名相等会在名次中留下空位DENSE_RANK()返回数据项在分组中的排名,排名相等会在名次中不会留下空位CUME_DIST()返回特定值对... SyntaxHighlighter.all()...

oracle函数(评级函数、窗口函数等)分析

1.评级函数:
用于等级、百分点、n分片等。
函数
说明
RANK()
返回数据项在分组中的排名,排名相等会在名次中留下空位
DENSE_RANK()
返回数据项在分组中的排名,排名相等会在名次中不会留下空位
CUME_DIST()
返回特定值对于一组值的位置“cumulative distribution”(累积分布)
PERCENT_RANK()(
返回某个值相对于一组值的百分比排名
NTILE()
返回n分片后的值
ROW_NUMBER()
为每条记录返回一个数字
   www.2cto.com  
RANK()、DENSE_RANK()
RANK()在出现等级相同的元素时预留为空,DENSE_RANK()不会。
Eg:某产品类型有两个并列第一
RANK():第一二为1,第三位3
DENSE_RANK():第一二为1,第三位2
1 SELECT
2 column_name,
3 RANK() OVER (ORDER BY column_name DESC) AS rank,
4 DENSE_RANK() OVER (ORDER BY SUM(column_name) DESC) AS dense_rank
5 FROM table_name
OVER 需要,括号内为编号顺序
注意:order by 时,desc NULL 值排在首位,ASC时NULL值排在末尾
可以通过NULLS LAST、NULLS FIRST 控制
RANK() OVER (ORDER BY column_name DESC NULLS LAST)
PARTITION BY 分组排列顺序
RANK() OVER(PARTITION BY month ORDER BY column_name DESC)
这样,就会按照month 来分,即所需要排列的信息先以month 的值来分组,在分组中排序,各个分组间不干涉
 
ROLLUP、CUBE、GROUP SETS (只显示小计信息) 与 RANK() 结合使用
 CUME_DIST()、PERCENT_RANK()
反百分比函数:PERCENTILE_DISC(x), PERCENTILE_CONT(x)
NTILE()
 
ROW_NUMBER()
ROW_NUMBER()从1开始,为每条记录返回一个数字
SELECT  www.2cto.com  
ROW_NUMBER() OVER (ORDER BY column_name DESC)AS row_name
FROM table_name;
 
2.窗口函数:
可以计算一定范围内、一定值域内、或者一段时间内的累积和以及移动平均值等。
可以结合聚集函数SUM() 、AVG() 等使用。
可以结合FIRST_VALUE() 和LAST_VALUE(),返回窗口的第一个和最后一个值
计算累积和:
 
eg:统计1-12月的累积销量,即1月为1月份的值,2月为1.2月份值的和,3月为123月份的和,12月为1-12月份值的和
SELECT
month,SUM(amount) month_amount,
SUM( SUM(amount)) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS cumulative_amount
FROM table_name
GROUP BY month
ORDER BY month;
其中:
SUM( SUM(amount)) 内部的SUM(amount)为需要累加的值,在上述可以换为 month_amount
ORDER BY month 按月份对查询读取的记录进行排序,就是窗口范围内的排序
ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 定义起点和终点,UNBOUNDED PRECEDING 为起点,表明从第一行开始, CURRENT ROW为默认值,就是这一句等价于:
ROWS UNBOUNDED PRECEDING  www.2cto.com  
PRECEDING:在前  的意思。
FOLLOWING: 在后  的意思。
 
计算前3个月之间的和
SUM( SUM(amount)) OVER (ORDER BY month ROWS BETWEEN 3 PRECEDING AND CURRENT ROW) AS cumulative_amount
也可以
SUM( SUM(amount)) OVER (ORDER BY month 3 PRECENDING) AS cumulative_amount
 
前后一个月之间的和
SUM( SUM(amount)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS cumulative_amount
 
窗体第一条和最后一条的值
FIRST_VALUE(SUM(amount)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS xxxx;
 
LAST_VALUE(SUM(amount)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS xxxx;
这样就可以获得该行上一行和下一行的值
 
3.报表函数:
用于执行跨越分组和组内分区的计算  (这里的组应该指的是 ORDER BY 的分组)
SUM(column_name1) OVER(PARTITION BY  column_name2)
这样,会将数据按column_name2分组,然后求column_name1的和,但在表输出的时候是按ORDER BY 格式输出
这样输出列会重复,例如相同的column_name2 会输出相同的column_name1
 
4.LAG()、LEAD()
获得相对于当前记录指定距离的那条记录的数据
LAG()为向前、LEAD()为向后  www.2cto.com  
LAG(column_name1,1) OVER(ORDER BY column_name2)
 
LEAG(column_name1,1) OVER(ORDER BY column_name2)
这样就获得前一条、后一条的数据
 
5.FIRST、LAST
 获得一个排序分组中的第一个值和组后一个值。可以与分组分组函数结合。
SELECT
MIN(month) KEEP(DENSE_RANK FIRST ORDER BY SUM(amount)) AS highest_sales_month,
MIN(month) KEEP(DENSE_RANK LAST ORDER BY SUM(amount)) AS lows_sales_month
FROM table_name
GROUP BY month
ORDER BY month;
这样就可以求得一年中销量最高和最低的月份。
注意:输出的是月份,但是用SUM(amount)来判断。
6.使用线性回归函数
7.使用假想评级与分布函数
 
 
 
作者 A_zhu
oracle函数(评级函数、窗口函数等)分析
分享到:
ORACLE中使用TRUNC(for dates)简析
ORACLE中使用TRUNC(for dates)简析 1. 1.TRUNC(for dates) TRUNC函数为指定元素而截去的日期值。 其具体的语法格式如下: TRUNC(date[,fmt]) 其中: date 一个日期值 fmt 日期格式,该日期将由指定的元素格式所截去。忽略它则由最近的日期截去 下面是该函数的使用情况: TRUNC(TO_DATE(’24-Nov-1999 08:00 pm’,’dd-...
RHEL5 Linux下Oracle 10 Client的安装明...
RHEL5 Linux下Oracle 10 Client的安装明细 Linux基础版之软件安装 Redhat5版本软件包使用yum管理,因此如果需要增加软件时需要使用联网;如果想从光盘安装,采用如下步骤: 1、 挂载光盘 建立光盘目录mkdir /home/demo/rhel5 挂载光盘镜像文件mount -o loop rhel-server-5.4-i386-dvd.iso/home/demo/rhel5 或使用光盘...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……