数仓|Hive条件函数与日期函数全面解析
wptr33 2024-12-23 14:04 22 浏览
条件函数
assert_true(BOOLEAN condition)
- 解释
如果condition不为true,则抛出异常,否则返回null
- 使用案例
select assert_true(1<2) -- 返回null
select assert_true(1>2) -- 抛出异常
coalesce(T v1, T v2, ...)
- 解释
返回第一个不为null的值,如果都为null,则返回null
- 使用案例
select coalesce(null,1,2,null) -- 返回1
select coalesce(1,null) -- 返回1
select coalesce(null,null) -- 返回null
if(BOOLEAN testCondition, T valueTrue, T valueFalseOrNull)
- 解释
如果testCondition条件为true,则返回第一个值,否则返回第二个值
- 使用案例
select if(1 is null,0,1) -- 返回1
select if(null is null,0,1) -- 返回0
isnotnull(a)
- 解释
如果参数a不为null,则返回true,否则返回false
- 使用案例
select isnotnull(1) -- 返回true
select isnotnull(null) -- 返回false
isnull(a)
- 解释
与isnotnull相反,如果参数a为null,则返回true,否则返回false
- 使用案例
select isnull(null) -- 返回true
select isnull(1) -- 返回false
nullif(a, b)
- 解释
如果参数a=b,返回null,否则返回a值(Hive2.2.0版本)
- 使用案例
select nullif(1,2) -- 返回1
select nullif(1,1) -- 返回null
nvl(T value, T default_value)
- 解释
如果value的值为null,则返回default_value默认值,否则返回value的值。在null值判断时,可以使用if函数给定默认值,也可以使用此函数给定默认值,使用该函数sql特别简洁。
- 使用案例
select nvl(1,0) -- 返回1
select nvl(null,0) -- 返回0
日期函数
add_months(DATE|STRING|TIMESTAMP start_date, INT num_months)
- 解释
start_date参数可以是string, date 或者timestamp类型,num_months参数时int类型。返回一个日期,该日期是在start_date基础之上加上num_months个月,即start_date之后null_months个月的一个日期。如果start_date的时间部分的数据会被忽略。注意:如果start_date所在月份的天数大于结果日期月的天数,则返回结果月的最后一天的日期。
- 使用案例
select add_months("2020-05-20",2); -- 返回2020-07-20
select add_months("2020-05-20",8); -- 返回2021-01-20
select add_months("2020-05-31",1); -- 返回2020-06-30,5月有31天,6月只有30天,所以返回下一个月的最后一天
current_date
- 解释
返回查询时刻的当前日期
- 使用案例
select current_date() -- 返回当前查询日期2020-05-20
current_timestamp()
- 解释
返回查询时刻的当前时间
- 使用案例
select current_timestamp() -- 2020-05-20 14:40:47.273
datediff(STRING enddate, STRING startdate)
- 解释
返回开始日期startdate与结束日期enddate之前相差的天数
- 使用案例
select datediff("2020-05-20","2020-05-21"); -- 返回-1
select datediff("2020-05-21","2020-05-20"); -- 返回1
date_add(DATE startdate, INT days)
- 解释
在startdate基础上加上几天,然后返回加上几天之后的一个日期
- 使用案例
select date_add("2020-05-20",1); -- 返回2020-05-21,1表示加1天
select date_add("2020-05-20",-1); -- 返回2020-05-19,-1表示减一天
date_sub(DATE startdate, INT days)
- 解释
在startdate基础上减去几天,然后返回减去几天之后的一个日期,功能与date_add类似
- 使用案例
select date_sub("2020-05-20",1); -- 返回2020-05-19,1表示减1天
select date_sub("2020-05-20",-1); -- 返回2020-05-21,-1表示加1天
date_format(DATE|TIMESTAMP|STRING ts, STRING fmt)
- 解释
将date/timestamp/string类型转换为一个具体格式化的字符串。
- 使用案例
select date_format('2020-05-20', 'yyyy'); -- 返回2020
select date_format('2020-05-20', 'MM'); -- 返回05
select date_format('2020-05-20', 'dd'); -- 返回20
-- 返回2020年05月20日 00时00分00秒
select date_format('2020-05-20', 'yyyy年MM月dd日 HH时mm分ss秒') ;
select date_format('2020-05-20', 'yy/MM/dd') -- 返回 20/05/20
dayofmonth(STRING date)
- 解释
返回一个日期或时间的天,与day()函数功能相同
- 使用案例
select dayofmonth('2020-05-20') -- 返回20
extract(field FROM source)
- 解释
提取 day, dayofweek, hour, minute, month, quarter, second, week 或者year的值,field可以选择day, dayofweek, hour, minute, month, quarter, second, week 或者year,source必须是一个date、timestamp或者可以转为 date 、timestamp的字符串。注意:Hive 2.2.0版本之后支持该函数
- 使用案例
select extract(year from '2020-05-20 15:21:34.467'); -- 返回2020,年
select extract(quarter from '2020-05-20 15:21:34.467'); -- 返回2,季度
select extract(month from '2020-05-20 15:21:34.467'); -- 返回05,月份
select extract(week from '2020-05-20 15:21:34.467'); -- 返回21,同weekofyear,一年中的第几周
select extract(dayofweek from '2020-05-20 15:21:34.467'); -- 返回4,代表星期三
select extract(day from '2020-05-20 15:21:34.467'); -- 返回20,天
select extract(hour from '2020-05-20 15:21:34.467'); -- 返回15,小时
select extract(minute from '2020-05-20 15:21:34.467'); -- 返回21,分钟
select extract(second from '2020-05-20 15:21:34.467'); -- 返回34,秒
year(STRING date)
- 解释
返回时间的年份,可以用extract函数替代
- 使用案例
select year('2020-05-20 15:21:34'); -- 返回2020
quarter(DATE|TIMESTAMP|STRING a)
- 解释
返回给定时间或日期的季度,1至4个季度,可以用extract函数替代
- 使用案例
select quarter('2020-05-20 15:21:34'); -- 返回2,第2季度
month(STRING date)
- 解释
返回时间的月份,可以用extract函数替代
- 使用案例
select month('2020-05-20 15:21:34') -- 返回5
day(STRING date),
- 解释
返回一个日期或者时间的天,可以用extract函数替代
- 使用案例
select day("2020-05-20"); -- 返回20
select day("2020-05-20 15:05:27.5"); -- 返回20
hour(STRING date)
- 解释
返回一个时间的小时,可以用extract函数替代
- 使用案例
select hour('2020-05-20 15:21:34');-- 返回15
minute(STRING date)
- 解释
返回一个时间的分钟值,可以用extract函数替代
- 使用案例
select minute('2020-05-20 15:21:34'); -- 返回21
second(STRING date)
- 解释
返回一个时间的秒,可以用extract函数替代
- 使用案例
select second('2020-05-20 15:21:34'); --返回34
from_unixtime(BIGINT unixtime [, STRING format])
- 解释
将将Unix时间戳转换为字符串格式的时间(比如yyyy-MM-dd HH:mm:ss格式)
- 使用案例
select from_unixtime(1589960708); -- 返回2020-05-20 15:45:08
select from_unixtime(1589960708, 'yyyy-MM-dd hh:mm:ss'); -- -- 返回2020-05-20 15:45:08
select from_unixtime(1589960708, 'yyyy-MM-dd'); -- 返回2020-05-20
from_utc_timestamp(T a, STRING timezone)
- 解释
转换为特定时区的时间
- 使用案例
select from_utc_timestamp('2020-05-20 15:21:34','PST'); -- 返回2020-05-20 08:21:34.0
select from_utc_timestamp('2020-05-20 15:21:34','GMT'); -- 返回2020-05-20 15:21:34.0
select from_utc_timestamp('2020-05-20 15:21:34','UTC'); -- 返回2020-05-20 15:21:34.0
select from_utc_timestamp('2020-05-20 15:21:34','DST'); -- 返回2020-05-20 15:21:34.0
select from_utc_timestamp('2020-05-20 15:21:34','CST'); -- 返回2020-05-20 10:21:34.0
last_day(STRING date)
- 解释
返回给定时间或日期所在月的最后一天,参数可以是'yyyy-MM-dd HH:mm:ss' 或者 'yyyy-MM-dd'类型,时间部分会被忽略
- 使用案例
select last_day('2020-05-20 15:21:34'); -- 返回2020-05-31
select last_day('2020-05-20'); -- 返回2020-05-31
to_date(STRING timestamp)
- 解释
返回一个字符串时间的日期部分,去掉时间部分,2.1.0之前版本返回的是string,2.1.0版本及之后返回的是date
- 使用案例
select to_date('2020-05-20 15:21:34'); -- 返回2020-05-20
select to_date('2020-05-20'); -- 返回2020-05-20
to_utc_timestamp(T a, STRING timezone)
- 解释
转换为世界标准时间UTC的时间戳,与from_utc_timestamp类似
- 使用案例
select to_utc_timestamp('2020-05-20 15:21:34', 'GMT'); -- 返回2020-05-20 15:21:34.0
trunc(STRING date, STRING format)
- 解释
截断日期到指定的日期精度,仅支持月(MONTH/MON/MM)或者年(YEAR/YYYY/YY)
- 使用案例
select trunc('2020-05-20', 'YY'); -- 返回2020-01-01,返回年的1月1日
select trunc('2020-05-20', 'MM'); -- 返回2020-05-01,返回月的第一天
select trunc('2020-05-20 15:21:34', 'MM'); -- 返回2020-05-01
unix_timestamp([STRING date [, STRING pattern]])
- 解释
参数时可选的,当参数为空时,返回当前Unix是时间戳,精确到秒。可以指定一个具体的日期,转换为Unix时间戳格式
- 使用案例
-- 返回1589959294
select unix_timestamp('2020-05-20 15:21:34','yyyy-MM-dd hh:mm:ss');
-- 返回1589904000
select unix_timestamp('2020-05-20','yyyy-MM-dd');
weekofyear(STRING date)
- 解释
返回一个日期或时间在一年中的第几周,可以用extract替代
- 使用案例
select weekofyear('2020-05-20 15:21:34'); -- 返回21,第21周
select weekofyear('2020-05-20'); -- 返回21,第21周
next_day(STRING start_date, STRING day_of_week)
- 解释
参数start_date可以是一个时间或日期,day_of_week表示星期几,比如Mo表示星期一,Tu表示星期二,Wed表示星期三,Thur表示星期四,Fri表示星期五,Sat表示星期六,Sun表示星期日。如果指定的星期几在该日期所在的周且在该日期之后,则返回当周的星期几日期,如果指定的星期几不在该日期所在的周,则返回下一个星期几对应的日期
- 使用案例
select next_day('2020-05-20','Mon');-- 返回当前日期的下一个周一日期:2020-05-25
select next_day('2020-05-20','Tu');-- 返回当前日期的下一个周二日期:2020-05-26
select next_day('2020-05-20','Wed');-- 返回当前日期的下一个周三日期:2020-05-27
-- 2020-05-20为周三,指定的参数为周四,所以返回当周的周四就是2020-05-21
select next_day('2020-05-20','Th');
select next_day('2020-05-20','Fri');-- 返回周五日期2020-05-22
select next_day('2020-05-20','Sat'); -- 返回周六日期2020-05-23
select next_day('2020-05-20','Sun'); -- 返回周六日期2020-05-24
该函数比较重要:比如取当前日期所在的周一和周日,通过长用在按周进行汇总数据
select date_add(next_day('2020-05-20','MO'),-7); -- 返回当前日期的周一日期2020-05-18
select date_add(next_day('2020-05-20','MO'),-1); -- 返回当前日期的周日日期2020-05-24
months_between(DATE|TIMESTAMP|STRING date1, DATE|TIMESTAMP|STRING date2)
- 解释
返回 date1 和 date2 的月份差。如果date1大于date2,返回正值,否则返回负值,如果是相减是整数月,则返回一个整数,否则会返回小数
- 使用案例
select months_between('2020-05-20','2020-05-20'); -- 返回0
select months_between('2020-05-20','2020-06-20'); -- 返回-1
-- 相差的整数月
select months_between('2020-06-30','2020-05-31'); -- 返回1
-- 非整数月,一个月差一天
select months_between('2020-06-29','2020-05-31'); -- 返回0.93548387
相关推荐
- Python自动化脚本应用与示例(python办公自动化脚本)
-
Python是编写自动化脚本的绝佳选择,因其语法简洁、库丰富且跨平台兼容性强。以下是Python自动化脚本的常见应用场景及示例,帮助你快速上手:一、常见自动化场景文件与目录操作...
- Python文件操作常用库高级应用教程
-
本文是在前面《Python文件操作常用库使用教程》的基础上,进一步学习Python文件操作库的高级应用。一、高级文件系统监控1.1watchdog库-实时文件系统监控安装与基本使用:...
- Python办公自动化系列篇之六:文件系统与操作系统任务
-
作为高效办公自动化领域的主流编程语言,Python凭借其优雅的语法结构、完善的技术生态及成熟的第三方工具库集合,已成为企业数字化转型过程中提升运营效率的理想选择。该语言在结构化数据处理、自动化文档生成...
- 14《Python 办公自动化教程》os 模块操作文件与文件夹
-
在日常工作中,我们经常会和文件、文件夹打交道,比如将服务器上指定目录下文件进行归档,或将爬虫爬取的数据根据时间创建对应的文件夹/文件,如果这些还依靠手动来进行操作,无疑是费时费力的,这时候Pyt...
- python中os模块详解(python os.path模块)
-
os模块是Python标准库中的一个模块,它提供了与操作系统交互的方法。使用os模块可以方便地执行许多常见的系统任务,如文件和目录操作、进程管理、环境变量管理等。下面是os模块中一些常用的函数和方法:...
- 21-Python-文件操作(python文件的操作步骤)
-
在Python中,文件操作是非常重要的一部分,它允许我们读取、写入和修改文件。下面将详细讲解Python文件操作的各个方面,并给出相应的示例。1-打开文件...
- 轻松玩转Python文件操作:移动、删除
-
哈喽,大家好,我是木头左!Python文件操作基础在处理计算机文件时,经常需要执行如移动和删除等基本操作。Python提供了一些内置的库来帮助完成这些任务,其中最常用的就是os模块和shutil模块。...
- Python 初学者练习:删除文件和文件夹
-
在本教程中,你将学习如何在Python中删除文件和文件夹。使用os.remove()函数删除文件...
- 引人遐想,用 Python 获取你想要的“某个人”摄像头照片
-
仅用来学习,希望给你们有提供到学习上的作用。1.安装库需要安装python3.5以上版本,在官网下载即可。然后安装库opencv-python,安装方式为打开终端输入命令行。...
- Python如何使用临时文件和目录(python目录下文件)
-
在某些项目中,有时候会有大量的临时数据,比如各种日志,这时候我们要做数据分析,并把最后的结果储存起来,这些大量的临时数据如果常驻内存,将消耗大量内存资源,我们可以使用临时文件,存储这些临时数据。使用标...
- Linux 下海量文件删除方法效率对比,最慢的竟然是 rm
-
Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...
- Python 开发工程师必会的 5 个系统命令操作库
-
当我们需要编写自动化脚本、部署工具、监控程序时,熟练操作系统命令几乎是必备技能。今天就来聊聊我在实际项目中高频使用的5个系统命令操作库,这些可都是能让你效率翻倍的"瑞士军刀"。一...
- Python常用文件操作库使用详解(python文件操作选项)
-
Python生态系统提供了丰富的文件操作库,可以处理各种复杂的文件操作需求。本教程将介绍Python中最常用的文件操作库及其实际应用。一、标准库核心模块1.1os模块-操作系统接口主要功能...
- 11. 文件与IO操作(文件io和网络io)
-
本章深入探讨Go语言文件处理与IO操作的核心技术,结合高性能实践与安全规范,提供企业级解决方案。11.1文件读写11.1.1基础操作...
- Python os模块的20个应用实例(python中 import os模块用法)
-
在Python中,...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)