SQL查询中笛卡尔积的巧妙使用
wptr33 2024-12-03 18:47 28 浏览
本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。
假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。
笛卡尔积的写法为:
select *
from A,B
或者
select * 
from A 
cross join B通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。
with as的用法
在此之前,我们先看一下with as 的用法。
with tmp as
(
    select * from class
)
select * from tmp上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:
https://blog.csdn.net/baidu_30527569/article/details/48680745
例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0
假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:
对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):
查询的SQL为:
select dt, hour, income
from t_h_income
where day = '2020-04-19'显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:
with t_hour as (
select '00' as dhour
union all 
select '01' as dhour
union all 
select '02' as dhour
union all 
select '03' as dhour
union all 
select '04' as dhour
union all 
select '05' as dhour
union all 
select '06' as dhour
union all 
select '07' as dhour
union all 
select '08' as dhour
union all 
select '09' as dhour
union all 
select '10' as dhour
union all 
select '11' as dhour
union all 
select '12' as dhour
union all 
select '13' as dhour
union all 
select '14' as dhour
union all 
select '15' as dhour
union all 
select '16' as dhour
union all 
select '17' as dhour
union all 
select '18' as dhour
union all 
select '19' as dhour
union all 
select '20' as dhour
union all 
select '21' as dhour
union all 
select '22' as dhour
union all 
select '23' as dhour
),t_day as 
(
select '2020-04-19' as dt
)
select * 
from t_day, t_hour得到的结果如下,生成了这一天每个小时的结构。
将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:
with t_hour as (
select '00' as dhour
union all 
select '01' as dhour
union all 
select '02' as dhour
union all 
select '03' as dhour
union all 
select '04' as dhour
union all 
select '05' as dhour
union all 
select '06' as dhour
union all 
select '07' as dhour
union all 
select '08' as dhour
union all 
select '09' as dhour
union all 
select '10' as dhour
union all 
select '11' as dhour
union all 
select '12' as dhour
union all 
select '13' as dhour
union all 
select '14' as dhour
union all 
select '15' as dhour
union all 
select '16' as dhour
union all 
select '17' as dhour
union all 
select '18' as dhour
union all 
select '19' as dhour
union all 
select '20' as dhour
union all 
select '21' as dhour
union all 
select '22' as dhour
union all 
select '23' as dhour
),t_day as 
(
select '2020-04-19' as dt
)
select * 
from t_day, t_hour
select a.dt, a.dhour, case when b.income is null then 0 else b.income end as income
from
(
select dt, dhour
from t_day, t_hour
) a 
left join 
t_h_income b
on a.dt = b.dt and a.dhour = b.hour通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:
with t_hour as 
(
select '0' as id
union all 
select '1' as id
union all 
select '2' as id 
),
f_hour as (
select '0' as id
union all 
select '1' as id
union all 
select '2' as id
union all 
select '3' as id
union all 
select '4' as id
union all 
select '5' as id
union all 
select '6' as id
union all 
select '7' as id
union all 
select '8' as id
union all 
select '9' as id
)
select concat(a.id, b.id) hour
from t_hour a, f_hour b
where concat(a.id, b.id) <= '23'
order by hour以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。
例子2-模拟循环:遍历字符串,每行按顺序输出一个字符
注:例子来源于《SQL Cookbook》第6章,经过自己的修改。
问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。
这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:
with t5 as 
(
select 1 as pos
union all 
select 2 as pos 
union all
select 3 as pos 
union all
select 4 as pos 
union all
select 5 as pos 
),
emp as 
(
select 'KING' as name
)
select *
from emp, t5得到的结果如下图所示:
考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:
with t5 as 
(
select 1 as pos
union all 
select 2 as pos 
union all
select 3 as pos 
union all
select 4 as pos 
union all
select 5 as pos 
),
emp as 
(
select 'KING' as name
)
select substr(name, pos, 1)
from emp, t5
where t5.pos <= length(emp.name)可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。
还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:
select 
substr(name, pos) char_name1,
substr(name, length(name)-pos+1) char_name1
from emp, t5
where t5.pos <= length(emp.name)这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。
小结
本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。
https://blog.csdn.net/xiaolinyouni/article/details/6943337
实际中应该有很多类似的场景。
而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。
除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
相关推荐
- oracle数据导入导出_oracle数据导入导出工具
 - 
                        
关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...
 
- 继续学习Python中的while true/break语句
 - 
                        
上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个...
 
- python continue和break的区别_python中break语句和continue语句的区别
 - 
                        
python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...
 
- 简单学Python——关键字6——break和continue
 - 
                        
Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...
 
- 2-1,0基础学Python之 break退出循环、 continue继续循环 多重循
 - 
                        
用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...
 
- Python 中 break 和 continue 傻傻分不清
 - 
                        
大家好啊,我是大田。...
 
- python中的流程控制语句:continue、break 和 return使用方法
 - 
                        
Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...
 
- L017:continue和break - 教程文案
 - 
                        
continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...
 
- 作为前端开发者,你都经历过怎样的面试?
 - 
                        
已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...
 
- 面试被问 const 是否不可变?这样回答才显功底
 - 
                        
作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...
 
- 2023金九银十必看前端面试题!2w字精品!
 - 
                        
导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。...
 
- 前端面试总结_前端面试题整理
 - 
                        
记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...
 
- 由浅入深,66条JavaScript面试知识点(七)
 - 
                        
作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录...
 
- 2024前端面试真题之—VUE篇_前端面试题vue2020及答案
 - 
                        
添加图片注释,不超过140字(可选)...
 
- 今年最常见的前端面试题,你会做几道?
 - 
                        
在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...
 
- 一周热门
 
- 最近发表
 - 
- oracle数据导入导出_oracle数据导入导出工具
 - 继续学习Python中的while true/break语句
 - python continue和break的区别_python中break语句和continue语句的区别
 - 简单学Python——关键字6——break和continue
 - 2-1,0基础学Python之 break退出循环、 continue继续循环 多重循
 - Python 中 break 和 continue 傻傻分不清
 - python中的流程控制语句:continue、break 和 return使用方法
 - L017:continue和break - 教程文案
 - 作为前端开发者,你都经历过怎样的面试?
 - 面试被问 const 是否不可变?这样回答才显功底
 
 
- 标签列表
 - 
- git pull (33)
 - git fetch (35)
 - mysql insert (35)
 - mysql distinct (37)
 - concat_ws (36)
 - java continue (36)
 - jenkins官网 (37)
 - mysql 子查询 (37)
 - python元组 (33)
 - mybatis 分页 (35)
 - vba split (37)
 - redis watch (34)
 - python list sort (37)
 - nvarchar2 (34)
 - mysql not null (36)
 - hmset (35)
 - python telnet (35)
 - python readlines() 方法 (36)
 - munmap (35)
 - docker network create (35)
 - redis 集合 (37)
 - python sftp (37)
 - setpriority (34)
 - c语言 switch (34)
 - git commit (34)
 
 
