SQL查询中笛卡尔积的巧妙使用
wptr33 2024-12-03 18:47 18 浏览
本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。
假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。
笛卡尔积的写法为:
select *
from A,B
或者
select *
from A
cross join B
通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。
with as的用法
在此之前,我们先看一下with as 的用法。
with tmp as
(
select * from class
)
select * from tmp
上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:
https://blog.csdn.net/baidu_30527569/article/details/48680745
例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0
假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:
对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):
查询的SQL为:
select dt, hour, income
from t_h_income
where day = '2020-04-19'
显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:
with t_hour as (
select '00' as dhour
union all
select '01' as dhour
union all
select '02' as dhour
union all
select '03' as dhour
union all
select '04' as dhour
union all
select '05' as dhour
union all
select '06' as dhour
union all
select '07' as dhour
union all
select '08' as dhour
union all
select '09' as dhour
union all
select '10' as dhour
union all
select '11' as dhour
union all
select '12' as dhour
union all
select '13' as dhour
union all
select '14' as dhour
union all
select '15' as dhour
union all
select '16' as dhour
union all
select '17' as dhour
union all
select '18' as dhour
union all
select '19' as dhour
union all
select '20' as dhour
union all
select '21' as dhour
union all
select '22' as dhour
union all
select '23' as dhour
),t_day as
(
select '2020-04-19' as dt
)
select *
from t_day, t_hour
得到的结果如下,生成了这一天每个小时的结构。
将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:
with t_hour as (
select '00' as dhour
union all
select '01' as dhour
union all
select '02' as dhour
union all
select '03' as dhour
union all
select '04' as dhour
union all
select '05' as dhour
union all
select '06' as dhour
union all
select '07' as dhour
union all
select '08' as dhour
union all
select '09' as dhour
union all
select '10' as dhour
union all
select '11' as dhour
union all
select '12' as dhour
union all
select '13' as dhour
union all
select '14' as dhour
union all
select '15' as dhour
union all
select '16' as dhour
union all
select '17' as dhour
union all
select '18' as dhour
union all
select '19' as dhour
union all
select '20' as dhour
union all
select '21' as dhour
union all
select '22' as dhour
union all
select '23' as dhour
),t_day as
(
select '2020-04-19' as dt
)
select *
from t_day, t_hour
select a.dt, a.dhour, case when b.income is null then 0 else b.income end as income
from
(
select dt, dhour
from t_day, t_hour
) a
left join
t_h_income b
on a.dt = b.dt and a.dhour = b.hour
通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:
with t_hour as
(
select '0' as id
union all
select '1' as id
union all
select '2' as id
),
f_hour as (
select '0' as id
union all
select '1' as id
union all
select '2' as id
union all
select '3' as id
union all
select '4' as id
union all
select '5' as id
union all
select '6' as id
union all
select '7' as id
union all
select '8' as id
union all
select '9' as id
)
select concat(a.id, b.id) hour
from t_hour a, f_hour b
where concat(a.id, b.id) <= '23'
order by hour
以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。
例子2-模拟循环:遍历字符串,每行按顺序输出一个字符
注:例子来源于《SQL Cookbook》第6章,经过自己的修改。
问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。
这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:
with t5 as
(
select 1 as pos
union all
select 2 as pos
union all
select 3 as pos
union all
select 4 as pos
union all
select 5 as pos
),
emp as
(
select 'KING' as name
)
select *
from emp, t5
得到的结果如下图所示:
考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:
with t5 as
(
select 1 as pos
union all
select 2 as pos
union all
select 3 as pos
union all
select 4 as pos
union all
select 5 as pos
),
emp as
(
select 'KING' as name
)
select substr(name, pos, 1)
from emp, t5
where t5.pos <= length(emp.name)
可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。
还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:
select
substr(name, pos) char_name1,
substr(name, length(name)-pos+1) char_name1
from emp, t5
where t5.pos <= length(emp.name)
这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。
小结
本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。
https://blog.csdn.net/xiaolinyouni/article/details/6943337
实际中应该有很多类似的场景。
而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。
除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
相关推荐
- 抢先体验Windows 10 20H2新功能,该怎样操作呢?
-
Win10系统通常会在一年当中进行两次重大更新,分别于上下半年分别推出。上半年的更新主要针对功能的变化,而下半年则是提升系统稳定性。最近Win10下半年最重要的更新Windows1020H2已经开...
- 教程:如何关闭Win10/Win8.1/Win7管理共享
-
教程:如何关闭Win10/Win8.1/Win7管理共享出处:IT之家原创(晨风)默认情况下,Windows会创建一些隐藏的共享文件夹,这些文件夹在名称的末尾都有美元“$”标志。当用户在文件资源管理...
- Win11学院:如何强制让Windows 11设备蓝屏
-
IT之家12月15日消息,在Win11系统中蓝屏(BSoD)也称为“停止错误”(StopError)和“错误检查”(BugCheck),通常情况下只有在遇到关键问题的时候才会出现。显然...
- 微软承认Windows 10新BUG:错误显示没有网络连接
-
来源:cnBeta.COM在7月补丁星期二活动中,微软发布的累积更新已经修复Windows10系统中的大量BUG。不过近日,微软承认了存在于Windows10May2020(20H...
- 一课译词:双标(双标英文怎么写)
-
PhotobyMarkusSpiskeonUnsplash“双标[shuāngbiāo]”,网络流行语,完整说法是“双重标准”,翻译为“doublestandard”。“双标”是指“对同...
- 知识科普:USB端口如何禁用和解锁?
-
2015-07-3005:32:00作者:赵为民经常有人会说,我要保护我的笔记本电脑的USB端口,在未经授权的情况下不能够访问。是否有专业的软件可以将USB端口锁死,然后在需要的时候解锁呢?是的,...
- 小迈科技 X Hologres:高可用的百亿级广告实时数仓建设
-
通过本文,我们将会介绍小迈科技如何通过Hologres搭建高可用的实时数仓。一、业务介绍...
- Modbus-RTU通信(modbus rtu rtu over tcp)
-
通常情况下我们做Modbus通信的时候,都会先用测试软件进行测试,等通信测试通过之后,我们才会进行移植,我这边主要讲的是移植到PLC上,我现在这边还没有开始做PLC程序,那先把前期的用测试软件如何测...
- 警惕!利用Github进行水坑攻击安全风险通告
-
2022年5月19日,亚信安全CERT监测发现Github账户为rkxxz的用户发布了CVE-2022-26809和CVE-2022-24500的项目,项目内容介绍为:CVE-2022-26809...
- 手机越用越慢?小编教你如何用黑狱冰箱调教它!
-
看完智趣狗昨天推送的《看完秒懂!这就是Android手机越用越卡的原因!》一文后,我们不难知晓手机越用越慢多是体量更大的APP,以及APP之间相互唤醒而导致资源过度消耗引起的。所以,想让手机恢复高效率...
- 秒杀系统—3.第二版升级优化的技术文档一
-
大纲1.秒杀系统的服务细分和服务定位...
- Redis命令介绍(二十五)HSET & HSETNX
-
HSET将上送的键值对保存在key中存储的哈希表中。如果key不存在则创建一个新的哈希表。如果key已存在,则覆盖。在4.0版本后,HSET支持同时上送多键值对。...
- IDEA用上这十大插件就很舒服(intellij idea插件推荐)
-
本文翻译自国外论坛medium,原文地址:https://medium.com/@xjpp22/top-10-plugins-for-intellij-idea-you-dont-want-to-m...
-
- 常用 Git 命令清单(git常用命令速查表)
-
下面是整理的常用Git命令清单。几个专用名词的译名如下。...
-
2025-07-07 23:38 wptr33
- GitHub|清晰理解本地目录、暂存区、本地仓库、远程仓库的交互
-
GitHub是一个在线平台,旨在促进在一个共同项目上工作的个人之间的代码托管、版本控制和协作。通过该平台,无论何时何地,都可以对项目进行操作(托管和审查代码,管理项目和与世界各地的其他开发者共同开发...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)