百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

互联网面试-MySQL 中的 distinct 和 group by 哪个效率更高?

wptr33 2024-11-09 15:00 41 浏览

在MySQL中我们最常用的去重方式有两种,分别是使用distinct,或者是使用group by进行去重操作,下面我们就来介绍一下这两者之间的区别与联系。

distinct的使用

单列去重

在MySQL中通常使用如下的语法来通过distinct进行单列去重。

SELECT DISTINCT columns FROM table_name WHERE where_conditions;

DISTINCT关键字主要是用来返回不同的值的,也就是说对于相同的值只会返回一个,并且作用于主语句所有列。如果在这个列中具有null的值,并且还对该列使用了distinct语句,那么MySQL只会保留一个null的值。

多列去重

distinct 对于多列的去重操作是根据指定的去重列的信息来进行操作,也就是说只有当所有的参与去重的列的值都相同的时候,才会认为是相同的信息,否则就是不一样的数据。

group by 去重

使用group by 去重语法如下。属于是对单列数据进行去重操作。

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

group by多列去重语法如下。

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

对于使用group by去重操作是将结果先进行分组排列,然后返回分组之后的第一条元素,并且根据group by 后面的字段进行去重。

distinct 和 group by的原理

在大多数的情况下,distinct可以被看做是一个特殊的group by操作,因为其去重的原理都是基于分组进行操作的,并且都可以通过索引扫描来完成。例如下面两条的语句来进行分析一下。

explain select int1_index from test_distinct_groupby group by int1_index;

explain select distinct int1_index from test_distinct_groupby;

其结果对应的extra都是 Using index for group-by。也就是说在语义相同的情况下二者的执行效率是一样的。

这里需要注意的是group by操作在MySQL8.0之前,会默认使用字段进行隐式的排序操作。也就是说在去重的同时还对去重字段进行了排序。而且这种隐式的排序在数据量超过一定大小的时候,会将临时数据拷贝到磁盘上进行操作,这样整个的SQL语句的执行效率会非常低。所以在MySQL8.0开始就放弃了这种隐式排序操作。

结论

在语相同的情况下,group by和distinct 都使用了索引,并且效率相同,在这种情况下两者几乎是等价的。

在语义相同,但没有索引的情况下,distinct的效率要高于group by,原因是distinct和group by都进行了分组操作,但是对于group by来讲,在MySQL8.0之前会进行隐式的排序,这样就会导致 filesort,这样就会导致SQL执行效率比较低。

但是从MySQL8.0开始,MySQL就删除了隐式的排序操作,所以在语义相同的情况,如果没有索引两者的效率是一样的。

为什么要推荐group by的使用呢?

因为相比较distinct来讲,group by更容易被理解,而且由于distinct会对所有的字段都生效,所以在进行一些复杂处理的时候,相比较于group by来说相对灵活。

相关推荐

redis的八种使用场景

前言:redis是我们工作开发中,经常要打交道的,下面对redis的使用场景做总结介绍也是对redis举报的功能做梳理。缓存Redis最常见的用途是作为缓存,用于加速应用程序的响应速度。...

基于Redis的3种分布式ID生成策略

在分布式系统设计中,全局唯一ID是一个基础而关键的组件。随着业务规模扩大和系统架构向微服务演进,传统的单机自增ID已无法满足需求。高并发、高可用的分布式ID生成方案成为构建可靠分布式系统的必要条件。R...

基于OpenWrt系统路由器的模式切换与网页设计

摘要:目前商用WiFi路由器已应用到多个领域,商家通过给用户提供一个稳定免费WiFi热点达到吸引客户、提升服务的目标。传统路由器自带的Luci界面提供了工厂模式的Web界面,用户可通过该界面配置路...

这篇文章教你看明白 nginx-ingress 控制器

主机nginx一般nginx做主机反向代理(网关)有以下配置...

如何用redis实现注册中心

一句话总结使用Redis实现注册中心:服务注册...

爱可可老师24小时热门分享(2020.5.10)

No1.看自己以前写的代码是种什么体验?No2.DooM-chip!国外网友SylvainLefebvre自制的无CPU、无操作码、无指令计数器...No3.我认为CS学位可以更好,如...

Apportable:拯救程序员,IOS一秒变安卓

摘要:还在为了跨平台使用cocos2d-x吗,拯救objc程序员的奇葩来了,ApportableSDK:FreeAndroidsupportforcocos2d-iPhone。App...

JAVA实现超买超卖方案汇总,那个最适合你,一篇文章彻底讲透

以下是几种Java实现超买超卖问题的核心解决方案及代码示例,针对高并发场景下的库存扣减问题:方案一:Redis原子操作+Lua脚本(推荐)//使用Redis+Lua保证原子性publicbo...

3月26日更新 快速施法自动施法可独立设置

2016年3月26日DOTA2有一个79.6MB的更新主要是针对自动施法和快速施法的调整本来内容不多不少朋友都有自动施法和快速施法的困扰英文更新日志一些视觉BUG修复就不翻译了主要翻译自动施...

Redis 是如何提供服务的

在刚刚接触Redis的时候,最想要知道的是一个’setnameJhon’命令到达Redis服务器的时候,它是如何返回’OK’的?里面命令处理的流程如何,具体细节怎么样?你一定有问过自己...

lua _G、_VERSION使用

到这里我们已经把lua基础库中的函数介绍完了,除了函数外基础库中还有两个常量,一个是_G,另一个是_VERSION。_G是基础库本身,指向自己,这个变量很有意思,可以无限引用自己,最后得到的还是自己,...

China's top diplomat to chair third China-Pacific Island countries foreign ministers' meeting

BEIJING,May21(Xinhua)--ChineseForeignMinisterWangYi,alsoamemberofthePoliticalBureau...

移动工作交流工具Lua推出Insights数据分析产品

Lua是一个适用于各种职业人士的移动交流平台,它在今天推出了一项叫做Insights的全新功能。Insights是一个数据平台,客户可以在上面实时看到员工之间的交流情况,并分析这些情况对公司发展的影响...

Redis 7新武器:用Redis Stack实现向量搜索的极限压测

当传统关系型数据库还在为向量相似度搜索的性能挣扎时,Redis7的RedisStack...

Nginx/OpenResty详解,Nginx Lua编程,重定向与内部子请求

重定向与内部子请求Nginx的rewrite指令不仅可以在Nginx内部的server、location之间进行跳转,还可以进行外部链接的重定向。通过ngx_lua模块的Lua函数除了能实现Nginx...