百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

为什么删除记录表文件不会减小?(记录插入与删除在磁盘的变化)

wptr33 2025-05-03 16:58 17 浏览

如果你熟悉 MySQL 缓冲池(不熟悉可以查看 一条 sql 的执行过程详解),可能会觉得是因为删除操作只更新到缓冲池和 redo log,并没有进行 flush 落盘,但如果关闭数据库,触发 flush ,会发现表文件大小还是不会改变,这是为什么?

原因

首先要了解数据的存储方式,存储方式共有两种,是由参数 innodb_file_per_table 来控制的。

off:共享表结构,表示所有的文件数据存储在同一个文件中,这样在删除整张表后空间也不会被回收,只是被位置被标记为可重用,下次创建表可能就在该位置创建。

on:表示每张表的数据各用一个文件来存储,在删除整张表后该文件也会被回收,减小总占用空间。这也是默认的使用方式。如果存储引擎是 InnoDB ,那么数据文件就是.ibd 格式的,如果是 MyISAM,那么文件就是 .MYD 格式的。


虽然执行 drop 删除表时会减小表文件大小,但在删除记录时还是不能减小结构,这个原因与上面的 off 共享表结构很像,因为 数据页是 InnoDB 管理数据的最小的磁盘单位,数据页就相当于上面的 "一张表的数据",因为一张表的数据页都是存在同一个文件中的,所以在执行 delete 删除数据后只会将将改位置标记可重用,并不会回收,而如果删除整个页,那么也只能将该页标记为可重用而不会回收。这种删除了但是没有被回收的位置就称为 "数据空洞"。

页合并与页分裂

页合并:既然产生了数据空洞,那么数据文件将会变得越来越大,这样是很不利的,所以 MySQL 会在数据空洞达到一定比例后出触发 "页合并",触发的页会找最靠近的可以合并的页进行合并来优化空间(只会将数据页使用权腾出来,并不会减小表文件大小),防止后续的数据插入使用更多的数据页造成文件更大。

页分裂:页分裂是在插入操作时操作的记录主键 ID 在原本的记录之间产生的,因为记录存储在数据页中,如果该数据页没有合适的位置来存储这条记录,那么就会将该条记录以及后面的记录另开要一个数据页来存储。

优化:因为页合并和页分裂都需要消耗额外的性能。所以我们在插入数据时应当按主键递增顺序插入(主键可以使用自增ID 或 雪花算法,但如果业务字段有唯一字段且没有其他索引,那么可以使用其作为主键来避免每次查询都需要回表),删除数据时按主键顺序删除。

如何减小表文件

1、自动触发的页合并。

2、手动触发清理大部分的数据空洞(5.6 的 Online DDL 可能会存一些写操作,可能会产生一些数据空洞),具体做法就是执行 "Alter table 表名 engine = InnoDB",因为 Alter 语句是修改表结构,而执行一个空修改操作就可以在不修改结构的情况下将数据空洞清除。具体原理是会先创建一个临时表,将当前表中的所有记录依次添加到临时表中,最后再将临时表替换原表的表。但是重建表并一定就是最紧凑的,因为在重建时每个数据页会留 1/16 用于更新,同时 5.6 后可能还会在向临时表迁移数据时积累一些写操作造成页分裂。而在这过程中不能有其他操作干扰,比如修改数据、读数据,所以在执行此操作时会添加 MDL 写锁,而在执行读写操作时会添加 MDL 读,两者互斥。

作者:萌新J

原文链接:
https://www.cnblogs.com/mengxinJ/p/14184458.html

相关推荐

MySql系列-常用命令

本篇是对...

Record.ToTable 格式转换

本期案例对表格格式进行转换,前后转换效果如下:解题套路1.Record.ToTable解题思路:思路就是构造可以透视的样式。使用Record.ToTable对行记录进行转换,获得包含两列的表,首行可以...

Table.Group 按时期累计计算唯一值

本期案例是根据不同id进行汇总统计:组内,相同日期的为一组,统计“from”、“to”中的非重复个数;连续日期的,统计累计数。前后转换效果如下:解题套路1.Table.Group...

MySQL 9.1正式发布,有哪些值得关注的新特性?

MySQL创新版9.1.0于2024年10月15日正式发布。此外,MySQL8.0.40及8.4.3补丁版本也同时发布。8.4.3是目前MySQL的LTS长期支持版本,该版本中将不会增加新的功能与特性...

SQL基本语句练习(基础版)

最近在学习SQL基本语句的练习,在此分享一下笔者做过的练习以及个人的解决教程:首先是基本练习表格的搭建,具体内容如下表所示:...

SQL 从入门到精通:全面掌握数据库操作

学习SQL(StructuredQueryLanguage)是掌握数据库操作的关键步骤。SQL是一种用于管理和处理关系型数据库的标准语言,广泛应用于数据检索、插入、更新和删除等操作。以下是一些...

ClickHouse学习笔记四ClickHouse基础语法

前言这里我们介绍ClickHouse的基本语法,使用环境是腾讯云的ClickHouse。默认情况下,ClickHouse在进行集群纬度执行建表等DDL操作时需要手动添加ONCLUSTERX...

程序员总结的常用sql语句大全

多年经验程序员总结的我们一般需要使用的sql语句,赶快收藏起来,方便以后使用。以下是一些常用的SQL语句及其用法:一、数据定义语言(DDL)创建库CREATEDATABASE:创建一个新数据库。...

PQ03-分组求和

目标已知:销售清单求:每个销售员的销量合计方法数据准备...

好荐:一款数据库元数据管理平台工具

“元数据”的定义在不同的软件、项目、工程的定义范围都不太一样。本文这里指的是软件项目开发使用的数据库表结构信息。我今天介绍的这个开源项目叫Databasir,它是一个面向团队的关系型数据库模型文档管理...

MySQL 8.0 SQL优化黑科技,面试官都不一定知道!

前言提到SQL优化,大多数人想到的还是那些经典套路:建索引、避免全表扫描、优化JOIN顺序…这些确实是基础,但如果你还停留在MySQL5.7时代的优化思维,那就out了。MySQL8.0已经发布好...

MySQL数据库深度优化指南:从基础到架构层面的20个关键策略

一、核心性能优化原则数据最小化原则...

动物源性食品中兽药残留的检测——喹啉类药物残留

喹啉类药物(quinoxaline)是具有喹啉-N1,N4-二氧化物基本结构的一类化学合成的动物专用药,具有广谱抗菌、提高饲料转化率和促生长作用。1965年德国拜耳公司以邻硝基苯胺为原料合成喹乙醇(o...

适合普通开发者和产品经理的PHP应用模板开发AI的SaaS应用框架

简单到傻!Liang_SaaS适合普通开发者和产品经理的PHP应用模板开发AI的SaaS应用框架,利用Php开发AI的SaaS应用框架,是一个强大的内容管理仪表板模板,基于Bootstrap和...

Power Query 交错合并表格的方法

两张表格合并成一张表格,需要交错排列,表1取一行,表2取一行,这样排列在一起:前提是两张表的行数相同,内容排列顺序相同:我们来看两张表:表1:12列10行表2:11列10行行数相同列数不同,我们在数据...