第 20 章:索引与性能优化 - PostgreSQL入门
wptr33 2025-09-09 13:40 4 浏览
到目前为止,我们已经学习了如何设计表、保证数据完整性、以及如何用各种方式查询数据。但当我们的表从几十行增长到几百万、甚至上亿行时,一个之前只需要 0.1 秒的查询,可能会变成需要几分钟甚至几小时的“灾难”。
这时,我们就必须进入数据库性能优化的领域了。而在这个领域中,最核心、最立竿见影的工具,就是索引 (Index)。
什么是索引?
想象一本很厚的书,比如一本字典。如果你想查找一个词,你肯定不会从第一页开始一页一页地往后翻。你更有可能会利用书前面的“目录”或“索引”,它会告诉你某个词在哪一页,让你能直接翻到那一页。
数据库索引的工作原理与此非常相似。它是一个独立于数据表、专门用于加速查询的数据结构。当你对某(几)个列创建索引后,数据库会维护这个索引结构。当你用这些列作为 WHERE 条件进行查询时,数据库就可以利用索引快速地“定位”到符合条件的行,而不需要扫描整张表(这个过程被称为“全表扫描”,Full Table Scan)。
索引的代价
索引并非没有成本。它就像书的目录一样,本身也需要占用存储空间。更重要的是,当你对表进行 INSERT, UPDATE, DELETE 操作时,数据库不仅要修改表中的数据,还必须同时更新对应的索引结构,这会带来额外的写操作开销。
所以,索引是一把双刃剑:它能极大地加速**读(SELECT)操作,但会稍微降低写(INSERT, UPDATE, DELETE)**操作的性能。
何时使用索引?
- 列经常出现在 WHERE 子句中。
- 列经常出现在 ORDER BY 子句中。
- 列经常被用于 JOIN 的 ON 条件中。
- 列的“基数”(Cardinality,即不重复值的数量)很高。给一个只有“男”、“女”两个值的性别列创建索引,效果通常不大。
20.1 创建索引 (CREATE INDEX)
基本语法:
CREATE INDEX index_name ON table_name (column1, column2, ...);
场景:在我们的 users 表中,username 和 email 字段经常被用来查询。虽然它们已经因为 UNIQUE 约束而自动创建了索引,但我们这里可以手动模拟一下。
-- 为 users 表的 username 列创建一个名为 idx_users_username 的索引
CREATE INDEX idx_users_username ON users (username);
- 给索引起一个有意义的名字(如 idx_表名_列名)是一个非常好的习惯。
多列索引(复合索引)
我们也可以在一个索引中包含多个列。这对于那些 WHERE 子句中经常同时出现多个列的查询非常有用。
-- 为 orders 表的 user_id 和 order_date 创建一个复合索引
CREATE INDEX idx_orders_user_date ON orders (user_id, order_date);
这个索引对于 WHERE user_id = ? AND order_date > ? 这样的查询会非常高效。
20.2 B-Tree, Hash, GiST, GIN 等索引类型简介
PostgreSQL 提供了多种不同算法的索引类型,以适应不同的查询场景。CREATE INDEX 的完整语法是 CREATE INDEX ... ON ... USING method (...)。
- B-Tree (默认): 这是最通用、最重要的索引类型。当你执行 CREATE INDEX 而不指定 USING 子句时,默认创建的就是 B-Tree 索引。
- 适用场景:几乎所有常规场景!特别适用于 =、>、<、>=、<=、BETWEEN、IN 以及 LIKE 'prefix%' (前缀匹配) 的查询。我们之前创建的所有索引都是 B-Tree 索引。
- Hash: Hash 索引只能处理精确相等 (=) 的查询。它的构建速度和查询速度在某些特定情况下可能比 B-Tree 更快,但功能非常有限,且无法保证数据崩溃后的安全性(需要手动 REINDEX),所以不常用。
- GiST (Generalized Search Tree): 一种通用的索引结构,可以用来实现很多种不同的索引策略。它最著名的应用是在 PostGIS 扩展中,用于加速地理空间数据的查询(比如“找出我附近 5 公里内的所有餐馆”)。
- GIN (Generalized Inverted Index): 倒排索引。它天生就是为了处理那些“一个字段包含多个值”的情况而生的。
- 适用场景:
- 全文搜索 (Full-text Search):当你想实现像搜索引擎那样的文本搜索时。
- 数组 (ARRAY):加速对数组元素的查询(比如 tags @> ARRAY['sql'])。
- JSONB:加速对 JSONB 内部键值的查询(比如 profile ->> 'name' = '张三')。
- 示例:为 articles 表的 tags 数组字段创建一个 GIN 索引。
- CREATE INDEX idx_articles_tags_gin ON articles USING GIN (tags);
20.3 使用EXPLAIN和EXPLAIN ANALYZE分析查询计划
创建了索引,我们怎么知道它是否真的被数据库使用了呢?答案是——查看查询计划 (Query Plan)。
查询计划是数据库决定如何执行一个查询的“作战方案”。EXPLAIN 命令就是用来显示这个方案的。
EXPLAIN: 只显示计划,不实际执行查询。
EXPLAIN ANALYZE: 实际执行查询,并显示计划以及真实的执行时间、返回行数等信息。这是分析慢查询的终极武器。
场景:我们来分析一个查询是否用到了索引。
第一步:没有索引的情况
EXPLAIN ANALYZE
SELECT * FROM users WHERE username = 'zhangsan';
你可能会看到类似这样的输出:
QUERY PLAN
-------------------------------------------------------------------------------------------------------------
Gather (cost=1000.00..2053.93 rows=1 width=100) (actual time=0.5... rows=1 loops=1)
Workers Planned: 2
Workers Launched: 2
-> Parallel Seq Scan on users (cost=0.00..1053.83 rows=1 width=100) (actual time=0.1... rows=1 loops=3)
Filter: (username = 'zhangsan'::text)
Planning Time: 0.1 ms
Execution Time: 0.6 ms
关键在于 Seq Scan on users,这表示数据库进行了顺序扫描(全表扫描)。
第二步:创建索引
CREATE INDEX idx_users_username ON users (username);
第三步:再次分析
EXPLAIN ANALYZE
SELECT * FROM users WHERE username = 'zhangsan';
现在,输出应该会变成这样:
QUERY PLAN
--------------------------------------------------------------------------------------------------------------------
Index Scan using idx_users_username on users (cost=0.42..8.44 rows=1 width=100) (actual time=0.02... rows=1 loops=1)
Index Cond: (username = 'zhangsan'::text)
Planning Time: 0.2 ms
Execution Time: 0.05 ms
看到 Index Scan using idx_users_username 了吗?这清楚地表明,数据库使用了我们创建的索引,并且 Execution Time (执行时间) 大大减少了!
本章小结
你已经掌握了数据库性能优化的核心武器!
- 我们理解了索引是什么,以及它在加速读和减速写之间的权衡。
- 学会了用 CREATE INDEX 来为表创建单列或多列索引。
- 了解了 PostgreSQL 提供的多种索引类型,特别是默认的 B-Tree 和用于处理数组、JSONB、全文搜索的 GIN 索引。
- 掌握了使用 EXPLAIN ANALYZE 这一终极武器来分析查询计划,验证我们的索引是否生效。
索引是数据库性能调优的起点,也是最重要的一环。一个精心设计的索引策略,能让你的应用在数据量增长时依然保持响应迅速。
到此,我们教程的第四部分也已完成。从下一章开始,我们将进入第五部分:PostgreSQL 高级特性与管理。我们将学习事务、用户角色、函数、备份恢复等更深入的话题。准备好成为一个更全面的 PostgreSQL 专家了吗?我们下一章见!
相关推荐
- 第 28 章:核心功能 SQL 查询 - PostgreSQL入门
-
欢迎来到我们史诗级教程的最终章!在上一章,我们成功地构建了博客系统的数据库骨架。现在,这个结构精良的数据库正静静地等待着我们去使用它。...
- postgresql的6种索引介绍_postgresql默认用户名和密码
-
postgresql几种索引PostgreSQL支持多种索引类型,每种索引的设计原理、适用场景和优缺点各有不同。以下是对主要索引类型的详细介绍:...
- 第 20 章:索引与性能优化 - PostgreSQL入门
-
到目前为止,我们已经学习了如何设计表、保证数据完整性、以及如何用各种方式查询数据。但当我们的表从几十行增长到几百万、甚至上亿行时,一个之前只需要0.1秒的查询,可能会变成需要几分钟甚至几小时的“灾...
- PostgreSQL 主从复制 完整指南_主从复制mysql
-
PostgreSQL主从复制(StreamingReplication)完整指南PostgreSQL主从复制是一种实时同步数据的机制,可以实现高可用性(HA)、读写分离和负载均衡。其...
- PostgreSQL监控神器,千万注意这5大关键指标!
-
PostgreSQL监控神器,千万注意这5大关键指标!在当今数据驱动的业务环境中,数据库的性能和稳定性直接关系到企业的运营效率与用户体验。PostgreSQL作为一款功能强大的开源关系型数据库,被广泛...
- Retool 如何升级主应用 4TB 的 PostgreSQL 数据库
-
本文最初发布于Retool官方博客。...
- PostgreSQL查询计划_postgresql查询计划中的cost组成
-
深入解析PostgreSQL查询计划:优化性能的关键在数据库管理系统中,查询计划是执行SQL查询时的关键组成部分。PostgreSQL作为一款功能强大的开源关系型数据库,其查询计划的生成与优化对于提升...
- 第 27 章:数据库与表结构实现 - PostgreSQL入门
-
在上一章,我们已经绘制好了博客系统的宏伟蓝图。现在,是时候戴上安全帽,化身“建筑工程师”,将图纸上的设计一砖一瓦地搭建成真实的数据库结构了。...
- PostgreSQL事务处理_postgresql时区问题
-
PostgreSQL事务处理:原理、应用与优化引言...
- 第 14 章:集合运算 (UNION, INTERSECT, EXCEPT) - PostgreSQL入门
-
在之前的章节里,我们所有的操作(JOIN...
- PostgreSQL 安装指南及日常使用_postgresql 11安装
-
PostgreSQL安装与日常使用PostgreSQL是一款功能强大、开源的对象关系型数据库,支持高级SQL标准、扩展功能、事务完整性和高并发。本指南涵盖安装、配置、日常使用、性能优化、常见...
- 第 23 章:函数与存储过程 (PL/pgSQL) - PostgreSQL入门
-
到目前为止,我们与数据库的交互方式都是从外部客户端(如psql...
- PostgreSQL是不是你的下一个JSON数据库?
-
根据Betteridge定律(任何头条的设问句可以用一个词来回答:不是),除非你的JSON数据很少修改,并且查询很多。最新版的PostgreSQL添加更多对JSON的支持,我们曾经问过PostgreS...
- "揭秘PostgreSQL:你必须掌握的数据类型全解析!"
-
揭秘PostgreSQL:你必须掌握的数据类型全解析!在数据库管理系统中,PostgreSQL以其强大的功能和稳定性而著称。为了充分发挥其性能,理解并熟练掌握其数据类型是至关重要的。本文将深入探讨Po...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
程序员的开源月刊《HelloGitHub》第 71 期
-
假如有100W个用户抢一张票,除了负载均衡办法,怎么支持高并发?
-
详细介绍一下Redis的Watch机制,可以利用Watch机制来做什么?
-
Java面试必考问题:什么是乐观锁与悲观锁
-
如何将AI助手接入微信(打开ai手机助手)
-
redission YYDS spring boot redission 使用
-
SparkSQL——DataFrame的创建与使用
-
一文带你了解Redis与Memcached? redis与memcached的区别
-
如何利用Redis进行事务处理呢? 如何利用redis进行事务处理呢英文
-
- 最近发表
-
- 第 28 章:核心功能 SQL 查询 - PostgreSQL入门
- postgresql的6种索引介绍_postgresql默认用户名和密码
- 第 20 章:索引与性能优化 - PostgreSQL入门
- PostgreSQL 主从复制 完整指南_主从复制mysql
- PostgreSQL监控神器,千万注意这5大关键指标!
- Retool 如何升级主应用 4TB 的 PostgreSQL 数据库
- PostgreSQL查询计划_postgresql查询计划中的cost组成
- 第 27 章:数据库与表结构实现 - PostgreSQL入门
- 谁帮我看看,为啥我的PostgreSQL查询速度这么慢???
- PostgreSQL事务处理_postgresql时区问题
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)