Redis大Key问题如何排查?如何解决?
wptr33 2025-03-10 21:10 22 浏览
Redis 大 Key 是指存储在 Redis 中的键值对,其中键对应的 value 占用了较大的内存空间,或者包含了大量的元素。例如,一个存储了数百万个元素的集合(Set)类型的键,或者一个存储了一个很大的字符串(长度可能达到几十 MB 甚至更大)的键都被认为是大 Key。
Redis 大 Key 并没有统一的固定标准,当字符串存储了一个很大的值,例如 10M 以上,或集合存储了一个上百万元素的值,那就认为是 Redis 的大 Key 问题了。
1.主要影响
大 Key 问题造成的主要问题是让 Redis 服务阻塞,无法处理其他命令的响应(客户端可能因此出现请求超时的问题)。因为对大 Key 进行读写操作时,由于需要处理大量的数据,这些操作可能会非常耗时,这就会导致 Redis 主线程被阻塞,无法及时处理其他客户端的请求。
2.常见场景
大 Key 的常见场景有以下几个:
- 缓存大数据(图片和视频元数据):在缓存场景中,可能会将大型的文件内容(如图片、视频元数据)缓存到 Redis 中。例如,一个视频分享网站可能会将视频的详细描述、标签、点赞数、评论数等信息以 JSON 字符串的形式缓存为一个大 Key,方便快速获取视频相关的所有数据。
- 明星或网红粉丝列表:如果使用 ZSet 来存储粉丝和关注列表的话,如果是某些明星或网红的粉丝列表将会很大,可能存储元素超千万甚至是亿级别。
- 商品页所有信息:在电商应用中,可能需要将商品信息,如商品 ID、名称、描述、价格、库存、图片、评价等都缓存到 Redis 中的话,当商品详情和评价(几十上百万条评价)比较多时,这个 Key 就可能变得非常大。
3.排查大Key问题
排查大 Key 的方案有以下几个。
3.1 BIGKEYS
Redis 自带的 BIGKEYS 命令可以查询当前 Redis 中所有 key 的信息,对整个数据库中的键值对大小情况进行统计分析。它会查出每种数据结构的最大 Key,但不能根据某个容量进行筛查。比如说,统计每种数据类型的键值对个数以及平均大小,如下图所示:
3.2 MEMORY USAGE
Redis 4.0+ 后推出了 MEMORY USAGE 命令,该命令可以返回指定 key 的内存使用情况,返回使用的内存的字节数。通过遍历所有的 key 并使用此命令,可以找出占用内存较大的 key。但需要注意的是,对于复杂数据结构(如 List、Set 等),MEMORY USAGE 命令返回的是近似值,因为它采用抽样方式来估算内存使用,如下图所示:
3.3 OBJECT
OBJECT encoding
4.解决大Key问题
大 Key 的解决方案有以下几个。
4.1 拆分大Key
将大 Key 拆分成多个小 Key,分别存储不同部分的数据。这样可以减少单个 Key 的内存占用,提高查询性能,拆分的常用方法有以下几个:
- 按业务逻辑拆分:如果大 Key 是一个包含大量聚合数据的键,可以根据业务逻辑将其拆分为多个小的键。例如,对于一个包含全品类商品销售数据的大 Key,可以按照品类拆分为多个小的键,每个键只存储一个品类的销售数据。
- 按时间范围拆分:对于存储时间序列数据的大 Key,如日志数据或统计数据,可以按照时间范围进行拆分。比如,将一天的日志数据拆分为每小时一个键,这样可以更灵活地管理和删除过期数据。
4.2 使用压缩算法
对于可以压缩的数据类型(如字符串),可以使用压缩算法(如 LZF 等)来减少内存占用。Redis 本身支持一些压缩算法,可以在一定程度上减少大 Key 的内存占用。
4.3 使用合适的数据结构和存储方式
- 考虑使用其他存储系统:如果数据实在太大且不适合存储在 Redis 中,可以考虑将部分数据转移到其他存储系统,如将大型文件存储到分布式文件系统(如 MinIO、Ceph 等),只在 Redis 中保留文件的元数据或引用。
- 优化 Redis 数据结构选择:根据数据的访问模式和特性,选择更合适的 Redis 数据结构。例如,如果一个集合类型的大 Key 主要用于判断元素是否存在,可以考虑使用布谷鸟哈希(Cuckoo Hash)等空间效率更高的数据结构替代传统的集合结构。
4.4 设置合理的过期时间
如果大 Key 中的数据不是一直需要的,可以设置过期时间,让 Redis 在一定时间后自动删除该 Key。这样可以避免大 Key 长期占用内存,导致内存泄漏。
4.5 加强监控和管理
建立对 Redis 的监控系统,实时监测大 Key 的出现和内存使用情况。当发现大 Key 或者内存占用过高时,及时发出预警,以便采取相应的措施进行处理。如 Redis Insights、Prometheus 等,设置对大 key 和内存使用的监控指标。
注意事项:大Key删除
删除大 Key 时要注意,要使用 UNLINK 命令代替 DEL 命令来删除大 Key。UNLINK 命令会立即返回,后台异步删除数据,避免阻塞,如下图所示:
小结
Redis 大 Key 问题会让 Redis 服务阻塞,无法响应其他命令,可能会导致客户端响应超时等问题。排查大 Key 问题可以使用 BIGKEYS、MEMORY USAGE、OBJECT 等命令。它的解决方案有:拆分大 Key、压缩数据、使用合适数据结构和存储方式、设置合理过期时间,以及加强监控和管理等手段。
本文已收录到我的面试小站 [www.javacn.site](https://www.javacn.site),其中包含的内容有:并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、设计模式、消息队列等模块。
相关推荐
- 每天一个编程技巧!掌握这7个神技,代码效率飙升200%
-
“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...
- Git重置到某个历史节点(Sourcetree工具)
-
前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...
- git工作区、暂存区、本地仓库、远程仓库的区别和联系
-
很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...
- 解锁人生新剧本的密钥:学会让往事退场
-
开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...
- Reset local repository branch to be just like remote repository HEAD
-
技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...
- Git恢复至之前版本(git恢复到pull之前的版本)
-
让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...
- 如何将文件重置或回退到特定版本(怎么让文件回到初始状态)
-
技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...
- git如何正确回滚代码(git命令回滚代码)
-
方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...
- [git]撤销的相关命令:reset、revert、checkout
-
基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...
- 利用shell脚本将Mysql错误日志保存到数据库中
-
说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...
- MySQL 9.3 引入增强的JavaScript支持
-
MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...
- python 连接 mysql 数据库(python连接MySQL数据库案例)
-
用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...
- mysql导入导出命令(mysql 导入命令)
-
mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库 mysqldump-u用户名-p数据库名>导出的文件名 mysqldump-uw...
- MySQL-SQL介绍(mysql sqlyog)
-
介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...
- MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南
-
在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
-
- 每天一个编程技巧!掌握这7个神技,代码效率飙升200%
- Git重置到某个历史节点(Sourcetree工具)
- git工作区、暂存区、本地仓库、远程仓库的区别和联系
- 解锁人生新剧本的密钥:学会让往事退场
- Reset local repository branch to be just like remote repository HEAD
- Git恢复至之前版本(git恢复到pull之前的版本)
- 如何将文件重置或回退到特定版本(怎么让文件回到初始状态)
- git如何正确回滚代码(git命令回滚代码)
- [git]撤销的相关命令:reset、revert、checkout
- 利用shell脚本将Mysql错误日志保存到数据库中
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)