玩转Redis—如何高效访问Redis中的海量数据
wptr33 2024-12-31 15:02 35 浏览
推荐阅读:
1、前言
??Redis以高性能著称,但性能再好,在面对海量数据时,若不正确的使用,也终将会有性能瓶颈,甚至造成服务宕机。
在实际项目中你是否会有以下疑问?
- 如何访问Redis中的海量数据,却不影响其他请求访问Redis?
- Redis中有百万/千万数据,如何高效访问?
- Redis中数据量太大,如何既保证快速访问,又不至于使服务宕机?
以上问题亦是Redis面试的高频问题。
2、思考
Q1:为什么Redis中的数据量很大时,某些数据操作会导致Redis卡顿,甚至宕机?
A1:Redis是单线程服务,所有指令都是顺序执行,当某一指令耗时很长时,就会阻塞后续的指令执行。当被积压的指令越来越多时,Redis服务占用CPU将不断升高,最终导致Redis实例崩溃甚至服务器宕机。
Q2:利用万能的keys命令查询任何想查的数据?
A2:自己电脑几万条数据玩玩就好了,线上使用keys命令,Excuse me?你想卷铺盖走人了吧。
++“某公司php工程师执行redis keys * 导致数据库宕机! 技术部发生2起本年度PO级特大事故,造成公司资金损失400万。”++ 这条新闻记忆犹新,警钟长鸣!
Q3:Redis中海量数据的正确操作方式
A3:利用SCAN系列命令(SCAN、SSCAN、HSCAN、ZSCAN)完成数据迭代。
??Redis的【SCAN系列命令】你了解多少呢?
3、SCAN系列命令详解
??SCAN系列命令,并不单纯指代SCAN命令,还包含SSCAN、HSCAN、ZSCAN,每种命令操作对象是有区别的,但用法及功能基本相同。
3.1、SCAN系列命令对比分析
- cursor:迭代游标;
- MATCH:数据匹配模式;
- COUNT:迭代返回数量;
3.2、SCAN系列命令注意事项
- SCAN的参数没有key,因为其迭代对象是DB内数据;
- 返回值都是数组,第一个值都是下一次迭代游标;
- 时间复杂度:每次请求都是O(1),完成所有迭代需要O(N),N是元素数量;
- 可用版本:version >= 2.8.0;
3.3、SCAN系列命令详解
3.3.1、 增量迭代,可用于生产环境
- 并不像KEYS、SMEMBERS一样是全量迭代,对大集合执行时可能阻塞服务很长时间;
3.3.2、不保证准确结果
- SMEMBERS可以返回整个set的元素,而SCAN这类增量迭代命令可能出现迭代过程中元素被改变,所以并不能保证准确的返回结果;
3.3.3、基于游标迭代
- SCAN基于游标迭代,每次请求将返回下一次需要使用的游标;
- 游标cursor可以比DB元素总量大,可以为负数;
- 错误游标:使用间断(不是迭代返回的)、负数、超出范围或其他非法游标,迭代不会报错,可能产生未定义行为(无法保证准确性);
3.3.4、迭代结束标记
- SCAN返回的游标不一定递增,某次迭代返回的元素数量可能为0;
- 返回元素列表为空,不代表迭代结束;
- 一个完整的迭代:SCAN游标从0开始,返回游标为0结束;
- 迭代状态由返回的游标控制。可以并发执行迭代;可随时终止迭代;
3.3.5、迭代完整性
- 遍历开始到遍历结束一直存在的数据,一定能被迭代返回;
- 同一个元素可能返回多次,数据去重应由应用程序完成;
- 在迭代过程中增删的元素,可能返回,可能不返回;
- 当数据类型是sets(由integer组成)、hashes、sorted sets且集合较小时,迭代将返回整个集合的数据,与count无关;
- 迭代结束保证:元素添加速率小于迭代速率。
3.3.6、why有时迭代直接返回整个集合
- 底层数据结构是hash时,如果数据量较小,Redis有内存优化策略,会使用紧凑的压缩编码。此时SCAN操作并不是返回有意义的游标,而是迭代整个集合;
- 数据量较小?参见官方memory-optimization(内存优化)说明。
3.3.7、参数count说明
- count默认值是10;
- 数据集较大时,如果没有使用match,返回元素为count或比count略大;
- 每次迭代的count参数值可以不同,只要使用上次迭代返回的游标即可;
3.3.8、参数match说明
- 和keys的pattern类似;
- MATCH操作是在检索出数据到返回元素前的期间执行,所以如果被匹配的元素较少,那么可能多次迭代返回的元素列表均为空;
4、SCAN系列命令示例
4.1、SCAN示例
??详见《5.2、部分问题解答》
4.2、SSCAN示例
// SSCAN示例 @zxiaofan 127.0.0.1:6378> SADD sscantest sscantest:1 1 sscantest:2 2 sscantest:3 3 sscantest:4 4 sscantest:1a 1a sscantest:2a 2a sscantest:1ab 1ab sscantest:a1 a1 sscantest:aa1 aa1 (integer) 0 // MATCH ?:无匹配数据 127.0.0.1:6378> SSCAN sscantest 0 MATCH ? COUNT 1 1) "24" 2) (empty list or set) 127.0.0.1:6378> SSCAN sscantest 24 MATCH ? COUNT 1 1) "20" 2) (empty list or set) 127.0.0.1:6378> SSCAN sscantest 0 MATCH * COUNT 1 1) "24" 2) 1) "sscantest:3" 2) "sscantest:2a" 127.0.0.1:6378> SSCAN sscantest 24 MATCH * COUNT 1 1) "20" 2) 1) "a1"
4.3、HSCAN示例
// HSCAN示例 @zxiaofan 127.0.0.1:6378> HMSET hscantest hscantest:1 1 hscantest:2 2 hscantest:3 3 hscantest:4 4 hscantest:1a 1a hscantest:2a 2a hscantest:1ab 1ab hscantest:a1 a1 hscantest:aa1 aa1 OK 127.0.0.1:6378> HSCAN hscantest 0 MATCH hscantest*a COUNT 20 1) "0" 2) 1) "hscantest:1a" 2) "1a" 3) "hscantest:2a" 4) "2a" 127.0.0.1:6378> HSCAN hscantest 0 MATCH hscantest*a COUNT 2 1) "0" 2) 1) "hscantest:1a" 2) "1a" 3) "hscantest:2a" 4) "2a" 127.0.0.1:6378>
??从HSCAN示例可以看出,即使count参数为2,也返回了所有匹配的结果。这就是先前提到的,数据量较小时,直接返回所有数据。
4.4、ZSCAN示例
// ZSCAN示例 @zxiaofan // 【移除】并弹出count个分数最大的元素,count默认为1 127.0.0.1:6378> ZPOPMAX zscantest 20 1) "sscantest:1ab" 2) "6" 3) "sscantest:2a" 4) "5" 5) "sscantest:1a" 6) "4" 7) "sscantest:3" 8) "3" 9) "zscantest:1" 10) "2" 11) "sscantest:2" 12) "2" 13) "test1" 14) "1" 15) "sscantest:1" 16) "1" 127.0.0.1:6378> ZPOPMAX zscantest 20 (empty list or set) 127.0.0.1:6378> ZADD zscantest 1 zscantest:1 2 zscantest:2 3 zscantest:3 4 zscantest:1a 5 zscantest:2a 6 zscantest:1ab 7 zscantest:a1 8 zscantest:aa1 (integer) 8 // NX:不存在才添加;CH:返回被改变(含新增)的元素个数 127.0.0.1:6378> ZADD zscantest NX CH 1 test1 2 zscantest:1 (integer) 1 127.0.0.1:6378> ZSCAN zscantest 0 MATCH *a COUNT 5 1) "0" 2) 1) "zscantest:1a" 2) "4" 3) "zscantest:2a" 4) "5" 127.0.0.1:6378>
5、总结
5.1、看看面试时你能答上几个问题
- SCAN迭代可以并发吗?
- SCAN返回数据为空就是迭代结束了吗?
- 如果首次迭代cursor参数不是0,能实现完整迭代吗?
- 可以严格控制每次迭代返回的数据量吗?
- 迭代返回的数据一定完整吗?
- 为什么迭代返回的元素列表可能为空?
5.2、部分问题解答
5.2.1、SCAN返回数据为空就是迭代结束了吗
// SCAN返回数据为空就是迭代结束了吗? @zxiaofan 127.0.0.1:6378> keys k? 1) "k1" 2) "k2" 127.0.0.1:6378> SCAN 0 MATCH k? 1) "88" 2) (empty list or set) 127.0.0.1:6378> SCAN 88 MATCH k? 1) "34" 2) 1) "k1" 127.0.0.1:6378> SCAN 34 MATCH k? 1) "122" 2) (empty list or set) 127.0.0.1:6378> SCAN 122 MATCH k? 1) "14" 2) (empty list or set) 127.0.0.1:6378> SCAN 14 MATCH k? 1) "33" 2) (empty list or set) 127.0.0.1:6378> SCAN 33 MATCH k? 1) "53" 2) (empty list or set) 127.0.0.1:6378> SCAN 53 MATCH k? 1) "93" 2) (empty list or set) 127.0.0.1:6378> SCAN 93 MATCH k? 1) "107" 2) 1) "k2" 127.0.0.1:6378> SCAN 107 MATCH k? 1) "79" 2) (empty list or set) 127.0.0.1:6378> SCAN 79 MATCH k? 1) "0" 2) (empty list or set) 127.0.0.1:6378>
??看上述示例,匹配“k?”的数据实际有2条“k1”、“k2”,在整个迭代过程中,多次返回数据为空,但是迭代未曾结束(因为“k1”、“k2”没有全部迭代返回)。
??所以,只有当游标返回为0时,才能说明迭代结束了。
5.2.2、如果首次迭代cursor参数不是0,能实现完整迭代吗?
// 如果首次迭代cursor参数不是0,能实现完整迭代吗? @zxiaofan 127.0.0.1:6378> keys k? 1) "k1" 2) "k2" 127.0.0.1:6378> SCAN 66 MATCH k? 1) "122" 2) (empty list or set) 127.0.0.1:6378> SCAN 122 MATCH k? 1) "14" 2) (empty list or set) 127.0.0.1:6378> SCAN 14 MATCH k? 1) "33" 2) (empty list or set) 127.0.0.1:6378> SCAN 33 MATCH k? 1) "53" 2) (empty list or set) 127.0.0.1:6378> SCAN 53 MATCH k? 1) "93" 2) (empty list or set) 127.0.0.1:6378> SCAN 93 MATCH k? 1) "107" 2) 1) "k2" 127.0.0.1:6378> SCAN 107 MATCH k? 1) "79" 2) (empty list or set) 127.0.0.1:6378> SCAN 79 MATCH k? 1) "0" 2) (empty list or set) 127.0.0.1:6378>
??看上述示例,匹配“k?”的数据实际有2条“k1”、“k2”,当第一次SCAN使用cursor为66,我们可以发现经过多次迭代,游标返回为0时,“k1”一直未曾被迭代返回。
??所以,如果首次迭代cursor参数不是0,不能实现完整迭代。
??完整迭代必须是游标从0开始,游标到0结束。
6、后记
??本文针对Redis的SCAN系列命令做了详细的对比分析以及实际使用示例,并整理了面试中的高频问题。建议阅读本文的同学实际动手练习下,效果更好。
作者:zxiaofan
链接:https://juejin.im/post/5dd10fde518825291f38e7a8
相关推荐
- redis的八种使用场景
-
前言:redis是我们工作开发中,经常要打交道的,下面对redis的使用场景做总结介绍也是对redis举报的功能做梳理。缓存Redis最常见的用途是作为缓存,用于加速应用程序的响应速度。...
- 基于Redis的3种分布式ID生成策略
-
在分布式系统设计中,全局唯一ID是一个基础而关键的组件。随着业务规模扩大和系统架构向微服务演进,传统的单机自增ID已无法满足需求。高并发、高可用的分布式ID生成方案成为构建可靠分布式系统的必要条件。R...
- 基于OpenWrt系统路由器的模式切换与网页设计
-
摘要:目前商用WiFi路由器已应用到多个领域,商家通过给用户提供一个稳定免费WiFi热点达到吸引客户、提升服务的目标。传统路由器自带的Luci界面提供了工厂模式的Web界面,用户可通过该界面配置路...
- 这篇文章教你看明白 nginx-ingress 控制器
-
主机nginx一般nginx做主机反向代理(网关)有以下配置...
- 如何用redis实现注册中心
-
一句话总结使用Redis实现注册中心:服务注册...
- 爱可可老师24小时热门分享(2020.5.10)
-
No1.看自己以前写的代码是种什么体验?No2.DooM-chip!国外网友SylvainLefebvre自制的无CPU、无操作码、无指令计数器...No3.我认为CS学位可以更好,如...
- Apportable:拯救程序员,IOS一秒变安卓
-
摘要:还在为了跨平台使用cocos2d-x吗,拯救objc程序员的奇葩来了,ApportableSDK:FreeAndroidsupportforcocos2d-iPhone。App...
- JAVA实现超买超卖方案汇总,那个最适合你,一篇文章彻底讲透
-
以下是几种Java实现超买超卖问题的核心解决方案及代码示例,针对高并发场景下的库存扣减问题:方案一:Redis原子操作+Lua脚本(推荐)//使用Redis+Lua保证原子性publicbo...
- 3月26日更新 快速施法自动施法可独立设置
-
2016年3月26日DOTA2有一个79.6MB的更新主要是针对自动施法和快速施法的调整本来内容不多不少朋友都有自动施法和快速施法的困扰英文更新日志一些视觉BUG修复就不翻译了主要翻译自动施...
- Redis 是如何提供服务的
-
在刚刚接触Redis的时候,最想要知道的是一个’setnameJhon’命令到达Redis服务器的时候,它是如何返回’OK’的?里面命令处理的流程如何,具体细节怎么样?你一定有问过自己...
- lua _G、_VERSION使用
-
到这里我们已经把lua基础库中的函数介绍完了,除了函数外基础库中还有两个常量,一个是_G,另一个是_VERSION。_G是基础库本身,指向自己,这个变量很有意思,可以无限引用自己,最后得到的还是自己,...
- China's top diplomat to chair third China-Pacific Island countries foreign ministers' meeting
-
BEIJING,May21(Xinhua)--ChineseForeignMinisterWangYi,alsoamemberofthePoliticalBureau...
- 移动工作交流工具Lua推出Insights数据分析产品
-
Lua是一个适用于各种职业人士的移动交流平台,它在今天推出了一项叫做Insights的全新功能。Insights是一个数据平台,客户可以在上面实时看到员工之间的交流情况,并分析这些情况对公司发展的影响...
- Redis 7新武器:用Redis Stack实现向量搜索的极限压测
-
当传统关系型数据库还在为向量相似度搜索的性能挣扎时,Redis7的RedisStack...
- Nginx/OpenResty详解,Nginx Lua编程,重定向与内部子请求
-
重定向与内部子请求Nginx的rewrite指令不仅可以在Nginx内部的server、location之间进行跳转,还可以进行外部链接的重定向。通过ngx_lua模块的Lua函数除了能实现Nginx...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)