百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

「每天一道面试题] Redis底层数据结构

wptr33 2024-12-27 17:15 29 浏览

Redis底层数据结构

Redis 的五大数据类型也称五大数据对象,即分别为 stringlisthashsetzset,但 Redis 并没有直接使用这些结构来实现键值对数据库,而是使用这些结构构建了一个对象系统 redisObject。

这个对象系统包含了五大数据对象,字符串对象(string)、列表对象(list)、哈希对象(hash)、集合(set)对象和有序集合对象(zset);而这五大对象的底层数据编码可以用命令 OBJECT ENCODING 来进行查看。

Redis对象

Redis 基于上述的数据结构自定义一个 Object 系统,Object 结构,即 redisObject 结构:

typedef struct redisObject{
    //类型
    unsigned type:4;
    //编码
    unsigned encoding:4;
    //指向底层实现数据结构的指针
    void *ptr;
    …..
}

Object 系统包含五种 Object:

  • String:字符串对象
  • List:列表对象
  • Hash:哈希对象
  • Set:集合对象
  • ZSet:有序集合

Redis 使用对象来表示数据库中的键和值,即每新建一个键值对,至少创建有两个对象,而且使用对象的具有以下好处:

  1. redis 可以在执行命令前会根据对象的类型判断一个对象是否可以执行给定的命令。
  2. 针对不同的使用场景,为对象设置不同的数据结构实现,从而优化对象的不同场景夏的使用效率。
  3. 对象系统还可以基于引用计数计数的内存回收机制,自动释放对象所占用的内存,或者还可以让多个数据库键共享同一个对象来节约内存。
  4. redis 对象带有访问时间记录信息,使用该信息可以进行优化空转时长较大的 key,进行删除!

对象的 ptr 指针指向对象的底层现实数据结构,而这些数据结构由对象的 encoding 属性决定,对应关系:

编码常量

编码对应的底层数据结构

REDIS_ENCODING_INT

long 类型的整数

REDIS_ENCODING_EMBSTR

embstr 编码的简单动态字符串

REDIS_ENCODING_RAW

简单动态字符串

REDIS_ENCODING_HT

字典

REDIS_ENCODING_LINKEDLIST

双向链表

REDIS_ENCODING_ZIPLIST

压缩列表

REDIS_ENCODING_INTSET

整数集合

REDIS_ENCODING_SKIPLIST

跳跃表和字典

每种 Object 对象至少有两种不同的编码,对应关系:

类型

编码

对象

String

int

整数值实现

String

embstr

sds实现 <=39 字节

String

raw

sds实现 > 39字节

List

ziplist

压缩列表实现

List

linkedlist

双端链表实现

Set

intset

整数集合使用

Set

hashtable

字典实现

Hash

ziplist

压缩列表实现

Hash

hashtable

字典使用

Sorted set

ziplist

压缩列表实现

Sorted set

skiplist

跳跃表和字典

String对象实现

说明

字符串对象底层数据结构实现为简单动态字符串(SDS)和直接存储,但其编码方式可以是 int、raw 或者 embstr,区别在于内存结构的不同。

结构

int编码

字符串保存的是整数值,并且这个正式可以用 long 类型来表示,那么其就会直接保存在 redisObject 的 ptr 属性里,并将编码设置为 int,如图:



raw编码

字符串保存的大于 32 字节的字符串值,则使用简单动态字符串(SDS)结构,并将编码设置为 raw,此时内存结构与 SDS 结构一致,内存分配次数为两次,创建 redisObject 对象和 sdshdr 结构,如图:



embstr编码

字符串保存的小于等于 32 字节的字符串值,使用的也是简单的动态字符串(SDS 结构),但是内存结构做了优化,用于保存顿消的字符串;内存分配也只需要一次就可完成,分配一块连续的空间即可,如图:



String对象之间的编码转换

int 编码的字符串对象和 embstr 编码的字符串对象在条件满足的情况下,会被转换为 raw 编码的字符串对象。比如:对 int 编码的字符串对象进行 append 命令时,就会使得原来是 int 变为 raw 编码字符串。

C字符串与SDS

C 字符串

SDS

获取字符串长度的复杂度为 O(N)

获取字符串长度的复杂度为 O(1)

API 是不安全的,可能会造成缓冲区溢出

API 是安全的,不会造成缓冲区溢出

修改字符串长度 N 次必然需要执行 N 次内存重分配

修改字符串长度 N 次最多执行 N 次内存重分配

只能保存文本数据

可以保存二进制数据和文本文数据

可以使用所有 <String.h> 库中的函数

可以使用一部分 <string.h> 库中的函数

总结

  1. 在 Redis 中,存储 long、double 类型的浮点数是先转换为字符串再进行存储的。
  2. raw 与 embstr 编码效果是相同的,不同在于内存分配与释放,raw 两次,embstr 一次。
  3. embstr 内存块连续,能更好的利用缓存在来的优势。
  4. int 编码和 embstr 编码如果做追加字符串等操作,满足条件下会被转换为 raw 编码;embstr 编码的对象是只读的,一旦修改会先转码到 raw。

List对象

说明

list 对象可以为 ziplist 或者为 linkedlist,对应底层实现 ziplist 为压缩列表,linkedlist 为双向列表。

结构

比如如下结构:

Redis> RPUSH numbers "CcWw" 520 1

用 ziplist 编码的 List 对象结构:



用 linkedlist 编码的 List 对象结构:



压缩表结构

压缩表各部分组成说明如下:

zlbytes:记录整个压缩列表占用的内存字节数,在压缩列表内存重分配,或者计算 zlend 的位置时使用。

zltail:记录压缩列表表尾节点距离压缩列表的起始地址有多少字节,通过该偏移量,可以不用遍历整个压缩列表就可以确定表尾节点的地址。

zllen:记录压缩列表包含的节点数量,但该属性值小于 UINT16_MAX(65535)时,该值就是压缩列表的节点数量,否则需要遍历整个压缩列表才能计算出真实的节点数量。

entryX:压缩列表的节点。

zlend:特殊值 0xFF(十进制 255),用于标记压缩列表的末端。

List对象的编码转换

当 list 对象可以同时满足以下两个条件时,list 对象使用的是 ziplist 编码:

  1. list 对象保存的所有字符串元素的长度都小于 64 字节。
  2. list 对象保存的元素数量小于 512 个。

不能满足这两个条件的 list 对象需要使用 linkedlist 编码。

Hash对象

说明

Hash 对象的编码可以是 ziplist 或者 hashtable,其中,ziplist 底层使用压缩列表实现:

  1. 保存同一键值对的两个节点紧靠相邻,键 key 在前,值 vaule 在后。
  2. 先保存的键值对在压缩列表的表头方向,后来在表尾方向。

hashtable 底层使用字典实现,Hash 对象种的每个键值对都使用一个字典键值对保存:

  1. 字典的键为字符串对象,保存键 key。
  2. 字典的值也为字符串对象,保存键值对的值。

结构

比如 HSET 命令:

redis>HSET author name  "Ccww"
(integer)

redis>HSET author age  18
(integer)

redis>HSET author sex  "male"
(integer)

ziplist 的底层结构:



hashtable 底层结构:



Hash对象的编码转换

当 list 对象可以同时满足以下两个条件时,list 对象使用的是 ziplist 编码:

  1. list 对象保存的所有字符串元素的长度都小于 64 字节。
  2. list 对象保存的元素数量小于 512 个。

不能满足这两个条件的 hash 对象需要使用 hashtable 编码,但这两个条件的上限值是可以修改的,可查看配置文件 hash-max-zaiplist-value 和 hash-max-ziplist-entries。

Set对象

说明

Set 对象的编码可以为 intset 或者 hashtable:

  1. intset 编码:使用整数集合作为底层实现,set 对象包含的所有元素都被保存在 intset 整数集合里面。
  2. hashtable 编码:使用字典作为底层实现,字典键 key 包含一个 set 元素,而字典的值则都为 null。

结构

inset 编码 Set 对象结构:

redis> SAD number  1 3 5



hashtable 编码 Set 对象结构:

redis> SAD Dfruits  “apple”  "banana" " cherry"



Set对象的编码转换

使用 intset 编码:

  1. set 对象保存的所有元素都是整数值。
  2. set 对象保存的元素数量不超过 512 个。

不能满足这两个条件的 Set 对象使用 hashtable 编码。

ZSet对象

说明

ZSet 对象的编码可以为 ziplist 或者 skiplist,ziplist 编码,每个集合元素使用相邻的两个压缩列表节点保存,一个保存元素成员,一个保存元素的分值,然后根据分数进行从小到大排序。

结构

ziplist 编码的 ZSet 对象结构:

Redis>ZADD price 8.5 apple 5.0 banana 6.0 cherry



skiplist 编码的 ZSet 对象使用了 zset 结构,包含一个字典和一个跳跃表:

Type struct zset{
    Zskiplist *zsl;
    dict *dict;
    ...
}

ZSet对象的编码转换

当 ZSet 对象同时满足以下两个条件时,对象使用 ziplist 编码:

  1. 有序集合保存的元素数量小于 128 个。
  2. 有序集合保存的所有元素的长度都小于 64 字节。

不能满足以上两个条件的有序集合对象将使用 skiplist 编码,同时,可以通过配置文件中 zset-max-ziplist-entries 和 zset-max-ziplist-vaule 来改变这个数值。

Redis底层数据结构总结

Redis 的 redisObject 结构如下图:



五大数据类型对应的底层数据结构如下图所示:





相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...