百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Docker存储驱动OverLay2介绍(docker evicted)

wptr33 2025-07-06 17:18 30 浏览

1 overlay2分层介绍

OverlayFS 是一个联合文件系统。

对内核的需求

  • Linux 内核 4.0 或更高版本
  • 或使用3.10.0-514 或更高版本内核的 RHEL 或 CentOS。

更改存储驱动程序会导致本地系统上现有的容器和镜像无法访问。在更改存储驱动程序之前,需要使用 docker save保存已构建的所有镜像,或将其推送到 Docker Hub 或私有镜像仓库,这样以后就无需重新创建它们。

通过docker info可以查看目前docker使用的存储驱动

2 overlay2工作原理

OverlayFS(叠加文件系统)将Linux主机上的两个目录进行分层,并将其呈现为一个统一的目录。这些目录被称为"层"(layers),而统一过程则称为"联合挂载"(union mount)。OverlayFS将下层目录称为"lowerdir",即镜像内的只读层,上层目录称为"upperdir",即创建容器后的可读可写层。最终通过名为"merged"(合并层)的独立目录展示统一后的视图。

在merged目录可以看到容器内所有层的文件信息

下面通过一个表格简述各层之间的关系

层级

作用

特点

lowerdir

只读层(基础层)

通常是镜像或系统的基础文件,所有修改不会影响这一层。对应的是docker镜像层

upperdir

可写层(容器层)

存储对lowerdir的修改(新增、删除、更改文件),所有的变动都保存在这里。对应容器的新增文件。

merged

统一视图层(只读层+可写层)

动态合并lowerdir和upperdir,用户看到的是最终的同一文件系统。对应容器内的根目录

workdir

临时工作目录

workdir 是一个必需的临时工作目录,供 OverlayFS 内部使用,主要用于处理文件操作时的原子性和一致性。当你在容器内创建、修改或删除文件时,OverlayFS 会先在 workdir 中暂存中间状态,确保操作完成后再同步到 upperdir(可写层)。

启动容器后,可以通过mount命令查看到容器的overlay2挂载信息

其中lowerdir共有三个目录,对应镜像中的不同层

查看容器对应的数据目录

docker inspect 9c9b5fdb76e2 --format '
UpperDir:  {{.GraphDriver.Data.UpperDir}}
LowerDir:  {{.GraphDriver.Data.LowerDir}}
MergedDir: {{.GraphDriver.Data.MergedDir}}
WorkDir:   {{.GraphDriver.Data.WorkDir}}'

3 overlay2层数限制

Overlay2存储驱动原生支持最多128个下层OverlayFS镜像层。该特性为Docker层相关操作(如docker build构建镜像和docker commit提交变更)提供了更优异的性能表现,同时能有效减少底层文件系统的inode占用。

(1) 128 层的来源

  • OverlayFS 内核实现中,lowerdir 参数最多支持 128 个路径(以 : 分隔)。
  • 每个 Docker 镜像层(RUN、COPY 等指令生成的层)对应一个 OverlayFS 的 lowerdir。

(2) 层合并示例

假设一个镜像有 3 个层:

FROM ubuntu            # 层1
RUN apt update         # 层2
COPY app /app          # 层3

挂载时:

lowerdir=层3:层2:层1  # 从顶层到底层依次排列

(3) 超出 128 层的处理

  • 若镜像层数超过 128,Docker 会自动合并部分层(通过 flatten 操作),但会牺牲部分效率。
  • 最佳实践:通过多阶段构建或合并指令(如 &&)减少层数。

4 磁盘上的容器和镜像层

下图展示了Docker镜像与容器的分层结构。镜像层作为lowerdir(下层目录),容器层作为upperdir(上层目录)。当镜像存在多个分层时,系统会使用多个lowerdir目录。最终通过名为merged(合并层)的目录呈现统一视图,该目录实质上就是容器的挂载点(容器内的根目录)。

当镜像层与容器层存在相同文件时,容器层(upperdir/上层目录)的文件将优先生效,并遮蔽镜像层中的同名文件。

overlay2驱动在创建容器时,会将代表镜像顶层的目录与新建的容器目录进行联合挂载。镜像各层作为overlay的lowerdir(下层目录)处于只读状态,而新建的容器目录则作为upperdir(上层目录)可写入。

5 在overlay2下容器读写机制

5.1 读取文件

场景一:文件仅存在于镜像层(lowerdir)

当容器尝试读取某个文件时,若该文件不存在于容器层(upperdir),系统会直接从镜像层(lowerdir)读取。此操作产生的性能开销极低。

场景二:文件仅存在于容器层(upperdir)

当容器读取的文件仅存在于容器层(upperdir)而镜像层(lowerdir)中不存在时,系统将直接从容器层读取文件内容。

场景三:文件同时存在于容器层和镜像层

若文件同时存在于容器层(upperdir)和镜像层(lowerdir),系统会优先读取容器层中的文件版本。容器层中的文件始终会遮蔽(override)镜像层中的同名文件。

5.2 修改文件或目录

5.2.1 首次写入文件时处理逻辑

当容器首次对某个已存在的文件执行写操作时(该文件尚未存在于容器层/upperdir),overlay2驱动将执行copy_up操作,把文件从镜像层(lowerdir)完整复制到容器层(upperdir),后续所有修改将作用于容器层中的文件副本。

需特别注意:

  • OverlayFS基于文件层面而非块级别运作,即使仅修改大文件的一小部分,copy_up操作仍会复制整个文件,这可能显著影响容器写入性能
  • copy_up操作仅在该文件首次被修改时触发,后续写入直接作用于容器层中的副本文件
  • 多层镜像结构可能导致文件检索性能下降,尤其当镜像层数较多时

(1) 文件检索的底层机制

当容器访问一个文件(如 /usr/bin/python3)时,OverlayFS 会按以下顺序查找:

  • 从顶层开始向下搜索upperdir(容器可写层)→ 第一层 lowerdir → 第二层 lowerdir → ... → 最底层 lowerdir
  • 首次匹配即返回一旦在某层找到文件,立即终止搜索(类似 PATH 环境变量的查找逻辑)

(2) 性能下降的核心原因

  • 查找路径的线性增长
    • 单层镜像:只需检查 upperdir + 1 个 lowerdir
    • 100 层镜像:最坏情况需检查 upperdir + 100 个 lowerdir
    • 时间复杂度:O(n)(n 为镜像层数)
  • 缓存失效问题
    • Page Cache 局限性:内核缓存(Page Cache)主要优化已访问文件的重复读取,但对首次查找路径无加速效果。
    • 负面案例:若频繁访问不同层级的文件(如容器启动时加载分散在各层的 .so 库),会导致大量目录项(dentry)缓存未命中。

5.2.2 文件与目录的删除逻辑

(1) 文件删除

容器内删除文件时,会在容器层(upperdir)创建空白文件(whiteout file)。镜像层(lowerdir)中的原始文件仍保留(因其只读属性),但空白文件会阻止容器访问该文件

(2) 目录删除

容器内删除目录时,会在容器层生成不透明目录(opaque directory)。其作用机制与空白文件类似,即使该目录仍存在于镜像层,容器也无法访问

5.2.3 目录重命名的限制条件

仅当源路径和目标路径均位于容器顶层(upperdir)时,才能成功调用rename(2)进行目录重命名。否则系统将返回EXDEV错误("跨设备链接不允许")。应用程序需设计相应的异常处理机制,通常需回退到"复制+解除链接"的替代方案。

  • 首次写入采用copy_on_write机制,保持镜像层不可变性
  • 空白文件实现原理:通过字符设备c 0 0标记实现删除效果
  • EXDEV错误源于OverlayFS的存储架构特性,需应用层特殊处理


虽然目录的 rename(2) 系统调用本身受 EXDEV 限制,但 OverlayFS 在用户态模拟了跨层重命名:先通过 copy_up 将整个目录树复制到 upperdir。然后在 upperdir 内部执行原子性重命名


6 参考资料

  • [1] https://docs.docker.com/engine/storage/drivers/overlayfs-driver/

相关推荐

oracle数据导入导出_oracle数据导入导出工具

关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...

继续学习Python中的while true/break语句

上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个...

python continue和break的区别_python中break语句和continue语句的区别

python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...

简单学Python——关键字6——break和continue

Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...

2-1,0基础学Python之 break退出循环、 continue继续循环 多重循

用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...

Python 中 break 和 continue 傻傻分不清

大家好啊,我是大田。...

python中的流程控制语句:continue、break 和 return使用方法

Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...

L017:continue和break - 教程文案

continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...

作为前端开发者,你都经历过怎样的面试?

已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...

面试被问 const 是否不可变?这样回答才显功底

作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...

2023金九银十必看前端面试题!2w字精品!

导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。...

前端面试总结_前端面试题整理

记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...

由浅入深,66条JavaScript面试知识点(七)

作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录...

2024前端面试真题之—VUE篇_前端面试题vue2020及答案

添加图片注释,不超过140字(可选)...

今年最常见的前端面试题,你会做几道?

在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...