百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

面试必问-分布式技术:限流、通讯、缓存,你都懂了吗?

wptr33 2025-03-05 22:05 14 浏览

分布式可以说是在面试当中肯定会问到的问题,有些小伙伴也开始准备接下来的面试了,所以今天特地来总结一波分布式技术专题面试,限流、通讯、缓存:Nginx+ZooKeeper+ActiveMQ+Kafka+RabbitMQ+memcached+MongoDB+Redis等,通通帮你拿下。

01 分布式限流:Nginx+ZooKeeper

1.1 分布式限流之Nginx

  • 请解释一下什么是 Nginx?
  • 请列举 x Nginx 的一些特性。
  • 请列举 x Nginx 和 和 Apache 之间的不同点
  • 请解释 x Nginx 如何处理 P HTTP 请求。
  • 在 x Nginx 中,如何使用未定义的服务器名称来阻止处理请求?
  • 使用 “ 反向代理服务器 ”
  • 请列举 x Nginx 服务器的最佳用途。
  • 请解释 x Nginx 服务器上的 r Master 和 和 r Worker 进程分别是什么?
  • 请解释你如何通过不同于 0 80 的端口开启 Nginx?
  • 请解释是否有可能将 x Nginx 的错误替换为 2 502 错误?
  • 在 x Nginx 中,解释如何在 L URL 中保留双斜线? ?
  • 请解释 e ngx_http_upstream_module 的作用是什么?
  • 请解释什么是 K C10K 问题?
  • 请陈述 s stub_status 和 和 r sub_filter 指令的作用是什么?
  • 解释 x Nginx 是否支持将请求压缩到上游?
  • 解释如何在 x Nginx 中获得当前的时间?
  • 用 x Nginx 服务器解释s -s 的目的是什么?
  • 解释如何在 x Nginx 服务器上添加模块?

分布式限流之Nginx的答案解析如下


for:Nginx+常见应用技术指南[Nginx++Tips]+第二版

1.2 分布式限流之ZooKeeper

  • ZooKeeper 是什么?
  • ZooKeeper 提供了什么?
  • Zookeeper 文件系统
  • 四种类型的 znode
  • Zookeeper 通知机制
  • Zookeeper 做了什么?
  • zk 的命名服务(文件系统)
  • zk 的配置管理(文件系统、通知机制)
  • Zookeeper 集群管理(文件系统、通知机制)
  • Zookeeper 分布式锁(文件系统、通知机制)
  • 获取分布式锁的流程
  • Zookeeper 队列管理(文件系统、通知机制)
  • Zookeeper 数据复制
  • Zookeeper 工作原理
  • zookeeper 是如何保证事务的顺序一致性的?
  • Zookeeper 下 Server 工作状态
  • zookeeper 是如何选取主 leader 的?
  • 分布式通知和协调
  • 机器中为什么会有 leader?
  • zk 节点宕机如何处理?
  • Zookeeper 同步流程
  • zookeeper 负载均衡和 nginx 负载均衡区别
  • zookeeper watch 机制

分布式限流之ZooKeeper的答案解析如下


for:ZK开发手册


02 分布式通讯:ActiveMQ+Kafka+RabbitMQ

2.1 分布式通讯之ActiveMQ

  • 什么是 ActiveMQ?
  • ActiveMQ 服务器宕机怎么办?
  • 丢消息怎么办?
  • 持久化消息非常慢
  • 消息的不均匀消费。
  • 死信队列。
  • ActiveMQ 中的消息重发时间间隔和重发次数吗?

分布式通讯之ActiveMQ的答案解析如下:


for:手写RocketMQ笔记


2.2 分布式通讯之kafka

  • Kafka 的设计时什么样的呢?
  • 数据传输的事物定义有哪三种?
  • Kafka 判断一个节点是否还活着有那两个条件?
  • producer 是否直接将数据发送到 broker 的 leader(主节点)?
  • Kafa consumer 是否可以消费指定分区消息?
  • Kafka 消息是采用 Pull 模式,还是 Push 模式?
  • Kafka 存储在硬盘上的消息格式是什么?
  • Kafka 高效文件存储设计特点:
  • Kafka 与传统消息系统之间有三个关键区别
  • Kafka 创建 Topic 时如何将分区放置到不同的 Broker 中
  • Kafka 新建的分区会在哪个目录下创建
  • partition 的数据如何保存到硬盘
  • kafka 的 ack 机制
  • Kafka 的消费者如何消费数据
  • 消费者负载均衡策略
  • 数据有序
  • kafaka 生产数据时数据的分组策略

分布式通讯之kafka的答案解析如下:


for:Kafka源码解析与实战


2.3 分布式通讯之RabbitMQ

  • RabbitMQ 中的 broker 是指什么?cluster 又是指什么?
  • 什么是元数据?元数据分为哪些类型?包括哪些内容?与 cluster 相关的元数据有哪些?元数据是如何保存的?元数据在 cluster 中是如何分布的?
  • RAM node 和 disk node 的区别?
  • RabbitMQ 上的一个 queue 中存放的 message 是否有数量限制?
  • RabbitMQ 概念里的 channel、exchange 和 queue 这些东东是逻辑概念,还是对应着进程实体?这些东东分别起什么作用?
  • vhost 是什么?起什么作用?
  • 在单 node 系统和多 node 构成的 cluster 系统中声明 queue、exchange ,以及进行 binding 会有什么不同?
  • 客户端连接到 cluster 中的任意 node 上是否都能正常工作?
  • cluster 中 node 的失效会对 consumer 产生什么影响?若是在 cluster 中创建了mirrored queue ,这时 node 失效会对 consumer 产生什么影响?
  • 能够在地理上分开的不同数据中心使用 RabbitMQ cluster 么?
  • 为什么 heavy RPC 的使用场景下不建议采用 disk node ?
  • 向不存在的 exchange 发 publish 消息会发生什么?向不存在的 queue 执行consume 动作会发生什么?
  • routing_key 和 binding_key 的最大长度是多少?
  • RabbitMQ 允许发送的 message 最大可达多大?
  • 什么情况下 producer 不主动创建 queue 是安全的?
  • “dead letter”queue 的用途?
  • 为什么说保证 message 被可靠持久化的条件是 queue 和 exchange 具有durable 属性,同时 message 具有 persistent 属性才行?
  • 什么情况下会出现 blackholed 问题?
  • 如何防止出现 blackholed 问题?
  • Consumer Cancellation Notification 机制用于什么场景?
  • Basic.Reject 的用法是什么?
  • 为什么不应该对所有的 message 都使用持久化机制?
  • RabbitMQ 中的 cluster、mirrored queue,以及 warrens 机制分别用于解决什么问题?存在哪些问题?

分布式通讯之RabbitMQ的答案解析如下:


for:RabbitMQ实战指南


03 分布式缓存:memcached+MongoDB+Redis

3.1 分布式缓存之memcached

  • memcached 是怎么工作的?
  • memcached 最大的优势是什么?
  • memcached 和服务器的 local cache (比如 PHP 的 的 APC 、mmap 文件等)相比,有什么优缺点?
  • memcached 和 和 MySQL 的 的 query cache 相比,有什么优缺点?
  • memcached 的 的 cache 机制是怎样的?
  • memcached 如何实现冗余机制?
  • 我需要把 memcached 中的 item 批量导出导入,怎么办?
  • memcached 如何处理容错的?
  • 如何将 memcached 中 中 item 批量导入导出?
  • memcached 是如何做身份验证的?
  • memcached 的多线程是什么?如何使用它们?
  • memcached 能接受的 key 的最大长度是多少?
  • memcached 对 对 item 的过期时间有什么限制?
  • memcached 最大能存储多大的单个 item ?
  • 为什么单个 item 的大小被限制在 1M byte 之内?

分布式缓存之memcached的答案解析如下:


3.2 分布式缓存之MongoDB

  • 你说的 NoSQL 数据库是什么意思?NoSQL 与 RDBMS 直接有什么区别?为什么要使用和不使用NoSQL 数据库?说一说 NoSQL 数据库的几个优点?
  • NoSQL 数据库有哪些类型?
  • MySQL 与 MongoDB 之间最基本的差别是什么?
  • 你怎么比较 MongoDB、CouchDB 及 CouchBase?
  • MongoDB 成为最好 NoSQL 数据库的原因是什么?
  • 32 位系统上有什么细微差别?
  • journal 回放在条目(entry)不完整时(比如恰巧有一个中途故障了)会遇到问题吗?
  • 分析器在 MongoDB 中的作用是什么?
  • 名字空间(namespace)是什么?
  • 如果用户移除对象的属性,该属性是否从存储层中删除?
  • 能否使用日志特征进行安全备份?
  • 允许空值 null 吗?
  • 更新操作立刻 fsync 到磁盘?
  • 如何执行事务/加锁?
  • 为什么我的数据文件如此庞大?
  • 启用备份故障恢复需要多久?
  • 什么是 master 或 primary?
  • 什么是 secondary 或 slave?
  • 我必须调用 getLastError 来确保写操作生效了么?
  • 我应该启动一个集群分片(sharded)还是一个非集群分片的 MongoDB 环境?
  • 分片(sharding)和复制(replication)是怎样工作的?
  • 数据在什么时候才会扩展到多个分片(shard)里?
  • 当我试图更新一个正在被迁移的块(chunk)上的文档时会发生什么?
  • 如果在一个分片(shard)停止或者很慢的时候,我发起一个查询会怎样?
  • 我可以把 moveChunk 目录里的旧文件删除吗?
  • 我怎么查看 Mongo 正在使用的链接?
  • 如果块移动操作(moveChunk)失败了,我需要手动清除部分转移的文档吗?
  • 如果我在使用复制技术(replication),可以一部分使用日志(journaling)而其他部分则不使用吗?
  • 当更新一个正在被迁移的块(Chunk)上的文档时会发生什么?
  • MongoDB 在 A:{B,C}上建立索引,查询 A:{B,C}和 A:{C,B}都会使用索引吗?
  • 如果一个分片(Shard)停止或很慢的时候,发起一个查询会怎样?
  • MongoDB 支持存储过程吗?如果支持的话,怎么用?
  • 如何理解 MongoDB 中的 GridFS 机制,MongoDB 为何使用 GridFS 来存储文件?

分布式缓存之MongoDB的答案解析如下:


for:MongoDB权威指南


3.3 分布式缓存之Redis

  • redis 简介
  • 为什么要用 redis /为什么要用缓存(高性能、高并发)
  • 为什么要用 redis 而不用 map/guava 做缓存?
  • redis 和 memcached 的区别
  • redis 常见数据结构以及使用场景分析(String、Hash、List、Set、Sorted Set
  • redis 设置过期时间
  • redis 内存淘汰机制(MySQL里有2000w数据,Redis中只存20w的数据,如何保证Redis中的数据都是热点数据?
  • redis 持久化机制(怎么保证 redis 挂掉之后再重启数据可以进行恢复
  • redis 事务
  • Redis 常见异常及解决方案(缓存穿透、缓存雪崩、缓存预热、缓存降级
  • 分布式环境下常见的应用场景(分布式锁、分布式自增 ID
  • Redis 集群模式(主从模式、哨兵模式、Cluster 集群模式
  • 如何解决 Redis 的并发竞争 Key 问题
  • 如何保证缓存与数据库双写时的数据一致性?

分布式缓存之Redis的答案解析如下:


for:Redis设计与实现


最后

以上分享的全部分布式技术专题+面试解析+相关的手写和学习的笔记pdf,皆有高清完整版的。如果你需要麻烦三连,评论留言(666)

还有更多Java笔记如下:Java进阶架构核心手册—V终极版

相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...