百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

「职场面试」数据库常见面试题 (二)-MySQL分库分表

wptr33 2025-03-13 21:06 19 浏览

上期我们讲了索引,MyISAM和InnoDB的选择等相关的数据库面试题目,小伙伴们掌握得怎么样了?这期树懒君决定分享一下分库分表方面的面试题目,这是一个很经典的面试问题哦~

首先,要知道分库分表是两回事儿,大家可别搞混了,可能是光分库不分表,也可能是光分表不分库,都有可能。下面直接上问题!

1.分区方案有哪些?

分区表是由多个相关的底表实现的。这些基础表也由句柄对象表示,因此我们也可以直接访问各个区域,存储引擎管理区域的各个基础表与管理普通表相同(所有基础表都必须使用相同的存储引擎),区域表的索引只是在各个基础表相同的索引。该方案屏蔽了用户的细节,即使查询条件没有sharding column,也能正常工作。

2.MySQL分区能做什么?

  • 分割逻辑数据
  • 提高单一的写作和阅读应用速度。
  • 提高分区范围阅读查询速度。
  • 分割数据能够有多个不同的物理文件路径
  • 高效保存历史数据。

3.分区的类型

  • RANGE区域:根据给定连续区间的列值,将多行分配给区域。mysql根据指定的分割战略,将数据放入不同的表格文件中。相当于文件,被拆成小块。但是,对外给顾客的感觉是表,是透明的。
  • 根据range,每个库的连续数据,这一般在时间范围内,如交易表、销售表等,可以根据年月保管数据。可能会出现热点问题,大量的流量都在最新数据上。
  • 分range的好处是,扩张时很简单。
  • 类似于RANGE分区,每个分区都必须明确定义。其主要区别在于,LIST分区中每个分区的定义和选择是基于某个列的值从属于一个列的值集中在一个列的值中,而RANGE分区从属于一个连续区间值集中在一起。
  • 根据用户定义的表现式回归值进行选择的区域,将该表现式插入表中的列值进行计算。该功能包括MySQL中有效、产生非负整数值的表现。
  • hash分发的优点是,可以平均分配各仓库的数据量和请求压力的缺点是扩麻烦,有数据转移的过程,以前的数据需要重新计算hash值,重新分配到不同的库和表。
  • KEY分区:类似于HASH区域,KEY区域只支持计算一列或多列,MySQL服务器提供自己的哈希函数。必须有一列或多列包含整数值。

4.为什么大部分互联网不使用分区,而是自己分库分表?

许多资源受单体限制,如连接数量、网络吞吐等。如何进行隔断,在实际应用中是十分关键的要素之一。

5.为什么要分库分表?

从性能上看

随着单库数据量越来越大,数据库查询QPS越来越高,数据库读写所需的时间也越来越多。数据库的读写性能可能成为业务发展的瓶颈。相应地,需要优化数据库的性能。本文只讨论数据库水平的优化,不讨论缓存等应用水平的优化手段。

如果数据库查询QPS过高,就需要考虑拆库,通过分库分担单个数据库的连接压力。例如,如果查询QPS为3500,假设单个库可以支持1000个连接数,则可以考虑将其分成4个库来分散查询连接压力。

单表数据量过大时,数据量超过一定量级后,无论是数据查询还是数据更新,在索引优化等纯数据库水平的传统优化手段后,都可能存在性能问题。这是量的变化产生了质的变化。此时,有必要改变解决问题的想法。例如,从数据生产的源头、数据处理的源头解决问题。既然数据量很大,我们就分别治疗,成零。这产生了分钟,将数据按照一定的规则分成多个钟表,解决了在钟表环境下无法解决的访问性能问题。

从可用性上看

如果单个数据库发生事故,很可能会丢失所有数据。特别是在云时代,许多数据库都在虚拟机上行驶。如果虚拟机/宿主机发生事故,可能会造成无法挽回的损失。因此,除了传统的Master-Slave、Master-Master等部署水平,还可以考虑从数据分割水平解决这个问题。

此处我们以数据库宕机为例:

  • 单库部署情况下,如果数据库宕机,那么故障影响就是100%,而且恢复可能耗时很长。
  • 如果我们拆分成2个库,分别部署在不同的机器上,此时其中1个库宕机,那么故障影响就是50%,还有50%的数据可以继续服务。
  • 如果我们拆分成4个库,分别部署在不同的机器上,此时其中1个库宕机,那么故障影响就是25%,还有75%的数据可以继续服务,恢复耗时也会很短。

当然,我们也不能无限制的拆库,这也是牺牲存储资源来提升性能、可用性的方式,毕竟资源总是有限的。

6. 如何分库分表(分库?分表?还是既分库又分表?)

分库分表方案可以分为下面3种

7. 如何对数据进行切分?

通常根据垂直拆分、水平拆分两种方式进行划分,当然,一些复杂的业务场景也可能选择两者结合的方式。

垂直拆分

垂直分表通常根据业务功能的使用频率,将主要受欢迎的字段放在一起作为主要表。然后,将不常用的东西根据各自的业务属性聚集起来,分成不同的次要表的主要表和次要表的关系一般是一对一的。

水平拆分(数据分片)

单表容量不超过500W,否则建议分级。将一块手表复制成同一块手表结构的不同手表,按照一定的规则将数据分别保存在这些手表中,保证手表的容量不太大,提高性能的当然,这些结构相同的手表可以放在一个或多个数据库中。

水平分割的几种方法:

  • 使用MD5哈希,加密UIDmd5,取前几名(在这里取前两名),然后将不同的UID哈希放入不同的用户表中。
  • 根据时间可以放入不同的表。例如,article_201601、article_201602。
  • 按热度拆分,点击率高的词条生成各自的表,低热的词条放在大表中,低热的词条达到一定的贴数后,将低热的表单独分割成表。
  • 根据ID的值加入对应的表格,第一个表格user_0000,第二个100万用户数据加入第二个表格user_0001,随着用户的增加,直接加入用户表格即可。


欢迎点击下方“了解更多

相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...