百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MongoDB 高可用集群 -复制集搭建(mongodb拷贝集合命令)

wptr33 2025-05-02 13:51 21 浏览

环境准备

mongodb-4.4.14为例,多台(最少2台)虚拟机

原理

MongoDB复制集由一组MongoDB实例(进程)组成,包含一个Primary节点和多个Secondary节点,MongoDB Driver(客户端)的所有数据都写入Primary,Secondary从Primary同步写入的数据,以保持复制集内所有成员存储相同的数据集,提供数据的高可用。

下图(图片源于MongoDB官方文档)是一个典型的MongoDB复制集,包含一个Primary节点和2个Secondary节点。


数据同步

Primary与Secondary之间通过oplog来同步数据,Primary上的写操作完成后,会向特殊的local.oplog.rs集合写入一条oplog,Secondary不断的从Primary获取新的oplog并应用。

因oplog的数据会不断增加,local.oplog.rs被设置成为一个capped集合,当容量达到配置上限时,会将最旧的数据删除掉。另外考虑到oplog在Secondary上可能重复应用,oplog必须具有幂等性,即重复应用也会得到相同的结果。

如下oplog的格式,包含ts、h、op、ns、o等字段。

    {
      "ts" : Timestamp(1446011584, 2),
      "h" : NumberLong("1687359108795812092"), 
      "v" : 2, 
      "op" : "i", 
      "ns" : "test.nosql", 
      "o" : { "_id" : ObjectId("563062c0b085733f34ab4129"), "name" : "mongodb", "score" : "100" } 
    }
  • ts:操作时间,当前timestamp + 计数器,计数器每秒都被重置。
  • h:操作的全局唯一标识。
  • v:oplog版本信息。
  • op:操作类型。
  • i:插入操作。
  • u:更新操作。
  • d:删除操作。
  • c:执行命令(如createDatabase,dropDatabase)。
  • n:空操作,特殊用途。
  • ns:操作针对的集合。
  • o:操作内容,如果是更新操作。
  • o2:操作查询条件,仅update操作包含该字段。

Secondary初次同步数据时,会先执行init sync,从Primary(或其他数据更新的Secondary)同步全量数据,然后不断通过执行tailable cursor从Primary的local.oplog.rs集合里查询最新的oplog并应用到自身。

异常处理(rollback)

当Primary宕机时,如果有数据未同步到Secondary,并且在Primary重新加入时,新的Primary上已经发生了写操作,则旧Primary需要回滚部分操作,以保证数据集与新的Primary一致。旧Primary将回滚的数据写到单独的rollback目录下,数据库管理员可根据需要使用mongorestore进行恢复。



  • 下载mongodb-4.4.14版本
  • 上传到服务器并解压:/usr/local/mongodb-4.4.14
  • 切换目录到
cd /usr/local/mongodb-4.4.14

在mongodb-4.4.14目录下 创建 conf;data;logs;pids 文件夹(命令:mkdir conf data logs pids)

  • 在conf文件夹下创建mongo.conf(没配置权限认证)
cd conf
  • 配置mongo.conf
#编辑
vim mongo.conf
systemLog:
  quiet: false
  #日志保存路径
  path: /usr/local/mongodb-4.4.14/logs/mongodb.log
  #日志不追加写入(每天生成一个日志文件)
  logAppend: false
  # 日志输出目的地,可以指定为 “file” 或者“syslog”,表述输出到日志文件,如果不指定,则会输出到标准输出中(standard output)
  destination: file

processManagement:
  #开启子进程
  fork: true
  #进程描述文件
  pidFilePath: /usr/local/mongodb-4.4.14/pids/mongodb.pid
net:
  #允许哪些ip访问
  bindIp: 0.0.0.0
  #mongo端口
  port: 37600
  #最大连接数
  maxIncomingConnections: 5000
  #开启输入验证
  wireObjectCheck: true
storage:
  #数据保存路径
  dbPath: /usr/local/mongodb-4.4.14/data
  #是否开启 journal 日志持久存储,journal 日志用来数据恢复,是 mongod 最基础的特性,通常用于故障恢复
  journal:
    enabled: true
  #设置引擎
  engine: wiredTiger
operationProfiling:
  #指定慢查询时间,单位毫秒,如果打开功能,则向system.profile集合写入数据
  slowOpThresholdMs: 300
  #off、slowOp、all,分别对应关闭,仅打开慢查询,记录所有操作
  mode: slowOp

#复制集相关配置
replication:
  replSetName: rs0

#开启数据安全认证模式
#security:
#  keyFile: mongodb-keyfile
#  authorization: enabled

  • 启动MongoDB

切换到MongoDB的bin目录

cd /usr/local/mongodb-4.4.14/bin
#执行启动命令
./mongod -f ../conf/mongo.conf

-----------------每台机器都做以上操作---完成MongoDB的安装--------------

#执行关闭命令
./mongod -f ../conf/mongo.conf --shutdown
  • 连接 MongoDB
cd /usr/local/mongodb-4.4.14/bin
#(随机选择一台机器)无密码连接命令
./mongo --host ip:port
  • 在节点中初始化集群节点
rs.initiate({
	    _id:"rs0",
	    members:[
	        {_id:0, host:"ip:端口", priority:2},
	        {_id:1, host:"ip:端口", priority:1},

					# arbiterOnly节点可选,在服务器台数较少时,不需要此节点
	        {_id:2, host:"ip:端口", arbiterOnly:true}
	    ]
	});

刚执行一小段时间内不会出现主节点,主节点的选举有一个过程

  • 在主节点中添加和删除节点(节点管理)
#添加节点
rs.add({host:"ip:端口"})

#删除节点
rs.remove("ip:端口")
  • not master and slaveok=false”错误解决方法

在SECONDARY节点中,操作数据库时有可能会出现此错误,SECONDARY是不允许读写的,如果非要解决命令如下:

rs.slaveOk();

如果命令过期,按照提示重新修改命令再次执行,这样就副本节点可读

  • 查询数据库列表命令
show dbs

admin 0.000GB

config 0.000GB

local 0.959GB

  • 切换到admin数据库
use admin
  • 创建管理员账号(内主数据库admin)[优先关闭权限认证配置,用户创建成功后再开启权限配置]
db.createUser(
  {
    user: "root",
    pwd: "root123456",
    roles: [ { role: "root", db: "admin" } ]
  }
)
  • admin数据库授权账号
#如果返回1,则表示成功
db.auth("root", "root123456")
  • 退出系统,关闭无密码连接
exit
  • 用密码连接mongodb
./mongo –host localhost:37600 -u "root" --authenticationDatabase "admin" -p
  • 输入密码
root123456

----------------以上完成集群和账号创建
-----------------------------

集群安全认证

  • 关闭集群

先关闭从节点,最后关闭主节点防止主从切换,开启权限验证配置,在配置中打开以下几项配置

#开启数据安全认证模式
security:
	keyFile: mongodb-keyfile
	authorization: enabled
  • mongodb-keyfile文件

生成mongodb-keyfile文件时,切换到MongoDB的bin目录下执行以下命令生成key文件,所有集群都使用一个mongodb-keyfile文件

/usr/local/mongodb-4.4.14/bin
#生成mongodb-keyfile文件命令
openssl rand -base64 741 > mongodb-keyfile

#授权key文件
chmod 600 /usr/local/mongodb-4.4.14/bin/mongodb-keyfile

把mongodb-keyfile文件分别复制到其他机器的
/usr/local/mongodb-4.4.14/bin目录下,并且授权。

  • 开启集群

先启动主节点,在启动从节点;切换到MongoDB的bin目录,执行开启命令:

./mongod -f ../conf/mongo.conf
  • MongoDB复制集群对外的连接地址

mongodb://数据库用户名:数据库用户密码@主数据库ip:端口,从数据库ip1:端口,从主数据库ip2:端口/业务数据库?replicaSet=rs0&authSource=业务数据库&readPerference=secondarypreferred

复制集的读写设置

  • Read Preference

默认情况下,复制集的所有读请求都发到Primary,Driver可通过设置Read Preference来将读请求路由到其他的节点。

1.primary:默认规则,所有读请求发到Primary。

2.primaryPreferred:Primary优先,如果Primary不可达,请求Secondary。

3.secondary:所有的读请求都发到Secondary。

4.secondaryPreferred:Secondary优先,当所有Secondary不可达时,请求Primary。

5.nearest:读请求发送到最近的可达节点上(通过ping探测得出最近的节点)。

  • Write Concern

默认情况下,Primary完成写操作即返回,Driver可通过配置Write Concern来设置写成功的规则,详情请参见Write Concern。如下的write concern规则设置写必须在大多数节点上成功,超时时间为5秒。

#设置方式是针对单个请求    
db.products.insert(
      { item: "envelopes", qty : 100, type: "Clasp" },
      { writeConcern: { w: majority, wtimeout: 5000 } }
    )

#修改副本集默认的write concern,这样就不用单独设置每个请求
cfg = rs.conf()
cfg.settings = {}
cfg.settings.getLastErrorDefaults = { w: "majority", wtimeout: 5000 }
rs.reconfig(cfg)


-------------------MongoDB 高可用集搭 -复制集搭建完成------------------


相关推荐

SQL轻松入门(5):窗口函数(sql语录中加窗口函数的执行)

01前言标题中有2个字让我在初次接触窗口函数时,真真切切明白了何谓”高级”?说来也是一番辛酸史!话说,我见识了窗口函数的强大后,便磨拳擦掌的要试验一番,结果在查询中输入语句,返回的结果却是报错,Wh...

28个SQL常用的DeepSeek提示词指令,码住直接套用

自从DeepSeek出现后,极大地提升了大家平时的工作效率,特别是对于一些想从事数据行业的小白,只需要掌握DeepSeek的提问技巧,SQL相关的问题也不再是个门槛。...

从零开始学SQL进阶,数据分析师必备SQL取数技巧,建议收藏

上一节给大家讲到SQL取数的一些基本内容,包含SQL简单查询与高级查询,需要复习相关知识的同学可以跳转至上一节,本节给大家讲解SQL的进阶应用,在实际过程中用途比较多的子查询与窗口函数,下面一起学习。...

SQL_OVER语法(sql语句over什么含义)

OVER的定义OVER用于为行定义一个窗口,它对一组值进行操作,不需要使用GROUPBY子句对数据进行分组,能够在同一行中同时返回基础行的列和聚合列。...

SQL窗口函数知多少?(sql窗口怎么执行)

我们在日常工作中是否经常会遇到需要排名的情况,比如:每个部门按业绩来排名,每人按绩效排名,对部门销售业绩前N名的进行奖励等。面对这类需求,我们就需要使用sql的高级功能——窗口函数。...

如何学习并掌握 SQL 数据库基础:从零散查表到高效数据提取

无论是职场数据分析、产品运营,还是做副业项目,掌握SQL(StructuredQueryLanguage)意味着你能直接从数据库中提取、分析、整合数据,而不再依赖他人拉数,节省大量沟通成本,让你...

SQL窗口函数(sql窗口函数执行顺序)

背景在数据分析中,经常会遇到按某某条件来排名、并找出排名的前几名,用日常SQL的GROUPBY,ORDERBY来实现特别的麻烦,有时甚至实现不了,这个时候SQL窗口函数就能发挥巨大作用了,窗...

sqlserver删除重复数据只保留一条,使用ROW_NUMER()与Partition By

1.使用场景:公司的小程序需要实现一个功能:在原有小程序上,有一个优惠券活动表。存储着活动产品数据,但因为之前没有做约束,导致数据的不唯一,这会使打开产品详情页时,可能会出现随机显示任意活动问题。...

SQL面试经典问题(一)(sql经典面试题及答案)

以下是三个精心挑选的经典SQL面试问题及其详细解决方案,涵盖了数据分析、排序限制和数据清理等常见场景。这些问题旨在考察SQL的核心技能,适用于初学者到高级开发者的面试准备。每个问题均包含清晰的...

SQL:求连续N天的登陆人员之通用解答

前几天发了一个微头条:...

SQL四大排序函数神技(sql中的排序是什么语句)

在日常SQL开发中,排序操作无处不在。当大家需要排序时,是否只会想到ORDERBY?今天,我们就来揭秘SQL中四个强大却常被忽略的排序函数:ROW_NUMBER()、RANK()、DENSE_RAN...

四、mysql窗口函数之row_number()函数的使用

1、窗口函数之row_number()使用背景窗口函数中,排序函数rank(),dense_rank()虽说都是排序函数,但是各有用处,假如像上章节说的“同组同分”两条数据,我们不想“班级名次”出现“...

ROW_NUMBER()函数(rownumber函数与rank区别)

ROW_NUMBER()是SQL中的一个窗口函数(WindowFunction)...

Dify「模板转换」节点终极指南:动态文本生成进阶技巧(附代码)Jinja2引擎解析

这篇文章是关于Dify「模板转换」节点的终极指南,解析了基于Jinja2模板引擎的动态文本生成技巧,涵盖多源文本整合、知识检索结构化、动态API构建及个性化内容生成等六大应用场景,助力开发者高效利用模...

Python 最常用的语句、函数有哪些?

1.#coding=utf-8①代码中有中文字符,最好在代码前面加#coding=utf-8②pycharm不加可能不会报错,但是代码最终是会放到服务器上,放到服务器上的时候运行可能会报错。③...