百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

SQL VS. NoSQL:你需要知道些什么?

wptr33 2025-03-05 22:05 21 浏览

作者:车品觉

导读:

1) 列存储数据库采用的不是“表格”,而是若干个列族(column family),其中包含着若干行。不同于RDBMS,你不需要预先知道所有的列,每行也未必拥有相同数量的列。

2)文档数据库并不把数据存储到表格的行和列中,而是存储到文档中,然后将这些文档汇集在集合中。每个文档都可以采用完全有别于其他文档的结构。

3)如果你的数据在大幅增长,就需要快速且有效的扩展性,NoSQL可能会适合你。但如果你的数据结构没有变化,增长速度适中可控,那么SQL技术可能最适合你。

原文翻译:

“SQL过时了。”“关系数据库管理系统(RDBMS)不再能满足企业的数据管理需求。”“NoSQL等新的数据库技术才是适合当今企业的解决方案。”这样的言论甚嚣尘上,无论是在数据库技术行业内部还是外部。但这些话说得对吗?SQL已经过时,而NoSQL才是符合未来发展方向的解决方案吗?

在本文中,我们将概述SQL和NoSQL之间的区别,各种NoSQL技术之间的差异,然后探讨一下RDBMS是否真的过时了。

SQLNoSQL之间的区别

SQLNoSQL
数据存储存储在关系模型中,由行和列组成。行包含某个特定条目/实体的所有信息,而列是所有的独立数据点。例如,有一行是记录某辆汽车的,这一行里又分为“生产日期”、“型号”、“颜色”等列。“NoSQL”这个术语涵盖了多种数据库,每种数据库都有不同的数据存储模型,主要是文档、图形、键值和列存储。下文将讨论它们之间的差异。
架构和灵活性每条记录都遵照固定的模式,列在输入数据之前就必须确定和锁定,每行必须包含对应着每列的数据。该架构允许进行事后修订,但会涉及到改变整个数据库和进入脱机状态。采用动态架构。信息可随时添加,每“行”(或对等物)不必包含对应着每“列”的数据。
可扩展性扩展是纵向的。基本上,更多的数据就意味着更大的服务器,费用会变得非常昂贵。利用多个服务器来扩展RDBMS 也有可能,但这是一个困难且费时的过程。扩展是横向的,也就是分布于多个服务器上。这些服务器可以是价格便宜的商用硬件或者云实例,因此比纵向扩展更经济。很多NoSQL技术也能在不同服务器之间自动分配数据。
ACID合规性(原子性,一致性,独立性,持久性)绝大多数的关系数据库都具备ACID合规性。各项技术之间有所不同,但很多NoSQL解决方案为了性能和可扩展性而牺牲了ACID合规性。

NoSQL的多面性

如果你认为归属于NoSQL的所有技术都采用相同的数据模型,这个错误是可以原谅的。实际上,NoSQL指的是一整套采取不同方式储存和处理数据的技术的集合。主要的方式包括:

文档数据库

下图来自于文档数据库解决方案CouchDB,很好地总结了RDBMS和文档数据库之间的区别:

文档数据库并不把数据存储到表格的行和列中,而是存储到文档中,然后将这些文档汇集在集合中。每个文档都可以采用完全有别于其他文档的结构。文档数据库的实例包括上文提到的CouchDB以及MongoDB。

键值存储数据库

数据存储于键值对的关联数组中。键是一个属性名,与一个值相关联。常见的键值存储数据库有Redis、Voldemort(由领英网开发)和Dynamo(由亚马逊开发)。

图形数据库

适用于关系可以在图形中得到充分体现的数据。数据被存储到图形结构中,基本构成要素为点(实体)、属性(实体的信息)和线(实体之间的联系)。这类数据库的例子有Neo4J和InfiniteGraph。

列存储(或“宽列存储”)数据库

列存储数据库采用的不是“表格”,而是若干个列族(column family),其中包含着若干行。不同于RDBMS,你不需要预先知道所有的列,每行也未必拥有相同数量的列。列存储数据库最适合用来分析庞大的数据集。著名的列存储数据库有Cassandra和Hbase。

SQL VS. NoSQL——选哪个?

SQL和NoSQL水火不容的想法是错误的,理由并不仅仅是因为很多公司都选择同时使用它们。就像我以前讨论过的所有技术一样,世上真的没有那种“万金油”的方法,要根据用例来选择恰当的技术。如果你的数据需求在迅速变化,就需要高通量来应对快速的增长,如果你的数据在大幅增长,就需要快速且有效的扩展性,NoSQL可能会适合你。但如果你的数据结构没有变化,增长速度适中可控,那么SQL技术可能最适合你。毫无疑问,SQL还没有消亡。

注:本文摘自品觉公众号,版权著作权属原创者所有,以上内容不代表数据猿观点

欢迎关注数据猿微信公众号:datayuancn

我们以开放的态度欢迎各位投稿数据猿,来稿请投递至:tougao@datayuan.cn

相关推荐

高性能并发队列Disruptor使用详解

基本概念Disruptor是一个高性能的异步处理框架,是一个轻量的Java消息服务JMS,能够在无锁的情况下实现队列的并发操作Disruptor使用环形数组实现了类似队列的功能,并且是一个有界队列....

Disruptor一个高性能队列_java高性能队列

Disruptor一个高性能队列前言说到队列比较熟悉的可能是ArrayBlockingQueue、LinkedBlockingQueue这两个有界队列,大多应用在线程池中使用能保证线程安全,但其安全性...

谈谈防御性编程_防御性策略

防御性编程对于程序员来说是一种良好的代码习惯,是为了保护自己的程序在不可未知的异常下,避免带来更大的破坏性崩溃,使得程序在错误发生时,依然能够云淡风轻的处理,但很多程序员入行很多年,写出的代码依然都是...

有人敲门,开水开了,电话响了,孩子哭了,你先顾谁?

前言哎呀,这种情况你肯定遇到过吧!正在家里忙活着,突然——咚咚咚有人敲门,咕噜咕噜开水开了,铃铃铃电话响了,哇哇哇孩子又哭了...我去,四件事一起来,人都懵了!你说先搞哪个?其实这跟我们写Java多线...

面试官:线程池如何按照core、max、queue的执行顺序去执行?

前言这是一个真实的面试题。前几天一个朋友在群里分享了他刚刚面试候选者时问的问题:"线程池如何按照core、max、queue的执行循序去执行?"。我们都知道线程池中代码执行顺序是:co...

深入剖析 Java 中线程池的多种实现方式

在当今高度并发的互联网软件开发领域,高效地管理和利用线程资源是提升程序性能的关键。Java作为一种广泛应用于后端开发的编程语言,为我们提供了丰富的线程池实现方式。今天,就让我们深入探讨Java中...

并发编程之《彻底搞懂Java线程》_java多线程并发解决方案详解

目录引言一、核心概念:线程是什么?...

Redis怎么实现延时消息_redis实现延时任务

一句话总结Redis可通过有序集合(ZSET)实现延时消息:将消息作为value,到期时间戳作为score存入ZSET。消费者轮询用ZRANGEBYSCORE获取到期消息,配合Lua脚本保证原子性获取...

CompletableFuture真的用对了吗?盘点它最容易被误用的5个场景

在Java并发编程中,CompletableFuture是处理异步任务的利器,但不少开发者在使用时踩过这些坑——线上服务突然雪崩、异常悄无声息消失、接口响应时间翻倍……本文结合真实案例,拆解5个最容易...

接口性能优化技巧,有点硬_接口性能瓶颈

背景我负责的系统到2021年初完成了功能上的建设,开始进入到推广阶段。随着推广的逐步深入,收到了很多好评的同时也收到了很多对性能的吐槽。刚刚收到吐槽的时候,我们的心情是这样的:...

禁止使用这5个Java类,每一个背后都有一段"血泪史"

某电商平台的支付系统突然报警:大量订单状态异常。排查日志发现,同一笔订单被重复支付了三次。事后复盘显示,罪魁祸首竟是一行看似无害的SimpleDateFormat代码。在Java开发中,这类因使用不安...

无锁队列Disruptor原理解析_无锁队列实现原理

队列比较队列...

Java并发队列与容器_java 并发队列

【前言:无论是大数据从业人员还是Java从业人员,掌握Java高并发和多线程是必备技能之一。本文主要阐述Java并发包下的阻塞队列和并发容器,其实研读过大数据相关技术如Spark、Storm等源码的,...

线程池工具及拒绝策略的使用_线程池处理策略

线程池的拒绝策略若线程池中的核心线程数被用完且阻塞队列已排满,则此时线程池的资源已耗尽,线程池将没有足够的线程资源执行新的任务。为了保证操作系统的安全,线程池将通过拒绝策略处理新添加的线程任务。...

【面试题精讲】ArrayBlockingQueue 和 LinkedBlockingQueue 区别?

有的时候博客内容会有变动,首发博客是最新的,其他博客地址可能会未同步,认准...