百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

总结MYSQL中VHARCHAR和TEXT

wptr33 2025-02-15 17:40 20 浏览

前几天在设计表结构时,针对表中的一个字段使用text还是使用varchar时受到了开发同学的挑战。本篇文章对text和varchar的区别做个总结。

VHARCHAR和TEXT对比

  1. char(n)varchar(n)中括号中n代表字符的个数,并不代表字节个数,所以当使用了中文的时候(utf8)意味着可以插入m个中文,但是实际会占用m*3个字节。
  2. 同时char和varchar最大的区别就在于char不管实际value都会占用n个字符的空间,而varchar只会占用实际字符应该占用的空间+1,并且实际空间+1<=n。
  3. 超过char和varchar的n设置后,字符串会被截断。
  4. char的上限为255字节,varchar的上限65535字节,text的上限为65535。
  5. char在存储的时候会截断尾部的空格,varchar和text不会。
  6. varchar会使用1-3个字节来存储长度,text不会。

下图可以非常明显的看到结果:

Value

CHAR(4)

Storage Required

VARCHAR(4)

Storage Required

''

' '

4 bytes

''

1 byte

'ab'

'ab '

4 bytes

'ab'

3 bytes

'abcd'

'abcd'

4 bytes

'abcd'

5 bytes

'abcdefgh'

'abcd'

4 bytes

'abcd'

5 bytes

总体来说:

  1. char,存定长,速度快,存在空间浪费的可能,会处理尾部空格,上限255。
  2. varchar,存变长,速度慢,不存在空间浪费,不处理尾部空格,上限65535,但是有存储长度实际65532最大可用。
  3. text,存变长大数据,速度慢,不存在空间浪费,不处理尾部空格,上限65535,会用额外空间存放数据长度,顾可以全部使用65535。

场景问题

从空间方面

varchar

varchar在mysql中满足最大行限制,也就是65535(16k)字节,在mysql中使用utf8(mysql中的utf8和我们正常的编码utf8不同)字符集一个字符占用三个字节。

  1. 使用utf8字符编码集varchar最大长度是(65535-2)/3=21844个字符(超过255个字符会有2字节的额外占用空间开销,所以减2,如果是255以下则减1),mysql中使用utf8字符集一个字符占用3个字节。
  2. 使用utf8mb4字符集varchar最大长度是(65535-2)/4=16383 个字符(超过255个字符会有2字节的额外占用空间开销,所以减2,如果是255以下则减1,mysql中utf8mb4字符集也就是我们通常使用的utf8mb4字符集),mysql中使用utf8mb4字符集一个字符占用4个字节。

text

最大限制是64k,采用utf8字符集占用(262144-2)/3=87381个字符;采用utf8mb4字符集占用(262144-2)/4=65535个字符。除此之外基于 blob(二进制大对象)类型的变体还有如下三个:

  1. text 的最大长度为 65,535 字节,与 varchar 相同。
  2. mediumtext 的最大长度约为 16 兆字节。
  3. longtext 的最大长度约为 4 gb。

另外,从官方文档中可以得知当varchar大于某些数值的时候其会自动转换为text,大概规则如下:

  1. 大于varchar(255)变为 tinytext
  2. 大于varchar(500)变为 text
  3. 大于varchar(20000)变为 mediumtext

所以对于过大的内容使用varchar和text没有太多区别。

关于性能方面

索引会是影响性能的最关键因素,而对于text来说只能添加前缀索引,并且前缀索引最大只能达到1000字节。而貌似varhcar可以添加全部索引,但是经过测试其实也不是。由于会进行内部的转换,所以long varchar其实也只能添加1000字节的索引,如果超长了会自动截断。如下代码:

localhost.test>create table test (a varchar(1500));
Query OK, 0 rows affected (0.01 sec)
localhost.test>alter table test add index idx_a(a);
Query OK, 0 rows affected, 2 warnings (0.00 sec)
Records: 0 Duplicates: 0 Warnings: 2
localhost.test>show warnings;
+---------+------+---------------------------------------------------------+
| Level | Code | Message |
+---------+------+---------------------------------------------------------+
| Warning | 1071 | Specified key was too long; max key length is 767 bytes |
| Warning | 1071 | Specified key was too long; max key length is 767 bytes |
+---------+------+---------------------------------------------------------+

从上面可以明显单看到索引被截断了,而这个767是由于innodb自身的问题,使用innodb_large_prefix设置。

总结

  1. 使用varchar可以选择大小,并为存储设置上限;使用text则不能设置上限,固定长度65535(16k)。
  2. 使用varchar可以设置默认值;text不可以设置默认值。
  3. 使用varchar可以进行排序查询;text不可以排序查询。
  4. 使用varchar超过255长度都会隐式的转为text处理。
  5. 涉及text列的查询可能会导致在磁盘而不是内存中创建临时表。使用基于磁盘的表会显着降低性能,这意味着使用 text 的查询可能会慢得多。
  6. 使用text字段时需要将text字段单独放到一个表中。

完!

相关推荐

什么是Java中的继承?如何实现继承?

什么是继承?...

Java 继承与多态:从基础到实战的深度解析

在面向对象编程(OOP)的三大支柱中,继承与多态是构建灵活、可复用代码的核心。无论是日常开发还是框架设计,这两个概念都扮演着至关重要的角色。本文将从基础概念出发,结合实例与图解,带你彻底搞懂Java...

Java基础教程:Java继承概述_java的继承

继承概述假如我们要定义如下类:学生类,老师类和工人类,分析如下。学生类属性:姓名,年龄行为:吃饭,睡觉老师类属性:姓名,年龄,薪水行为:吃饭,睡觉,教书班主任属性:姓名,年龄,薪水行为:吃饭,睡觉,管...

java4个技巧:从继承和覆盖,到最终的类和方法

日复一日,我们编写的大多数Java只使用了该语言全套功能的一小部分。我们实例化的每个流以及我们在实例变量前面加上的每个@Autowired注解都足以完成我们的大部分目标。然而,有些时候,我们必须求助于...

java:举例说明继承的概念_java继承的理解

在现实生活中,继承一般指的是子女继承父辈的财产。在程序中,继承描述的是事物之间的所属关系,通过继承可以使多种事物之间形成一种关系体系。例如猫和狗都属于动物,程序中便可以描述为猫和狗继承自动物,同理,...

从零开始构建一款开源的 Vibe Coding 产品 Week1Day4:业界调研之 Agent 横向对比

前情回顾前面两天我们重点调研了了一下Cursor的原理和Cursor中一个关键的工具edit_file的实现,但是其他CodingAgent也需要稍微摸一下底,看看有没有优秀之处,下...

学会这几个插件,让你的Notepad++使用起来更丝滑

搞程序开发的小伙伴相信对Notepad++都不会陌生,是一个占用空间少、打开启动快的文件编辑器,很多程序员喜欢使用Notepad++进行纯文本编辑或者脚本开发,但是Notepad++的功能绝不止于此,...

将 node_modules 目录放入 Git 仓库的优点

推荐一篇文章Whyyoushouldcheck-inyournodedependencies[1]...

再度加码AI编程,腾讯发布AI CLI并宣布CodeBuddy IDE开启公测

“再熬一年,90%的程序员可能再也用不着写for循环。”凌晨两点半,王工还在公司敲键盘。他手里那份需求文档写了足足六页,产品经理反复改了三次。放在过去,光数据库建表、接口对接、单元测试就得写两三天。现...

git 如何查看stash的内容_git查看ssh key

1.查看Stash列表首先,使用gitstashlist查看所有已保存的stash:...

6万星+ Git命令懒人必备!lazygit 终端UI神器,效率翻倍超顺手!

项目概览lazygit是一个基于终端的Git命令可视化工具,通过简易的TUI(文本用户界面)提升Git操作效率。开发者无需记忆复杂命令,即可完成分支管理、提交、合并等操作。...

《Gemini CLI 实战系列》(一)Gemini CLI 入门:AI 上命令行的第一步

谷歌的Gemini模型最近热度很高,而它的...

deepin IDE新版发布:支持玲珑构建、增强AI智能化

IT之家8月7日消息,深度操作系统官方公众号昨日(8月6日)发布博文,更新推出新版deepin集成开发环境(IDE),重点支持玲珑构建。支持玲珑构建deepinIDE在本次重磅更...

狂揽82.7k的star,这款开源可视化神器,轻松创建流程图和图表

再不用Mermaid,你的技术文档可能已经在悄悄“腐烂”——图表版本对不上、同事改完没同步、评审会上被一句“这图哪来的”问得哑口无言。这不是危言耸听。GitHub2025年开发者报告显示,63%的新仓...

《Gemini CLI 实战系列》(五)打造专属命令行工具箱

在前几篇文章中,我们介绍了GeminiCLI的基础用法、效率提升、文件处理和与外部工具结合。今天我们进入第五篇...