百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

小白也能学会的 Git 原理—图解 git add 命令

wptr33 2025-05-15 21:28 4 浏览

通过本章节的学习,你会了解 git add 命令背后发生的故事,以及 Git 中最重要的概念“对象”的形成原理!

一、文件状态与 Git 状态

我们工作目录下的每一个文件基本上处于两种状态之中:已跟踪 或 未跟踪。

  • 已跟踪:被纳入了版本控制的文件,即 Git 已经知道的文件。
  • 未跟踪:未被纳入了版本控制的文件,即 Git 不知道的文件。

Git 有三种状态,你的文件可能处于其中之一:

  • 已提交(committed):表示数据已经安全地保存在本地版本库中。
  • 已修改(modified): 表示对一个已修改文件的当前版本做了标记。
  • 已暂存(staged):表示修改了文件,但还没保存到版本库中。

那文件状态与 Git 状态之间有关联关系么?当然有!已跟踪的文件,在工作一段时间后, 它们的状态可能是未修改,已修改或已暂存。如果是已暂存状态,就可以提交到版本库,从而变为已提交状态,反复如此。如下图所示:

二、git add 命令解析

使用命令 git add 会告知 Git 开始跟踪文件。那 git add 命令背后究竟都做了什么?

经查询得知,git add 底层对应着两个命令:

  • git hash-object:保存对象。
  • git update-index:记录暂存区。

(1)git hash-object

该命令的作用主要有两个方面:

  1. 用于将文件内容压缩成二进制,并保存到 .git/objects 目录
  2. 计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git status  #查看文件状态,保证工作区干净

echo 'hello world' > test.txt  #新建一个 test.txt 文件

# 1、把test.txt的当前内容压缩成二进制文件,称为Git对象,保存在.git/objects目录
# 2、计算当前内容的 SHA1 哈希值(长度40的字符串),作为该对象的文件名
git hash-object -w test.txt

由上可以看出,计算当前内容的 SHA1 哈希值(长度40的字符串)的前两位作为对象的目录名,后38位作为该对象的文件名

(2)、git update-index

通过学习上篇文章,我们知道可以通过 git ls-files --stage 命令查看"暂存区"的内容,经查看知,生成的二进制对象目前还没有被记录到 Git 暂存区中。

目前,文件只是被保存成二进制对象,那怎么通知 Git 哪些文件发生了变动,又如何让 Git 记录在"暂存区"(英文叫做 index 或者 stage)中呢?

#向暂存区写入文件名test.txt、二进制对象名(哈希值)和文件权限。
git update-index --add --cacheinfo 100644 3b18e512dba79e4c8300dd08aeb37f8e728b8dad test.txt

#显示暂存区当前的内容
git ls-files --stage

此时,暂存区里面只有一个新文件 test.txt,等待被提交至版本库。

三、Git 对象

Git 中对象有很多种,如 blob 对象、tree 对象、commit 对象、tag 对象等,今天我们主要讲解其中一种,也是最重要的一种:blob 对象!

初始化 Git 仓库时,程序会自动创建名为 objects 的目录(即 对象数据库),该目录下有两个空的文件夹:info 和 pack。存放到 objects 目录的文件主要有两种形式:

  • 压缩包文件:通过执行 git gc 命令将 objects/ 下对象打包压缩到 pack 目录下
  • hash 文件:Git 向磁盘保存对象时默认使用的格式,即松散对象 (loose object),又可称为数据对象(blob object)。

由上可知,当我们执行 git add 命令后,程序会自动将工作区的文件保存成二进制 blob 对象,并放入暂存区中。那这个 blob 对象是怎么计算出来的呢?

blob 对象数值 = sha1(blob + 空格 + 内容长度 + 内容)

故,当你对同一个文件修改哪怕一行,git 都会使用全新的文件存储这个修改了的文件,放在了 objects 中。

那我们怎么知道 objects 目录中哪些对象是 blob 对象,哪些是其他类型的对象呢?

git cat-file -t 3b18e512dba79e4c8300dd08aeb37f8e728b8dad

下章节内容预告

通过本章节的学习,你会了解 git commit 命令背后发生的故事,以及 Git 中 tree 对象的形成原理!

相关推荐

MySQL合集-innobackupex在线备份及恢复(全量和增量)

Xtrabackup是由percona开发的一个开源软件,它是innodb热备工具ibbackup(收费的商业软件)的一个开源替代品。Xtrabackup由个部分组成:xtrabackup和innob...

MySQL合集-单机容器化

MySQL单机容器化mkdir-p/opt/mysql/{data,etc}cpmy.cnf/opt/mysql/etc#dockersearchmysqldockerpullm...

MySQL合集-小版本升级指南

下载最新的mysqlwgethttps://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.38-linux-glibc2.12-x86_64.tar.gz...

Mysql 数据库运维方案

前言...

如果忘记了 WAMP 中本机数据库(MySQL)的密码,该怎么办?

如果忘记了WAMP中本机数据库(MySQL)的密码,可以通过以下步骤来重置:停止MySQL服务:打开WAMP,点击“停止所有服务”,或者右键点击WAMP图标,在菜单中选择“MySQL...

Linux服务器日常巡检脚本分享

Linux系统日常巡检脚本,巡检内容包含了,磁盘,...

在 SpringBoot 中设计一个订单号生成系统,原理,架构与实战

在SpringBoot中设计一个订单号生成系统,原理,架构与实战首先,我得考虑订单号的基本要求。通常订单号需要唯一性,不能重复,否则会出大问题。然后可能还要有一定的可读性,比如包含日期、时间或者业...

K8S官方java客户端之七:patch操作

欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;...

浅谈Kubernetes CRD和Operator的原理和使用方法

总结CRD的全称是CustomResourceDefinition,是Kubernetes为提高可扩展性,让开发者去自定义资源(如Deployment,StatefulSet等)的一种方法....

kubernetes实用操作:kubectl命令行工具使用全面总结

kubectl作为客户端CLI工具,可以让用户通过命令行对Kubernetes集群进行操作。本节对kubectl的子命令和用法进行详细说明。kubectl用法概述kubectl[command][...

ceph rbd块存储挂载及文件存储建立

cephrbd块存储挂载及文件存储建立一、rbd块存储挂载1创建一个OSDpool...

odps sql中常用的时间处理方法

1、获取当前时间selectgetdate();2、获取昨天(字符串格式)selectto_char(dateadd(getdate(),-1,'dd'),'yyyymmd...

每天一个 Python 库:datetime 模块全攻略,时间操作太丝滑!

在日常开发中,时间处理是绕不开的一块,比如:...

时序异常检测工具:ADTK

1adtk简介智能运维AIOps的数据基本上都是...

又一批长事务,P0故障谁来背锅?

最近几周,发生过多起因为事务问题引起的服务报错。现象为...