百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

为什么 Git 这么难?

wptr33 2025-02-15 17:38 16 浏览

【CSDN 编者按】作为一种分布式版本控制系统,Git 主要用于跟踪和管理文件和项目的变化。它由 Linus Torvalds 创建,最初是为了管理 Linux 内核的开发而设计的,现如今被广泛用于许多其他软件开发项目中。不过,在使用过程中,很多人觉得好用的 Git 学习曲线非常陡峭,这到底是为什么?

原文链接:
https://roadrunnertwice.dreamwidth.org/596185.html

未经允许,禁止转载!


作者 | Nick Eff 译者 | 弯月
责编 | 夏萌
出品 | CSDN(ID:CSDNnews)

在工作中,我经常需要教其他人学习如何使用 Git 及其更高级的功能。在这个过程中,这些聪明且坚持学习的人往往连基础知识都无法掌握,这令我十分恼火,因为我自诩擅长解释事物。有时,我给他们解释 rebase 就像解释波粒二象性一样,满屋子的人以一种听天书的眼神看着我。

所以,这个周末之前我花了一些时间来思考为什么学习 Git 这么难的问题。

不是因为 Git 的命令行界面太差

有一个很明显的原因,Git 的命令行界面太差。但这个理由还不够充分,因为我们都见过更差的界面(或者,几乎差不多的情况)。

只要你对想完成的目标有详细的了解,就应该可以通过记忆和外部的参考资料来解决这个问题。虽然很麻烦,但至少有一条已知的学习途径。而学习 Git 的人并没有这个问题。

奇怪的思维模式

这个问题可以分为两部分讨论:

  • 除非你掌握了 Git核心概念的思维模式和相应的类比(对象以及可以执行的操作),否则不可能安全地使用 Git。

  • Git 的核心概念完全不同于大多数人看待世界的方式。因此,用户倾向于采用更舒服(但不可行)的类比,这会导致混乱和结果不可预测。(此外,Git 的 命令行界面极大地模糊了这些核心概念,因此任何人学习的时候都要经历一场艰难的考验,即使他们的思维方式正确也无济于事。

我发现真正的问题在于,新手用户无法针对想要完成的任务制定有效的计划。有时,我会尝试让他们描述自己正在做什么,通常得到的答案不仅不完整或幼稚,而且非常混乱。

以下各项是 Git 超出人们的想象力和理解力的一些重要方面:

  • 提交是 Git 世界线的唯一组成部分

  • 提交内容既是快照也是补丁

  • 远程操作的定义模糊,还有一定的延迟

  • 分支并不完全是分支,它们更像是小书签

  • 合并冲突非常难

  • git pull 操作存在

提交是 Git 世界线的唯一组成部分

提交是唯一且不可变的,而且还被固定到了历史与因果关系图中的特定点。这意味着,提交的身份由内容和上下文组成。(如果提交的内容相同,但父项不同,则不是同一个提交。)反过来,这意味着你需要适应分支多世界宇宙学,能够区分具有相同意图和内容的变更与快照,明白它们完全不可互换,并且代表完全不同的历史事件流程。

新手 Git 用户往往认为内容本身就构成了身份,这种思维方式虽然更自然,但会给你带来很多麻烦。

提交内容既是快照也是补丁

Git提交作为快照存储在磁盘上,但你不一定要将它们当成快照。各种 Git 命令不仅将提交视为完整的代码库快照,还会将其视为变更集合,具体取决于执行的操作。(作为补丁的提交并没有持久存储在某个地方,而是根据需要通过与其父级进行比较而派生。)

举个例子,cherry-pick 或 revert 之类的命令将提交视为补丁。show 将提交视为两者兼而有之,具体取决于参数!

Git新手用户往往很难理解自己的操作将提交视为了快照还是补丁,这给制定可靠的计划增加了一些额外的困难。

远程操作身份模糊,还有一定的延迟

你需要了解下述概念:

  • 本地代码库。

  • 上游远程库的“真正”版本,位于网络中的另一台计算机上。

  • 最后一次获取的上游远程分支的本地缓存副本。

  • 本地代码库的分支,标记为与上游远程中的某个分支同步。

  • 以上后三者的更多实例,因为你可能有多个远程和许多跟踪分支。

Git新手用户根本无法区分这些概念。命令行界面未能消除歧义,而且关系和交互也很复杂。举个例子,考虑如下:

  • 你的本地克隆也叫 remote。

  • 分支名称在多个远程代码库之间完全独立。(通常我们会认为名称表示全局身份。然而,在 Git 中却并非如此!你的 main 与上游的 main 或分支的 main 没有特殊联系,这只是一种习惯约定。

  • 但是,提交有一个稳定的全局身份!标签也是,虽然其身份比提交弱一些。

  • 顺便问一下,origin是什么意思?并没有特别规定,它只是 git clone 创建的默认名称,但它指的究竟是上游代码库、你的 GitHub 分叉,还是别的东西?重命名远程到很后面才会接触,这意味着在推送的时候,你经常会感到困惑。(我建议重命名origin,这样任何远程都代表某个上游或某个代码库,但这只是我个人的经验之谈。

  • “跟踪分支”实际上并不特殊,它们只是注册一些方便使用的命令的方式。你可以推送或合并任何事物。

  • 正斜杠(/)有时是特殊的命名空间分隔符,用于表示缓存的远程分支,有时则不然。

  • 但是,将分支推送到远程时,切勿使用斜杠,而应使用空格。(因为这时你操作对远程代码库,而不是本地的缓存远程库。

  • 当报告跟踪分支的状态时,Git 会使用缓存的远程内容,但这些内容可能已经过期,并且根据真实的远程状态你的推送可能会被拒绝。

分支并不完全是分支,它们更像是小书签

对此,我不知道如何更好地解释,但你可以理解为:分支的有向无环图结构是不可变提交历史所固有的,而 Git“分支”实际上只是一个元数据,可以帮助你更方便地浏览结构:

  • 分支就像书签一样,你可以在它们之间快速切换。

  • 当前分支会随着你所做的每一次新提交而向前推进,可以更轻松地跟踪你的工作。

  • 但是,你可以挑选一个分支,并将其放置在图的任意一点(git reset)。

  • 分支并不相互排斥,它们并不“拥有”自身所处的历史分支。

所以,分支就是可以移动的小书签。你可以把它们想象成其他东西,而且最终你发现它们的行为方式确实令人困惑。

合并冲突非常难

这实际上并不是一个概念问题,通常人们会理解为“我们的改动相互冲突”。分析并解决冲突本来就很难。“如果我事先看到了你的改动,我会怎么改?”这是一个非常复杂的问题,这个问题的出现远远早于一小部分改动出现冲突,何况现有的界面在将冲突概念化方面做得非常糟糕,很容易让人头昏脑胀。

git pull 操作存在

也许只有我一个人这么想,但这个问题确实让我感到很困惑,我们教给新用户的第一件事就是依赖一个命令,而且这个命令的意思翻译过来就是:立即改变我的本地分支,以反映上游发生过的编辑,但根据定义,我没有机会通过任何明确的行为(这些行为由配置控制,但一般新手都不太理解配置)审核代码,也无法确定我的改动是否有可能破坏分支的现有因果历史。

我更喜欢的行为是按照某人的建议设置 pull.rebase = true,然后让新手将他们协作的分支 pull 到其他人刚刚合并过的 origin/main 上。这样就可以减少混乱!

“pull”代表了一种幻象:你只希望 Git 完美地做好一切,让你能够正确地 push,而不用理解究竟发生了什么。如上所述,这与 Git 的工作原理完全相悖。这种幻像非常有害!我们在教新手时,能不能先让他们理解“fetch,观察,理解之后再决定是做 fast-forward 还是 merge 还是 rebase 还是 reset”?

那么怎么办?

我不知道。

好吧,我有个很强烈的想法:在教新手时,你必须不断强化核心概念。不厌其烦地要求新手解释他们对于任务的理解,阐明他们的思维模型,直到他们能够准确预测 Git 怎样执行各种命令。采用各种解释和比喻,直到找到一种适合他们的思维的比喻,而且要接受,你永远不是最后一个使用这种比喻的人。

但我还没有找到任何放之四海而皆准的比喻。有一些有趣的可视化的确有帮助,但并没有解释“代码变更内容本身并不是身份的全部”。

一些工具可以帮助用户提升对这些概念的理解,从而不断改进预期和估计。我特别喜欢展示历史图,可以通过外部应用程序和 gitx/gitk 等工具,以及我最爱的 log --date=format:'%a %b %e, %Y' --pretty=format:'%C(yellow)%h%C(reset) %s %C(cyan)%cd%C(reset) %C(blue)%an%C(reset) %C(green)%d%C(reset)' --graph 命令(可以放到.gitconfig 中并起个别名 lg,如果行太长,可以使用-S 作为换行)。但历史图至少需要部分理解概念,否则只不过是另一个令人头晕目眩的东西。

毕竟,这才是 Git 难学的真正原因。

相关推荐

redis的八种使用场景

前言:redis是我们工作开发中,经常要打交道的,下面对redis的使用场景做总结介绍也是对redis举报的功能做梳理。缓存Redis最常见的用途是作为缓存,用于加速应用程序的响应速度。...

基于Redis的3种分布式ID生成策略

在分布式系统设计中,全局唯一ID是一个基础而关键的组件。随着业务规模扩大和系统架构向微服务演进,传统的单机自增ID已无法满足需求。高并发、高可用的分布式ID生成方案成为构建可靠分布式系统的必要条件。R...

基于OpenWrt系统路由器的模式切换与网页设计

摘要:目前商用WiFi路由器已应用到多个领域,商家通过给用户提供一个稳定免费WiFi热点达到吸引客户、提升服务的目标。传统路由器自带的Luci界面提供了工厂模式的Web界面,用户可通过该界面配置路...

这篇文章教你看明白 nginx-ingress 控制器

主机nginx一般nginx做主机反向代理(网关)有以下配置...

如何用redis实现注册中心

一句话总结使用Redis实现注册中心:服务注册...

爱可可老师24小时热门分享(2020.5.10)

No1.看自己以前写的代码是种什么体验?No2.DooM-chip!国外网友SylvainLefebvre自制的无CPU、无操作码、无指令计数器...No3.我认为CS学位可以更好,如...

Apportable:拯救程序员,IOS一秒变安卓

摘要:还在为了跨平台使用cocos2d-x吗,拯救objc程序员的奇葩来了,ApportableSDK:FreeAndroidsupportforcocos2d-iPhone。App...

JAVA实现超买超卖方案汇总,那个最适合你,一篇文章彻底讲透

以下是几种Java实现超买超卖问题的核心解决方案及代码示例,针对高并发场景下的库存扣减问题:方案一:Redis原子操作+Lua脚本(推荐)//使用Redis+Lua保证原子性publicbo...

3月26日更新 快速施法自动施法可独立设置

2016年3月26日DOTA2有一个79.6MB的更新主要是针对自动施法和快速施法的调整本来内容不多不少朋友都有自动施法和快速施法的困扰英文更新日志一些视觉BUG修复就不翻译了主要翻译自动施...

Redis 是如何提供服务的

在刚刚接触Redis的时候,最想要知道的是一个’setnameJhon’命令到达Redis服务器的时候,它是如何返回’OK’的?里面命令处理的流程如何,具体细节怎么样?你一定有问过自己...

lua _G、_VERSION使用

到这里我们已经把lua基础库中的函数介绍完了,除了函数外基础库中还有两个常量,一个是_G,另一个是_VERSION。_G是基础库本身,指向自己,这个变量很有意思,可以无限引用自己,最后得到的还是自己,...

China's top diplomat to chair third China-Pacific Island countries foreign ministers' meeting

BEIJING,May21(Xinhua)--ChineseForeignMinisterWangYi,alsoamemberofthePoliticalBureau...

移动工作交流工具Lua推出Insights数据分析产品

Lua是一个适用于各种职业人士的移动交流平台,它在今天推出了一项叫做Insights的全新功能。Insights是一个数据平台,客户可以在上面实时看到员工之间的交流情况,并分析这些情况对公司发展的影响...

Redis 7新武器:用Redis Stack实现向量搜索的极限压测

当传统关系型数据库还在为向量相似度搜索的性能挣扎时,Redis7的RedisStack...

Nginx/OpenResty详解,Nginx Lua编程,重定向与内部子请求

重定向与内部子请求Nginx的rewrite指令不仅可以在Nginx内部的server、location之间进行跳转,还可以进行外部链接的重定向。通过ngx_lua模块的Lua函数除了能实现Nginx...