Git 看这一篇就够了
作者 |码农田小齐
责编 | Carol
封图 | CSDN 下载自视觉中国
今天简单讲下 Git 的实现原理,知其所以然才能知其然;并且梳理了日常最常用的 12 个命令,分为三大类分享给你。
本文的结构如下:
作者和开发原由
Git 的数据模型
常用命令
资源推荐
作者和开发原由
Talk is cheap. Show me the code.
这句话就出自 Linux 和 Git 的作者
Linus Torvalds。
原本 Linux 内核的版本控制系统是用的 BitKeeper,然而 2005 年,BitMover 公司不再让 Linux 开发团队免费使用了……
Linus 一听,不给用了?老子自己写!
于是,大佬十天之内完成了 Git 的第一个版本。
所以 Git 是一个免费的、开源的版本控制系统。
版本控制系统
版本控制其实每个人都用过,那些年修改过的简历:
简历 2012 版
简历 2013 版
简历 2014 版
简历 2015 版
简历 2016 版
简历 2017 版
简历 2018 版
简历 2019 版
...
还有那些年打死都不再改的毕业论文:
毕业论文最终版
毕业论文最最终版
毕业论文最最最终版
毕业论文最最最最终版
毕业论文最终不改版
毕业论文最终真不改版
毕业论文最终真真不改版
毕业论文最终打死不改版
毕业论文最终打死不改版 2
...
没错,这就是本地版本控制系统。
很明显,好处是简单,但是只能一个人在这改,无法和他人完成合作。那么以下两种主流的版本控制系统应运而生。
1. 集中化版本控制系统
Centralized Version Control Systems (CVCS)
比如:CVS, Subversion, Perforce, etc.
这种版本控制系统有一个单一的集中管理的服务器,保存所有文件的最新版本,大家可以通过连接到这台服务器上来获取或者提交文件。
这种模式相对本地版本控制系统是有所改进的,但是缺点也很明显,如果服务器宕机,那么轻则耽误工作、重则数据丢失。于是分布式版本控制系统应运而生。
2. 分布式版本控制系统
Distributed Version Control Systems (DVCS)
比如:Git, Mercurial, Bazaar, etc.
分布式的版本控制系统会把代码仓库完整地镜像下来,这样任何一个服务器发生故障,都可以用其他的仓库来修复。
更进一步,这种模式可以更方便的和不同公司的人进行同一项目的开发,因为两个远程代码仓库可以交互,这在之前的集中式系统中是无法做到的。
那么什么叫“把代码仓库完整地镜像下来”呢?
CVCS 每个版本存放的是当前版本与前一个版本的差异,因此也被称作基于差异的版本控制 (delta-based);
Git 存储的是所有文件的一个快照 (snapshot),如果有的文件没有修改,那就只保留一个 reference 指向之前存储的文件。
不是很好理解?那接着看吧~
Git 的数据模型
1. 什么是快照 (snapshot) 呢?
首先我们来学两个 Git 中的术语:
blob, 就是单个的文件;
tree, 就是一个文件夹。
快照则是被追踪的最顶层的树。
比如我的“公众号”文件夹的这么一个结构:
那么一个快照就是追踪的“公众号”这颗树。
2. 本地库的数据模型
Git 记录了每个快照的 parent,也就是当前这个文件夹的上一个版本。
那么快照的迭代更新的过程就可以表示为一个有向无环图,是不是很熟悉?我们在「拓扑」那篇文章里讲过,忘了的小伙伴快去公众号内回复「拓扑」获取拓扑的入门文章吧~
每个快照其实都对应了一次 commit,我们用代码来表示一下:
class commit {array<commit> parentsString authorString messageTree snapshot
}
这就是 Git 的数据模型。
blob, tree, snapshot 其实都一样,它们在 Git 中都是对象,都可以被引用或者被搜索,会基于它们的 SHA-1 hash 进行寻址。
git cat-file -t: 查看每个 SHA-1 的类型;
git cat-file -p: 查看每个对象的内容和简单的数据结构。
但是通过这个哈希值来搜索也太不方便了,毕竟这是一串 40 位的十六进制字符,就是第二部分 git log 里输出的那个编码。
因此,Git 还给了一个引用 reference。
比如,我们常见的 HEAD 就是一个特殊的引用。
本地库就是由 对象 和 引用 构成的,或者叫 Repositories.
在硬盘上,Git 只存储 对象 和 引用,所有的 Git 命令都对应提交一个快照。
那有哪些常用命令呢?
常用命令
本章分三大部分介绍日常常用命令:
本地操作
和远程库的交互
团队协作 - 分支
本地操作
在学习常用命令之前,你首先需要知道的 Git 的「三个分区」和对应的文件的「三种状态」:
工作区:就是你本地实际写代码的地方,无论你是用 vim 直接改也好,还是在 IDE 里写,都无所谓。
对应的文件状态是:modified,已修改,但还没保存到数据库中。
暂存区:就是临时存放的地方。
对应的文件状态是:staged,Git 已经对该文件做了标记,下次提交知道要包含它。
本地库:存放本地历史版本信息。
对应的文件状态是:
committed
,文件已经安全的保存在本地数据库中。
1. $ git add
工作区改完了代码,就用 git add 提交到暂存区。
这里如果文件改动的比较多,但又不是每个都需要提交,我会设置 git ignore file,就表示这些文件不要提交,比如在 build project 的时候会自动生成的那些文件等等。
2. $ git commit -m "comment"
从暂存区提交到本地库,就需要用 commit。
一般后面都会跟个 -m 加句 comment,简单说下改动的内容或者原因,我们公司大家默认也会把 Jira链接附上,这样就知道这个改动对应哪个任务。
那如果想再改,再重新 git add 即可,但是 commit 这句需要改成
$ git commit --amend
这样就还是一条 git log 信息。
3. $ git log
git log 可以查看到提交过的信息,从近到远显示每次 commit 的 comment 还有作者、日期等信息,比如大概长这个样子:
commit 5abcd17dggs9s0a7a91nfsagd8ay76875afs7d6
Author: Xiaoqi<xiaoqi@163.com>
Date: xxx xxx xxx
改了 Test 文件
commit 后面的这个编号,是每次历史记录的一个索引。比如如果需要对版本进行前进或者后退的时候,就需要用到它。
这样打印的 log 太多,更简洁的打印方式是:
$ git log --oneline
就一行打印出来了。
或者:
$ git reflog
更常用一些。
4. $ git reset
那我们刚刚说过,如果需要前进或退回到某个版本,就用
$ git reset --hard <编号>
这样就直接跳到了这个编号对应的那个版本。
那么这个 hard 是什么意思呢?
这里有 3 个参数:hard, soft, mixed,我们一一来说一下。
回到我们最重要的这张图上来:
我们刚刚说的前进或后退到某一版本,是对本地库进行的操作。
那有个问题:
本地库的代码跳到那个版本之后,工作区和暂存区的代码就和本地库的不同步了呀!
那这些参数就是用来控制这些是否同步的。
$ git reset --hard xxx
三个区都同步,都跳到这个 xxx 的版本上。
$ git reset --soft xxx
前面两个区不同步,就只有本地库跳到这个版本。
$ git reset --mixed xxx
暂存区同步,工作区不动。
所以呢,用的多的就是 hard.
远程交互
和远程库的交互主要是推、拉,也就是写入和读取。
5. $ git push
写完了代码,要提交到公司的代码库里,这个过程要用 git push.
当然了,这么用会被打的……毕竟还要 cr 呢。
6. $ git clone
新来的实习生首先要 clone 整个项目到本地来,然后才能增删改查。
当然了实际工作中也没人这么用。。因为每家公司都会有自己包装的工具。不过如果是做 Github 上的开源项目,就用得上了。
7. $ git pull
小齐提交了新的代码之后,领导要审查呀,所以用 git pull 把最新的代码拉取下来瞅瞅。
实际上呢,
git pull = fetch + merge
8. $ git fetch
git fetch 这个操作是将远程库的数据下载到本地库,但是工作区中的文件没有更新。
而要谈 get merge,我们还需要先讲下分支。
merge 是 git pull 默认的选项,合并其实还有另外一种方法:rebase,中文叫做变基。
8. $ git rebase
rebase 的作用更多的是来整合分叉的历史,可以将某个分支上的所有修改都移到另一分支上,就像是变了基底。
分支与合并
首先我们来看几个关于分支的基本操作:
9. 查看分支:
$ git branch
类似于ls,能够列出当前所有分支。
git branch -v 能够显示更多信息。
10. 创建分支:
$ git branch <branchName>
11. 切换分支:
$ git checkout <branchName>
有了分支之后必然会有合并:
12. 合并分支:
$ git merge <branchName>
而合并时就可能会有冲突,什么时候会有冲突呢?:
在同一个文件的同一个位置修改时。
因为 Git 会努力的把你们改动不同的地方合并在一起,但如果实在是在同一个地方改的,那它也没办法了,只能留给程序员去手动处理了。
当然了,每个命令延伸下去还有无限多个,本文不可能涵盖全部,所以在此重磅推荐齐姐精心挑选的三大学习资源,大家可以自行享用~
学习资源
git help
其实我个人使用最多的是git help
真心方便又好用啊!
比如 git help pull:
先介绍了有哪些参数,然后 description 详细解释了它的工作原理,下面还有图解,有木有太香!!
不过这种方式更像是 cheatsheet,当你已经知道了这个命令、只是忘了它的用法的时候去查。
如果你想系统的学习,那么下面 ???? 的更适合你。
Pro Git
这本书是强烈推荐了!!
Pro Git 这本书不仅讲了 Git 的基础用法、高级用法,以及最后还深入讲解了 Git 的原理,非常细致全面。
书的电子版也能在网站上直接下载。
英文版:
https://git-scm.com/book/en/v2
中文版:
https://git-scm.com/book/zh/v2
玩游戏
Practice makes perfect!
推荐一个宝藏资源:玩游戏来练 Git
项目:https://github.com/pcottle/learnGitBranching
网址:https://learngitbranching.js.org/
我熟悉很多工具都是通过小游戏来练习的,比如 vim 的操作,还是蛮推荐这种方式的。就不剧透啦,大家自己去探索吧~
推荐阅读
MATLAB 被禁点燃导火索,国产软件路在何方?
万字长文带你入门 GCN
陆奇:疫情下的创业者,最不能缺两大能力
使用虚幻引擎4年,我想再谈谈它的网络架构
真惨!连各大编程语言都摆起地摊了
为何 DeFi 将带来一场巨大的范式转变?
你点的每个“在看”,我都认真当成了AI
相关文章:

当不使用会话状态时禁用它
并不是所有的应用程序或页都需要针对于具体用户的会话状态,您应该对任何不需要会话状态的应用程序或页禁用会话状态。 若要禁用页的会话状态,请将 Page 指令中的 EnableSessionState 属性设置为 false。例如,<% Page EnableSessionState&…

jepg图像的存储 转
先把代码贴上: extern "C" { #include "jpeglib.h" #pragma comment(lib,"libjpeg.lib") //把无压缩的图像数据(纹理)存储成jepg bool appSaveJpegRGB(char *filepath,unsigned char * data,int width,int hei…

使用Spring进行统一日志管理 + 统一异常管理
统一日志和异常管理配置好后,SSH项目中,代码以往散落的log.info() 和 try..catch..finally 再也不见踪影! 统一日志异常实现类: [java] view plaincopy package com.pilelot.web.util; import org.apache.log4j.Logger; impor…

避免到服务器的不必要的往返过程
虽然您很可能希望尽量多地使用 Web 窗体页框架的那些节省时间和代码的功能,但在某些情况下却不宜使用 ASP.NET 服务器控件和回发事件处理。 通常,只有在检索或存储数据时,您才需要启动到服务器的往返过程。多数数据操作可在这些往返过程间的…

OPPO和微软合作,开放“召唤小冰”
6月24日,OPPO与微软共同宣布,OPPO手机智能助理Breeno语音开放“召唤小冰”能力一年之际,双方合作再次深化。微软小冰与OPPO Breeno团队加速合作,不断打造和更新更符合OPPO生态的AI技能,提升微软小冰在Breeno语音中的产…

如果你即将死去
如果你即将死去,你是否能够安息; 如果你即将死去,你是否还有事情不能放弃; 如果你即将死去,你的事业是否有人继续; 如果你即将死去,你的生平是否还有人惦记; 死亡是所有生命的终点&a…

设计模式(行为型模式)——备忘录模式(Memento)
2019独角兽企业重金招聘Python工程师标准>>> 本章讲讲第三类和第四类。 备忘录模式(Memento) 主要目的是保存一个对象的某个状态,以便在适当的时候恢复对象,个人觉得叫备份模式更形象些,通俗的讲下…

当你累了,准备放弃时,看看这个吧!!!
当你累了,准备放弃时,看看这个吧!!! 在朋友空间看到这篇文章,送给所有还在坚持的朋友~~每个人都背负着一个沉重的十字架,在缓慢而艰难地朝着目的地前进。途中,有一个人忽然停了下来。…

只在必要时保存服务器控件视图状态
自动视图状态管理是服务器控件的功能,该功能使服务器控件可以在往返过程上重新填充它们的属性值(您不需要编写任何代码)。但是,因为服务器控件的视图状态在隐藏的窗体字段中往返于服务器,所以该功能确实会对性能产生影…
超越英伟达的,不会是另一款GPU!中国公司发布首款数据流AI芯片
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6…

vim打开多窗口、多文件之间的切换
打开多个文件:一、vim还没有启动的时候:1.在终端里输入 vim file1 file2 ... filen便可以打开所有想要打开的文件2.vim已经启动输入:e file可以再打开一个文件,并且此时vim里会显示出file文件的内容。3.同时显示多个文件::sp …
图灵奖得主Judea Pearl:从“大数据革命”到“因果革命”
整理 | 智源社区,龚鹤扬&高亦斌2020年6月21日,在第二届北京智源大会开幕式及全体会议上,图灵奖得主、贝叶斯网络奠基人Judea Pearl 做了名为《The New Science of Cause and Effect with reflections on data science and artificial int…

美国两政府网站被挂马 以性丑闻女星为诱饵
据安全厂商趋势科技称,美国两个政府网站近日发现被挂木马,这两家被挂马的网站都是以性丑闻女性为诱饵欺骗用户访问其它恶意网页。 圣伯纳迪诺县的宣传页面被发现感染了恶意木马,用户访问该网站时被重定向到域名Videosdivx.net下的一个网站…

除非有特殊的原因要关闭缓冲,否则使其保持打开
禁用 Web 窗体页的缓冲会导致大量的性能开销。
[React Native Android安利系列]搭建React Native Android环境
欢迎大家收看react-native-android系列教程,跟着本系列教程学习,可以熟练掌握react-native-android的开发,你值得拥有https://segmentfault.com/blog... (PS,和聊一聊系列写在一起也实在是没辙, 谁知道如何新建专栏&am…

继承QTreeWidgetItem发生error: 'staticMetaObject' is not a member of 'QTreeWidgetItem' 错误
点击打开链接 #ifndef QQUSERITEM_H就发生下列错误 #define QQUSERITEM_H #include <QTreeWidgetItem> class QQUserItem :public QTreeWidgetItem { Q_OBJECT public: explicit QQUserItem(QQUserItem *parent 0); signals: public slots: }; #endif // QQUSERITEM_H d…

使用 HttpResponse.Write 方法进行字符串串联
该方法提供非常有效的缓冲和连接服务。但是,如果您正在执行广泛的连接,请使用多个 Response.Write 调用。下面示例中显示的技术比用对 Response.Write 方法的单个调用连接字符串更快。 [C#] Response.Write("a"); Response.Write(myString); …
倒计时 8 天 | 完整议程大揭秘!来 20 个 AI 论坛,与百名大咖携手玩转人工智能...
2020年7月3—4日,由 CSDN 主办的第三届 AI 开发者大会(AI ProCon 2020)(大会官网:https://aiprocon.csdn.net/)将以线上直播的形式与大家相见。本次大会历时2天,一次性设立6大主题、20大精彩分论…

关于分页的解决方案收集
分页的html样式,可分为两种,pc和移动端 pc端的解决方案(既有json版本又有get参数版本): http://laypage.layui.com/ 移动端的上拉刷新,下拉加载解决方案:(个人建议还是老实用会iscroll.js吧) ht…

MVC3+EF4.1学习系列(一)-------创建EF4.1 code first的第一个实例(强转)
文章索引和简介 基于EF4.1 code first 简单的CRUD 园子中已经有很多了 ~~ 真不想再写这个了 可是为了做一个完整的小demo 从开始 到后面的一些简单重构 还是决定认真把这个写出来 争取写些别人没写到的东西~~ 好了 开始~~ 这次要做的是个学校管理的demo(通俗些&…
超越英伟达的,不会是另一款GPU?这家深圳公司发布全球首款数据流AI芯片
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6…

不要依赖代码中的异常
因为异常大大地降低性能,所以您不应该将它们用作控制正常程序流程的方式。如果有可能检测到代码中可能导致异常的状态,请执行这种操作。不要在处理该状态之前捕获异常本身。常见的方案包括:检查 null,分配给将分析为数字值的 Stri…

MySQL5.7配置日志
之前使用MySQL 5.1版本的时候,修改my.cnf,在[mysqld]下添加"log/data/mysql/query.log",重启服务就ok了 但是在5.7会出现 Starting MySQL... ERROR! The server quit without updating PID file (/data/mysql/mysql.pid).原因是5.7…

Linux下新增硬盘处理过程
1、Linux的硬盘识别 在/dev/下建立相应的设备文件。如 sda 表示第一块SCSI硬盘 hda 表示第一块IDE硬盘(即连接在第一个IDE接口的Master口上) scd0 表示第一个USB光驱 通过fdisk -l 查看当前的设备和分区信息。注意,新硬盘没有…
FastSpeech语音合成系统技术升级,微软联合浙大提出FastSpeech2
来源 | 微软研究院AI头条(ID: MSRAsia)编者按:基于深度学习的端到端语音合成技术进展显著,但经典自回归模型存在生成速度慢、稳定性和可控性差的问题。去年,微软亚洲研究院和微软 Azure 语音团队联合浙江大学提出了快速…

如果有大型 Web 应用程序,可考虑执行预批编译
每当发生对目录的第一次请求时都会执行批编译。如果目录中的页面没有被分析并编译,此功能会成批分析并编译目录中的所有页面,以便更好地利用磁盘和内存。如果这需要很长时间,则将快速分析并编译单个页面,以便请求能被处理。此功能…

深入理解javascript函数系列第二篇——函数参数
前面的话 javascript函数的参数与大多数其他语言的函数的参数有所不同。函数不介意传递进来多少个参数,也不在乎传进来的参数是什么数据类型,甚至可以不传参数。本文是深入理解javascript函数系列第二篇——函数参数 arguments javascript中的函数定义并…

linux下如何查看某个软件 是否安装??? 安装路径在哪???
<1>.在linux下如何判断是否已经安装某个软件? 我的系统是red hat我用命令rpm查是否安装了某个软件(例如: matlab 与 fluent ),得到了如下的结果:我用rpm -qa (| grep) matlab …

适当地使用公共语言运行库的垃圾回收器和自动内存管理
小心不要给每个请求分配过多内存,因为这样垃圾回收器将必须更频繁地进行更多的工作。另外,不要让不必要的指针指向对象,因为它们将使对象保持活动状态,并且应尽量避免含 Finalize 方法的对象,因为它们在后面会导致更多…
AI又进阶!除了鉴别PS图片,还能一键卸妆
作者 | 马超编辑 | 伍杏玲封图 | 视觉中国出品 | AI科技大本营(ID:rgznai100)最近CVPR2020的论文集合在GitHub火了,CVPR2020-Paper- Code 的项目(https://github.com/extreme-assistant/CVPR2020-Paper-Code-Interpretation&#…