무지성 메모

■ Git은 3가지 박스를 동기화하는 작업 ■ UTF-8 간단 설명

배게 2022. 2. 28. 23:38
728x90

[작업영역] -(add)> [인덱스(index)영역] -(commit)> [헤드(Head) 영역]

 

비유 ; 인덱스 - 사진,사진,사진.. / 헤드 - 사진첩

 

Git은 단순하게 잉야기하면 위의 3가지 박스를 일치시키는 것(동기화)이 Git을 관리하는 방법이다.

3가지 박스를 동기화하는 작업..

 

 


[UTF-8은 가장 많이 사용되는 가변 길이 유니코드 인코딩]

 

옛날에는 a-z/0-9/특문등 1바이트면 충분했음 한글도 2바이트면 충분

 

근데 중국 문자가 10만자가 넘어서 3바이트가 필요..

 

// 

우선 Unicode = United Codepage Charset? 정도로 할 수 있는데요.
원래 영어는 1byte를 쓰지만, 중국어나 일본어 한국어 경우에는 2byte를 차지 하게 됩니다. 또 영어를 쓰는 codepage에서는 다른 나라 언어를 읽을 수가 없지요.
그래서 나온게 통합코드페이지 (UNICODE)입니다.
이것은 모든 글자를 2byte로 표시하게 만들어서 어떠한 글자라도 표시할 수 있었습니다.

하지만 영어를 쓰는 사람들에게는 불편했습니다. 1byte면 되는 영어글자를 2byte나 들여야 한다는건 공간낭비라고 생각했기 때문이지요.


그래서 만든것이 UTF-8입니다.. utf-8은 unicode의 장점을 그대로 가지고 있으면서도 영어는 1byte로 쓸 수 있게 만든 codepage입니다.

그래서 어떠한 글자라도 UTF-8로하면 공간절약도 되고, 모든 글자를 수용할 수 있습니다.