본문 바로가기
IT

유니코드에 대한 설명 정리

by 미니송 2018. 5. 12.




유니코드란?


유니코드는 각 나라별 언어를 모두 표현하기 위해 나온 코드 체계가 유니코드입니다. 유니코드는 사용중인 운영체제, 프로그램, 언어에 관계없이 문자마다 고유한 코드 값을 제공하는 새로운 개념의 코드입니다. 언어와 상관없이 모든 문자를 16비트로 표현하므로 최대 65536자를 표현할 수 있습니다.


유니코드는 표준으로 전 세계의 모든 문자를 다루도록 설계된 표준 문자 전산처리방식입니다. 유니코드를 사용하면 한글과 아랍어 등을 꺠지지 않도록 사용할 수 있습니다. 처음에 사용하던 문자는 ASCII코드 입니다. 1바이트의 남은 공간에 각 나라 자국 문자를 할당하였습니다.


하지만 이런 상황에서 다른 국가에 이메일을 보냈더니 글자가 깨지게 됩니다. 유니코드는 2~3바이트의 공간에 모든 문자를 담을 수 있게 바꾸었습니다. 


글자를 모두 표현할 수 있다는 장점이 있지만 프로그래밍 등에서 용량이 커진다는 단점이 있기 때문에 비효율적이라는 말이 있습니다. 또한 그 비효율성 때문에 가변길이 문자 인코딩을 도입하여 기존 ASCII와 호환되는 규격도 도입하였습니다.



댓글