알짜정보/IT정보

인코딩 정리 Java, javascript 아스키코드, 유니코드 구하는 방법

리커니 2019. 9. 18.
반응형

인코딩 정리 아스키코드, 유니코드, UTF-8, EUC-KR 등

ASCII CODE (아스키 코드)

미국정보교환표준부호(American Standard Code for Information Interchange)

7비트 인코딩으로

33개 출력 불가능한 제어 문자들(역사적인 이유로 남았으며, 대부분 더이상 사용 안함)과

공백을 비롯한 95개의 출력 가능한 문자(알파벳 대소문자 52개, 10개 숫자, 32개의 특수문자, 하나의 공백)들로

총 128개로 구성.

 

[javascript ASCII 코드 구하는 법]

 

var askii = "A".charCodeAt(0);

 

결과 : 65

 

[Java ASCII 코드 구하는 법]

 

int askii = (int) 'A';

 

결과 : 65

 

Unicode (유니코드)

아스키 코드의 확장.

전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준.

우리가 자주 사용하는 UTF-8 도 유니코드를 위한 가변 길이 문자 인코딩 방식 중의 하나.

유니코드를 사용하면, 한글과 중국어, 아랍문자등을 동일한 환경에서 깨지지 않고 사용 가능.

문자를 16비트로 표현, 최대 65,536자까지 표현할 수 있다.

 

[Javascript Unicode 구하는 법_10진수 표현]

 

var uniCode = "가".charCodeAt(0);

 

결과 : 44032

 

[Javascript Unicode 구하는 법_16진수 표현]

 
var uniCode = "가".charCodeAt(0).toString(16);
 

결과 : ac00

 

[Java Unicode 구하는 법_10진수 표현]

 

int uniCode = (int)'가';

 

결과 : 44032

 

[Java Unicode 구하는 법_16진수 표현]

 
String uniCode = String.format("%02X%n", (int)'가');

 

결과 : AC00

 

16진수의 값에 \ 를 붙이게 되면 유니코드로 인식되며, 0x가 붙으면 16진수가 됩니다.

반응형

댓글

💲 추천 글