Programing/JAVA

알기쉽게 정리한 JAVA의 컴파일과정 및 JVM 메모리 구조, JVM GC

리커니 2018. 5. 2.
반응형

알기쉽게 정리한 JAVA의 컴파일과정 및 JVM 메모리 구조, JVM GC

 

 

 

 

 

 

자바 개발자들이 간과 하기 쉬운 JAVA의 메모리 구조에 대해 포스팅 해보려고 합니다. 이와 관련하여 JAVA의 컴파일 과정과 Garbage Collector(GC)에 대해서도 알아보도록 하겠습니다.

 

우선 자바가 OS에 독립적이라는 사실은 알고 계실 겁니다. 그 이유는 JVM(Java Virtual Machine)이 OS와 프로그램의 사이에서 기계어로 해석해주는 역할을 하기 때문입니다. 어떠한 OS든 Java가 설치 되어 있다면 JVM에 의해서 .java 코드가 기계어로 해석될 수 있습니다. 그럼 그 과정에 대해서 자세히 알아보도록 하죠.

 

우선 자바 개발자들이 Eclipse나 기타 개발툴을 사용해 .java 파일을 생성합니다. 그리고 Build 라는 작업을 하게 되면 Java Complier의 javac 라는 명령어를 사용해 .class 파일을 생성하게 됩니다. 이 것은 아직 컴퓨터가 읽을 수 없는 자바 바이트코드(반기계어) 입니다.

 

 

이렇게 생성된 자바 바이트 코드(.class)는 클래스 로더에 의해서 JVM내로 로드 되고, 실행엔진에 의해 기계어로 해석되어 메모리 상(Runtime Data Area)에 배치되게 됩니다. 실행엔진에는 Interpreter와 JIT(Just-In-Time) Compiler가 있습니다. Interpreter는 바이트 코드를 한줄씩 읽기 때문에 실행이 느린 단점이 있었습니다. 이러한 단점을 보완하기 위해 나온 것이 JIT Compiler 입니다. 인터프리터 방식으로 실행을 하다가 적절한 시점에 바이트 코드 전체를 컴파일 하고 더이상 인터프리팅 하지않고 해당 코드를 직접 실행 하는 것 입니다. JIT Compiler에 의해 해석된 코드는 캐시에 보관하기 때문에 한 번 컴파일 된 후에는 빠르게 수행하는 장점이 있습니다. 하지만 인터프리팅 방식보다는 훨씬 오래 걸리므로 한번만 실행하면 되는 코드는 인터프리팅 하는 것이 유리합니다.

 

정리하면,

Interpreter : 자바 바이트 코드를 한줄 씩 실행. 속도가 느림.

JIT Compiler : Interpreter의 단점을 보완. 전체 바이트 코드를 컴파일. 속도가 느림. 하지만 캐시 사용으로 한번 컴파일 하면 다음에는 빠르게 수행됨.

입니다.

 

 

 

그럼 이제 각 메모리 영역에 어떤 것들이 올라가게 되는지 보도록 하죠.

 

Stack Area

클래스 내의 메소드에서 사용되는 정보들이 저장되는 공간입니다. 매개변수, 지역변수, 리턴값 등이 저장되며 LIFO(Last In First Out) 방식으로 메소드 실행 시 저장되었다가 실행이 완료되면 제거됩니다. 임시 저장공간으로 생각하시면 됩니다.

 

Method(Class, Static) Area

클래스와 메소드, 멤버(클래스, 인스턴스)변수와 상수(final) 정보 등이 저장되는 공간입니다.

 

Heap Area

New명령어를 통해 생성한 인스턴스와 배열 등의 참조형 변수정보가 저장되는 공간입니다. 물론 Method Area에 올라온 클래스들만 생성이 가능합니다. GC의 대상이 된다.

 

PC Register Area

쓰레드마다 하나씩 생성. JVM 명령의 주소값이 저장되는 공간입니다.

 

Native Method Stack Area

자바 외 다른 언어의 호출을 위해 할당되는 영역입니다. 자바에서 C/C++의 메소드를 호출할 때 사용하는 Stack 영역이라고 생각하시면 됩니다.

 

예를 들어 getList, insertList, updateList, deleteList CRUD 메소드가 있는 ListController class가 있을 때 이 클래스와 메소드의 정보는 실행엔진에 의해 Method 영역에 올라가며, 클래스의 메소드 호출이 발생하면 Method 영역의 정보를 읽어 해당 메소드의 매개변수, 지역변수 리턴값 등이 Stack 영역에 올려 처리되게 됩니다. 그리고 메소드의 실행이 끝나면 Stack 영역에서는 자동으로 제거되게 됩니다.

만약 메소드 내에 New 명령어로 생성한 인스턴스나 배열이 있을 경우 해당 값은 Heap 영역에 저장되고 Stack 영역에서는 이 Heap 영역의 값을 참조 할 수 있는 메모리 주소 값만 저장되게 됩니다.

배열을 System.out.println(); 하게 되면 메모리 주소 값이 출력되는 이유가 이 것 입니다.

 

 

 

그럼 이제 Heap 영역의 메모리를 관리하는 Garbage Collector에 대해서 알아보도록 하겠습니다. 자바에서는 메모리를 명시적으로 지정하여 해제하지 않기 때문에 GC의 역할이 중요합니다.

간단히 GC는 reachability라는 개념을 사용해 참조되지 않는 객체들의 메모리를 회수하는 역할을 합니다.

System.gc(); 로 GC를 실행하는 것 처럼 할 수는 있으나, 실제 바로 실행하는 것은 아니고, 실행을 요청하는 것입니다. 안티패턴으로 사용을 권장하지는 않습니다.

 

 

 

 

Heap 영역은 아래와 같이 크게 세 영역으로 나뉘게 됩니다.

자바8 부터는 Permanent 영역 대신에 Java Heap 영역이 아니라 Metaspace로 호출되는 네이티브 영역에 저장됩니다.

 

 

Minor, Major GC

Heap 영역에 객체가 생성되면 최초로 Eden 영역에 할당됩니다. 그리고 이 영역에 데이터가 어느정도 쌓이게 되면 참조정도에 따라 Servivor1, Servivor2 중 빈 공간으로 이동되거나 회수됩니다.  New Generation(Eden+Servivor1,2) 영역이 차게 되면 또 참조정도에 따라 Old영역으로 이동 되게 되거나 회수됩니다. 이렇게 New Generation에서의 GC를 Minor GC 라고 합니다.

 

Old영역에 할당된 메모리가 허용치를 넘게 되면, Old 영역에 있는 모든 객체들을 검사하여 참조되지 않는 객체들을 한꺼번에 삭제하는 GC가 실행됩니다. 시간이 오래 걸리는 작업이고 이 때 GC를 실행하는 쓰레드를 제외한 모든 스레드는 작업을 멈추게 됩니다. 이를 'Stop-the-World' 라 합니다. 그리고 이렇게 'Stop-the-World'가 발생하고 Old영역의 메모리를 회수하는 GC를 Major GC라고 합니다. 앞에서 말한 것과 같이 Major  GC가 실행되면 이것이 종료될 때 까지  다른 모든 쓰레드가 멈추기 때문에 성능에 영향을 끼칠 수 밖에 없습니다.

 

GC에 대한 더 자세한 설명은 아래의 Link를 확인하세요!

 

Link : https://aljjabaegi.tistory.com/636

 

Java GC Gargabe Collection 알짜만 빼먹기 / 알고리즘 / 종류 / 모니터링 VisualVM

Java GC Garbage Collection 알짜만 빼먹기 / 알고리즘 / 종류 / 모니터링 VisualVM 이번 포스팅에서는 제가 알고있는 Garbage Collection에 대해 정리하는 시간을 갖어볼까 합니다. GC (Garbage Collection) 란?..

aljjabaegi.tistory.com

 

지금까지 자바의 컴파일 과정과 JVM의 메모리구조, GC 까지, JAVA의 전반전인 흐름에 대해서 알아보았습니다. 공부를 하면 할 수록 더 깊은 곳에 대한 궁금증이 생기게 되는 것 같네요.

잘못된 부분이나 궁금한 점은 댓글 달아주세요~

반응형

댓글

💲 추천 글