안단테 안단테

[BigData] 하둡(hadoop) 용어 정리 본문

IT 기술/BigData

[BigData] 하둡(hadoop) 용어 정리

안단테에 2022. 3. 5. 11:31
728x90
반응형

하둡(haddop)에서 사용하는 용어 정리이다.

 

 

[JPS]


- Java Virtual Machine Process Status Tool.
 시스템에서 실행 중인 자바 프로세스를 출력합니다

 



[Jobtracker]


- jobtracker는 사용자와 프레임워크간의 상호작용이 이루어지는 접점이다. 
- jobtracker는 map, reduce 작업들이 tasktracker들에 할당되는 것을 관리한다. 
- 작성될 TaskTracker와 종속 작업의 수를 결정하여 각 하위 작업을 TaskTracker에 할당한 후  각 TaskTracker가 상태를 보고하면 완료된 작업은 JobTracker로 돌아간다. 


[Tasktracker]


- tasktracker는 jobtracker가 지시한 작업을 수행하고 map 과 reduce 단계 사이의 데이타 이동을 담당
  


네임노드 [Namenode]

- file 과 directory 의 읽기, 닫기, 이름바꾸기등 파일 시스템의 namespace 의 여러 기능을 수행
- 데이터 노드와 블럭을 맵핑



데이타노드 [Datanode]

- 클러스터의 각 노드에 하나씩 존재
- 실행될 때마다 노드에 추가되는 스토리지 관리
- 블럭저장 ( 일반적으로 파일은 여러 블럭으로 나뉘어져 있고, 그 블럭이 datanode 에 저장 )
- 파일 시스템의 클라이언트가 요구하는 읽기, 쓰기 기능 담당
- 네임노드에서의 생성, 삭제, 복제 기능 수행

 


gateway address

다른 네트워크로 데이터를 전달하려면 컴퓨터는 데이터를 다른 네트워크와 연결되는 지점으로 보내야합니다. 이처럼다른 네트워크로 데이터를 전송을 알 수 있도록 네트워크와 네트워크가 연결되는 지점을 게이트 웨이라고 합니다. 게이트웨이주소에는 게이트웨이장비가 있어서 다른 네트워크로 데이터를 보내기 위한 경로를 알려주고 목적지 네트워크로 데이터를 다시 전송합니다. 네트워크 주소의 마지막이 1인 주소를 게이트웨이 주소로 사용하는것이 관례입니다. (일반적인 사례이기 때문에 변경될수도 있습니다.)

728x90
반응형
Comments