'하둡'에 해당되는 글 12건

 


  • YARN 통해 Task들이 스케줄링되고 클러스터의 여러 노드에서 실행
  • 특정 Task 실패하면 자동으로 다른 노드를 재할당하여 다시 실행됨

 

- YARN 특징

 

  • Resource Manager (RM): 클러스터 전체 자원의 사용량을 관리
  • Node Manager (NM): 컨테이너를 구동하고 모니터링하는 역할을 수행
  • Application Master (AM): 클라이언트의 요청을 담당하여, 컨테이너 수행 결과를 반환함 (구체적인 방법은 애플리케이션에 따라 다름)

 

- YARN 자원 요청

 

  • 컨테이너에 필요한 컴퓨터 자원과 지역성 제약을 표현할 있음

 

  • 지역성을 고려한 특정 랙의 노드 - 동일 랙의 임의 노드 - 클러스터의 임의 노드 순으로 컨테이너 할당을 시도

 

- YARN 스케줄러

 

  • FIFO
    • 쉽고 설정이 필요없지만 공유 클러스터 환경에서는 적절하지 않음
  • Fair
    • 최소한의 자원만 보장하며, 그외 Idle 자원은 동적으로 할당함
  • Capacity
    • Job 제출 즉시 분리된 전용 큐에서 처리하지만, 해당 큐에서 Job 위한 자원을 미리 예약해두기 때문에 전체 클러스터의 효율성을 떨어짐

 

 

참조: Hadoop: The Definitive Guide

 

 

'Development > Hadoop' 카테고리의 다른 글

하둡 공부 - MapReduce 작동 방법  (0) 2019.01.24
하둡 공부 - Hadoop I/O  (0) 2019.01.24
하둡 공부 - Hadoop Read & Write  (0) 2019.01.24
하둡 공부 - HDFS  (0) 2019.01.24
Hadoop 2.7.3 Fully-distributed Mode Setup  (0) 2017.02.01
블로그 이미지

나뷜나뷜

,