728x90
Yarn이란 ?
하둡의 클러스터 자원 관리 시스템.
맵리듀스의 성능 향상을 위해 Hadoop2 에서 처음 도입되었지만,
맵리듀스 뿐 아니라 다른 분산 컴퓨팅 도구도 지원한다.
Yarn 은 클러스터의 자원을 요청하고 사용하기 위한 API 를 제공한다.
맵리듀스, 스파크 등과 같은 분산 컴퓨팅 프레임워크는
클러스터 계산 계층 (Yarn) 과 클러스터 저장 계층 (HDFS) 위에서 YARN 애플리케이션을 실행한다.
** Yarn 애플리케이션 수행
리소스 매니저 / 노드 매니저
두 유형의 장기 실행 데몬을 통해 핵심 서비스를 제공한다.
- 리소스 매니저 : 전체 자원의 사용량 관리
- 노드 매니저 : 컨테이너를 구동하고 모니터링
'Data Engineering > Hadoop' 카테고리의 다른 글
하둡 설치) 1. ntp 설정하기 (0) | 2024.02.26 |
---|---|
하둡 설치 ) 네트워크 설정 - 1. SSH key 생성 및 교환 (0) | 2024.01.31 |
[Hive] - 특정 컬럼 제외 후 모두 선택 (0) | 2023.08.21 |
Hadoop (0) | 2022.05.29 |
맥에서 brew 로 하둡 경로 찾기, 옵션넣기 (0) | 2021.07.20 |