안단테 안단테

11. HBase 소개 - 4 본문

IT 기술/BigData

11. HBase 소개 - 4

안단테에 2023. 2. 3. 15:33
728x90
반응형

11. HBase 소개 - 4

 

- 아파치 주키퍼

 

주키퍼는 디렉토리와 파일에 대한 팡리 시스템과 비슷한 접근 방식 제공(파일 해당 요소 znode)

분산 시스템에서 소유권을 협상하거나, 서비스를 등록하거나, 갱신 상황을 고나찰하는데 사용

 

모든 리전서버는 주키퍼에 자신의 임시노드 생성

마스터에서 가용한 서버를 차례로 가려내는데 사용

임시 노드는 서버 고장이나 망 분할을 감지하는 데에도 사용

 

임시노드는 주키퍼와 그 임시노드를 생성한 클라이언트 사이의 세션에 의존

세션에 고장이 보고되면 주키퍼에서 죽은 것으로 선언하고 이와 연관된 임시 노드 삭제

 

HBase는 마스터가 단 한대만 실행되도록 함

리전 검색을 위한 부트스트랩 위치를 저장하는 리전 서버의 등록

Zookeeper 없으면 HBase 사용 안됨

 

HBase는 상태 일관성을 유지하기 위해 서버들과 zap 프로토콜의 조합을 사용하는 zookeeper의 분산형 설계를 이용

 

- 마스터 서버

리전 서버 간이 리전의 부하 분산을 처리하는 역할 담당

테이블 및 columnfamily의 생성 같은 스키마 변경 사항 및 기타 메타데이터 작업 수행

 

- 리전 서버

자신이 담당하는 모든리전에 대한 읽기와 쓰기 요청 처리

설정된 크기 한계를 초과한 리전을 분할

 

1.4.6 정리

 

컬럼 지향 구조에서는 NULL을 저장하는 공간이 필요 없기 때문에 거대하고, 넓고, 희소한 테이블 설계가 가능

각 로우는 단 하나의 서버에서만 운용되므로 일관성이 강력하여 다중 버전을 사용할 때에와는 달리 서로 다른 작업이 동시에 한 데이터를 수할 대의 충돌을 회피할 수 있고 변경 이력을 유지

 

1.5.3 최종 저리

 

- HBase

분산형, 영구저장식, 엄격하게 일관성 있는 저장 시스템

입출력 채널의 포화도면에서 쓰기에 준최적이며 읽기 성능도 탁월

디스크 공간을 효율적으로 사용

필터를 제공하여 네트워크를 통해 전송되는 데이터양을 줄인다

SQL 쿼리문은 없어서 트랜잭션 관련 작업에 대한 자원은 제한적

로우를 읽고 변경하고 쓰는 연산에 대한 원자성 보장은 이 약점을 보안

 -> 대기상태나 데드락 관련 정지 문제 해결

부하 이동 및 장애 처리를 클라이언트에게 매끄럽고 투명하게 제공

확장기능 내장

클러스터 설정을 변경해도 재분산, 재샤딩이 발생하지 않으며 모든 것을 자동으로 수행

 

728x90
반응형

'IT 기술 > BigData' 카테고리의 다른 글

13. HBase 클라이언트 API  (0) 2023.02.06
12. HBase 요구사항  (1) 2023.02.03
10. HBase 소개 - 3  (1) 2023.02.03
9. HBase 소개 - 2  (0) 2023.02.03
8. HBase 소개 - 1  (0) 2023.02.03
Comments