HFile 데이터는 HFile 이라는 파일에 저장된다 이 파일은 데이터가 영구 저장되고 정렬되며 고정불변의 Key-Value쌍 맵이다. 이 저장파일은 특정 값에 접근할수도 있고 시작값과 끝값이 주어지면 값의 범위를 탐색할 수 있는 API를 제공한다. 모든 HFile이 블록 색인을 갖고 있으므로 검색은 단 한번의 디스크 판독으로 수행될 수 있다. 검색하고자 하는 키를 가지고 있을 것으로 예상되는 블록을 지정-> 메모리에 저장되어 있는 블록 색인에서 이진탐색을 수행하여 결정 -> 디스크에서 블록을 읽어들여 실제 키를 얻는다. HFile은 보통 hdfs에 저장되는데 확장성이 있고, 데이터가 영구저장되며, 여러 사본으로 복제되는 저장계층을 제공해준다. 데이터가 갱신되면 제일 먼저 WAL (Write-Ahead ..
컬럼 hbase의 가장 기본적인 단위 컬럼은 여러 개의 버전을 지닐 수 있고, 버전의 값은 각각 별도의 셀에 저장된다. 각 셀의 다중 버전을 허용하여 추가적인 차원을 제공한다. 개수에 제한이 있다. 컬럼패밀리의 이름은 출력가능한 문자들로 이뤄져있어야함 패밀리: 퀄리파이어 컬럼은 제한이 없다. ==> 하나의 컬럼패밀리에 수백만개의 컬럼 저장가능. 컬럼값의 데이터 타입이나 길이에도 제한 없음 컬럼 자동생성 또는 명시적 생성 가능 셸 하나의 서로 다른 버전은 타임스탬프에 대해 내림차순으로 저장되서 최근의 값을 먼저 읽을 수 있다. 사용자는 값에 몇 개의 버전을 저장할지 지정 가능 술어적 삭제를 이용해서 지난주에 추가된 값들만 유지하는 식의 활용 가능 값은 해석되지 않은 바이트 배열이다 --> 클라이언트는 이것..