HBaseの情報
提供: LunaBiblos
Software > DataBase > KeyValueストア > HBaseの情報
資料
| HBase / HBase 実践編 | 開発者による Apachecon 2009 プレゼンテーション資料 (PDF 52ページ、1.8MB) |
| HBase EC2 scripts | EC2上でHBase Clusterを纏めて起動するScript |
Tips
- Sequentialな処理はHDFSの方が速い。
| Fat table | 1000 rows with 1000 columns, 1MB values |
| Wide table | 1000 rows with 20000 columns each |
| Wide&Sparse table | 1000 rows with 20000 columns each But almost Null |
| Tall table | 1 million rows with a single column |
Wideは非正規化Data全般。TallはKVSに特化したSimpleなData形式。FatはHadoopに処理をさせたい様な巨大Data
Column毎にStoreFileは分かれているが、同一のRegionServerが管理する為、StrongConsistencyのままであり、行単位の操作はAtomicに行われる。
HBaseで結果整合性を採用しているのは現在開発段階にあるデータセンター間のReplicationのみ。それ以外はStringConsistencyが保証される為、Columnの値を+1とかも可能
SplitRegion型はSPoF対応が難しくなるがConsistencyの保証は簡単になる。HBaseはHDFS上でDataをレプリカする事でSPOF対策を行って居る。