5.1 Hbase 是如何存储数据的

宏观架构

微观架构


Region Server 的结构

Region Server 它有下面4个部分组成:

  • WAL: 预写日志(Write Ahead Log)是一 HDFS 上的一个文件, 如果region server崩溃后, 日志文件用来恢复新写入的的, 但是还没有存储在硬盘上的数据.

  • BlockCache: 读取缓存, 在内存里缓存频繁读取的数据, 如果BlockCache满了, 会根据LRU算法(Least Recently Used)选出最不活跃的数据, 然后释放掉

  • MemStore: 写入缓存, 在数据真正被写入硬盘前, Memstore在内存中缓存新写入的数据. 每个region的每个列簇(column family)都有一个memstore. memstore的数据在写入硬盘前, 会先根据key排序, 然后写入硬盘.

  • HFiles: HDFS 上的数据文件, 里面存储KeyValue对.

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-03-25 21:13:15

results matching ""

    No results matching ""