1.1 Hbase 概述
Hbase 是
1.1.1 Hbase 的起源
2006 年 Google 技术人员 Fay Chang 发布了一篇文章 Bigtable: A Distributed Storage System for Structured Data。
该文章向世人介绍了一种分布式的数据库,这种数据库可以在局部几台服务器崩溃的情况下继续提供高性能的服务。
2007年 Powerset 公司的工作人员基于此文研发了 BigTable的Java 开源版本,即HBase。刚开始它只是 Hadoop 的一部分。
2008年 HBase 成为了 Apache 的一个子项目 。HBase 几乎实现了 BigTable 的所有特性。它被称为一个开源的非关系型分布式数据库。2010 年成为 Apache 的顶级项目. HBase 的开发速度打破了一直以来跟 Hadoop 版本一致的惯例,因为 HBase 的版本发布速度已经超越了 Hadoop。它的版本号一下从 0.20.x 跳跃到了 0.89.x。
1.1.1 Hbase 简述
HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 Hbase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。
HBase 的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组成的大型数据。
HBase 是 Google Bigtable 的开源实现,但是也有很多不同之处。
Google Bigtable 利用 GFS 作为其文件存储系统,HBase 利用 Hadoop HDFS 作为其文件存储系统;
Google 运行 MAPREDUCE来处理 Bigtable 中的海量数据,HBase 同样利用 Hadoop MapReduce 来处理 HBase 中的海量数据;
Google Bigtable 利用 Chubby 作为协同服务,HBase 利用 Zookeeper 作为对应。