第 1 章 HA 概述
本章介绍什么是HA, 以及为什么需要HA.
所谓HA就是High Available, 即 7 * 24小时提供服务.
1.1 为什么需要HA
在 Hadoop 1.0 时代,Hadoop 的两大核心组件 HDFS NameNode 和 JobTracker 都存在着单点问题,这其中以 NameNode 的单点问题尤为严重。
因为 NameNode 保存了整个 HDFS 的元数据信息,一旦 NameNode 挂掉,整个 HDFS 就无法访问.
所幸的是,在 Hadoop2.0 中,HDFS NameNode 和 YARN ResourceManger的单点问题都得到了解决.
像 NameNode 和 ResouceManager 在分布式系统中只有一个运行实例, 最大的隐患就是单点故障问题.
Hadoop2.0+ 实现高可用最关键的策略是
1.2 Hadoop 高可用分类
由于HDFS NameNode 和 Yarn ResourceManage 都存在单点失效故障的风险,
所以Hadoop有两种HA:
HDFS HA解决
NameNode的单点故障问题ResourceManage HA解决
ResourceMange的单点故障问题