7.1 快速入门1: 统计表中数据的行数

本节使用官方自带的 RowCounter 来统计每个表有多少行数据.


步骤1: 设置环境变量

就是配置就是 HBASE_HOMEHADOOP_HOME, 如何前面设置过, 跳过此步骤.

export HBASE_HOME=/opt/module/hbase-1.3.2.1
export HADOOP_HOME=/opt/module/hadoop-2.7.2

步骤2: 在hadoop-env.sh中配置HADOOP_CLASSPATH变量

我们的步骤是 Hadoop 从 HBase 读取到数据之后, 然后使用 MapReduce 做分析.

所以 Hadoop 就需要持有 HBase 的一些 jar, 设置HADOOP_CLASSPATH 这个变量可以达到我们的目的

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/opt/module/hbase-1.3.1/lib/*

注意:

  • 把前面这行语句添加for循环之后(或者文件的末尾都可以)

  • 不要忘记分发修改后的配置文件

步骤3: 重新启动 Hadoop 集群

如果要配置生效, 必须重启集群

步骤4: 运行官方的 MapReduce 任务

统计表中有多少行数据

yarn jar lib/hbase-server-1.3.1.jar rowcounter student

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-03-24 12:57:12

results matching ""

    No results matching ""