2.9 Hive 常见属性配置
2.9.1 Hive 数据仓库配置
- Defaul t数据仓库的最原始位置是在 hdfs 上的:
/user/hive/warehouse
路径下 - 在仓库目录下,没有对默认的数据库 Default 创建文件夹。如果某张表属于default数据库,直接在数据仓库目录下创建一个文件夹。
- 可以
hive-site.xml
中修改 Default 仓库的位置. 但是一般没有必要去改<property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> <description>location of default database for the warehouse</description> </property>
2.9.2 查询后信息显示配置
<property>
<name>hive.cli.print.header</name>
<value>true</value>
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>
这个两个属性用来控制是在查询的结果中显示列名和数据库名. 在以前的 CLI 中设置有效. 在新的 Beeline 中无序进行设置: 都总会显示列名和数据库名.
2.9.3 Hive 运行日志信息配置
Hive 的 log 默认存放在
/tmp/atguigu/hive.log
修改存放路径:
- 复制文件
cp hive-log4j2.properties.template hive-log4j2.properties
- 在文件中修改 log 存放路径
property.hive.log.dir =/opt/module/hive-1.2.2/logs
- 复制文件
2.9.4 参数的几种配置方式
在 Beeline 交互命令行内通过 set;
可以查看所有的配置信息.
下面介绍 3 中配置方式
配置文件方式
默认配置文件是:
hive-default.xml
用户自定义配置文件:
hive-site.xml
用户自定义的配置会覆盖默认配置.
命令行参数方式 启动命令的时候设定一些参数. 仅对当前会话起作用. 会覆盖用户的配置文件
例如:
beeline -u jdbc:hive2://localhost:10000 -hiveconf mapred.reduce.tasks=10
参数声明方式
可以在 HQL 中使用
set
关键字设定参数