Hadoop实战培训教程18_Hadoop集群环境搭建配置_Hive应用开发
Hadoop实战培训教程18_Hadoop集群环境搭建配置_Hive应用开发
1、Hive的服务
Hive不仅仅是一个shell,通过配置,它可以提供诸如Thrift服务器、Web接口、元数据和JDBC/ODBC服务,具有强大的功能和良好的可扩展性。
1.1 Hive Shell
Hive Shell是默认的服务,提供命令行接口,可以在此命令行上直接编写HiveQL语句执行,每条语句以分号结束,也可以在Hive Shell上执行Hive自带的管理命令,例如导入jar包,加入临时环境变量等操作。
1191
1)执行Hive语句
执行查询语句
hive>select name from xp;
从上面的得知,在执行“select * from xp;”时,可以看到启动了一个MapReduce job,建好表导入数据后,就可以浏览与Hive相关的目录。
执行HDFS文件操作
在Hive的shell上使用dfs命令可以查看HDFS上的文件
HDFS上的“/user/hive/warehouse”目录是Hive的数据仓库目录,每个表对应一个以表明命名的目录,目录下存放导入的文件、分区目录、桶目录等数据文件。Hive的查询日志默认保存在本地文件系统的“/tmp/
河北工业大学——软件工程与理论实验室 编辑:虾皮 1
创建时间:2012/3/24 修改时间:2012/3/26 修改次数:0
存在本地的“/tmp/
hive.metastore.metadb.dir:(HDFS上的)数据目录
hive.querylog.location:查询日志存放目录
hive.exec.scratcher:(HDFS上的)临时文件目录
2)设置和查看临时变量
备注:设置只在当前会话有效,方便切换Hive的执行环境。