多读书多实践,勤思考善领悟

Hive分区表和分桶表

Hive分区表和分桶表

一、分区表1.1 概念Hive中的表对应为HDFS上的指定目录,在查询数据时候,默认会对全表进行扫描,这样时间和性能的消耗都非常大。 分区为HDFS上表目录的子目录,数据按照分区存储在子目录中。如果查询的where字句的中包含分区条件...

Hive常用DDL操作

Hive常用DDL操作

一、Database1.1 查看数据列表1show databases; 1.2 使用数据库1USE database_name; 1.3 新建数据库语法: 1234CREATE (DATABASE|SCHEMA) [IF N...