多读书多实践,勤思考善领悟

Hive简介及核心概念

Hive简介及核心概念

一、简介Hive是一个构建在Hadoop之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类SQL查询功能,用于查询的SQL语句会被转化为MapReduce作业,然后提交到Hadoop上运行。 特点: 简单、容易上手(提供了类...

hadoop HDFS常用Shell命令

hadoop HDFS常用Shell命令

HDFS文件操作       HDFS是一种文件系统,专为MapReduce这类框架下的大规模分布式数据处理而设计,你可以把一个大数据集(比如说100TB)在HDFS中存储为单个文件,而大多数其...

大数据hadoop学习路线

大数据hadoop学习路线

大数据学习路线一、大数据处理流程 上图是一个简化的大数据处理流程图,大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。下面我们逐一对各个环节所需要的技术栈进行讲解: 1.1 数据收集大数据处理的第一步是数...

大数据hadoop常用软件安装指南

大数据hadoop常用软件安装指南

大数据常用软件安装指南为方便大家查阅,软件的安装方式单独整理如下: 一、基础软件安装 Linux环境下JDK安装 Linux环境下Python安装 虚拟机静态IP及多IP配置 二、Hadoop Hadoop单机环境搭建 Hadoop...