多读书多实践,勤思考善领悟

大数据hadoop之 五.Hadoop的一些基本概念

大数据hadoop之 五.Hadoop的一些基本概念

一. Hadoop的构建模块 NameNode(名字节点) DataNode(数据节点) Secondary NameNode(次名字节点) JobTracker(作业跟踪节点) TaskTracker(任务跟踪节点) 1. HDF...

大数据hadoop之 四.Hadoop是什么?

大数据hadoop之 四.Hadoop是什么?

Hadoop是什么? Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS(文件系统,数据存储技术相关)+ M...

大数据hadoop之 三.结构化数据与非结构化数据

大数据hadoop之 三.结构化数据与非结构化数据

结构化数据与非结构化数据       相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式...

大数据hadoop之 二.云计算技术

大数据hadoop之 二.云计算技术

云计算技术:首先让大家明白什么是云端,所谓云端需要两层理解 服务不在本地,这一层可以理解为服务器 它和普通的服务器是不一样的,这些云端的服务器的资源是共享的,一旦一个服务器不能承受,将会把任务分配给其他机器。 云技术与其他技术的区别...

大数据hadoop之 一.云计算概念

大数据hadoop之 一.云计算概念

概述大家知道什么叫做云计算吗?事实上,目前并没有一个确定的定义。然而概括来讲,所谓的云计算,指的就是把你的软件和服务统一部署在数据中心,统一管理,从而实现高伸缩性。 云计算具有以下特性: 虚拟化和自动化 服务器,存储介质,网络等资源都...

浅谈HBase概念及使用

浅谈HBase概念及使用

1. HBase简介1.1 什么是HBaseHBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来...

大数据平台CDH6.2离线搭建

大数据平台CDH6.2离线搭建

1、概述Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称“CDH”),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hiv...

大数据平台Hadoop的完全分布式部署

大数据平台Hadoop的完全分布式部署

一、概述 概念:是一个可靠的、可伸缩的、分布式计算的开源软件。是一个框架,允许跨越计算机集群的大数据及分布式处理,使用简单的编程模型(mapreduce)可从单台服务器扩展至几千台主机,每个节点提供了计算和存储功能。不依赖于硬件处理H...

Hadoop HDFS常用命令

Hadoop HDFS常用命令

1. 基本语法hadoop fs 具体命令 或者 hdfs dfs 具体命令 2. 参数大全123456789101112131415161718192021222324252627282930313233343536[-append...