多读书多实践,勤思考善领悟

Scala集合综述

Scala集合综述

一、集合简介Scala中拥有多种集合类型,主要分为可变的和不可变的集合两大类: 可变集合: 可以被修改。即可以更改,添加,删除集合中的元素; 不可变集合类:不能被修改。对集合执行更改,添加或删除操作都会返回一个新的集合,而不是修改...

Scala数组相关操作

Scala数组相关操作

一、定长数组在Scala中,如果你需要一个长度不变的数组,可以使用Array。但需要注意以下两点: 在Scala中使用(index)而不是[index]来访问数组中的元素,因为访问元素,对于Scala来说是方法调用,(index)相...

Scala流程控制语句

Scala流程控制语句

一、条件表达式ifScala中的if/else语法结构与Java中的一样,唯一不同的是,Scala中的if表达式是有返回值的。 1234567object ScalaApp extends App { val x = "s...

Scala基本数据类型和运算符

Scala基本数据类型和运算符

一、数据类型1.1 类型支持Scala 拥有下表所示的数据类型,其中Byte、Short、Int、Long和Char类型统称为整数类型,整数类型加上Float和Double统称为数值类型。Scala数值类型的取值范围和Java对应类型...

Scala简介及开发环境配置

Scala简介及开发环境配置

一、Scala简介1.1 概念Scala全称为Scalable Language,即“可伸缩的语言”,之所以这样命名,是因为它的设计目标是希望伴随着用户的需求一起成长。Scala是一门综合了面向对象和函数式编程概念的静态类型的编程语言...

Azkaban Flow 2.0的使用

Azkaban Flow 2.0的使用

一、Flow 2.0 简介1.1 Flow 2.0 的产生Azkaban 目前同时支持 Flow 1.0 和 Flow2.0 ,但是官方文档上更推荐使用Flow 2.0,因为Flow 1.0会在将来的版本被移除。Flow 2.0的主要...

Azkaban Flow 1.0 的使用

Azkaban Flow 1.0 的使用

一、简介Azkaban主要通过界面上传配置文件来进行任务的调度。它有两个重要的概念: Job: 你需要执行的调度任务; Flow:一个获取多个Job及它们之间的依赖关系所组成的图表叫做Flow。 目前 Azkaban 3.x 同时...

Azkaban简介

Azkaban简介

一、Azkaban 介绍1.1 背景一个完整的大数据分析系统,必然由很多任务单元(如数据收集、数据清洗、数据存储、数据分析等)组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题: 如何定时调度某...

Sqoop基本使用

Sqoop基本使用

一、Sqoop 基本命令1. 查看所有命令1# sqoop help 2. 查看某条命令的具体使用方法1# sqoop help 命令名 二、Sqoop 与 MySQL1. 查询MySQL所有数据库通常用于Sqoop与MyS...

Sqoop简介与安装

Sqoop简介与安装

一、Sqoop 简介Sqoop是一个常用的数据迁移工具,主要用于在不同存储系统之间实现数据的导入与导出: 导入数据:从MySQL,Oracle等关系型数据库中导入数据到HDFS、Hive、HBase等分布式文件存储系统中; 导出数...