多读书多实践,勤思考善领悟

Spark Streaming 整合 Kafka

Spark Streaming 整合 Kafka

一、版本说明Spark针对Kafka的不同版本,提供了两套整合方案:spark-streaming-kafka-0-8和spark-streaming-kafka-0-10,其主要区别如下: spark-streaming-k...

Spark Streaming 整合 Flume

Spark Streaming 整合 Flume

一、简介Apache Flume是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming提供了以下两种方式用于Flume的整合。 二、推送式方法在推送式...

Spark Streaming 基本操作

Spark Streaming 基本操作

一、案例引入这里先引入一个基本的案例来演示流的创建:获取指定端口上的数据并进行词频统计。项目依赖和代码实现如下: 12345<dependency> <groupId>org.apache.spark&l...

Spark Streaming与流处理

Spark Streaming与流处理

一、流处理1.1 静态数据处理在流处理之前,数据通常存储在数据库,文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。Hadoop采用HDFS进行数据存储,采用MapReduce进行数据查...