多读书多实践,勤思考善领悟

Storm集成Kafka

Storm集成Kafka

一、整合说明Storm官方对Kafka的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对0.8.x版本的Kafka提供整合支持; Storm Kafka Integration...

Storm集成HDFS和HBase

Storm集成HDFS和HBase

一、Storm集成HDFS1.1 项目结构 本用例源码下载地址:storm-hdfs-integration 1.2 项目主要依赖项目主要依赖如下,有两个地方需要注意: 这里由于我服务器上安装的是CDH版本的Hadoop,...

Storm三种打包方式对比分析

Storm三种打包方式对比分析

一、简介在将Storm Topology提交到服务器集群运行时,需要先将项目进行打包。本文主要对比分析各种打包方式,并将打包过程中需要注意的事项进行说明。主要打包方式有以下三种: 第一种:不加任何插件,直接使用mvn package...

Storm编程模型

Storm编程模型

一、简介下图为Strom的运行流程图,在开发Storm流处理程序时,我们需要采用内置或自定义实现spout(数据源)和bolt(处理单元),并通过TopologyBuilder将它们之间进行关联,形成Topology。 二、I...

Storm核心概念详解

Storm核心概念详解

一、Storm核心概念 1.1 Topologies(拓扑)一个完整的Storm流处理程序被称为Storm topology(拓扑)。它是一个是由Spouts 和Bolts通过Stream连接起来的有向无环图,Storm会保持...

Storm和流处理简介

Storm和流处理简介

一、Storm1.1 简介Storm 是一个开源的分布式实时计算框架,可以以简单、可靠的方式进行大数据流的处理。通常用于实时分析,在线机器学习、持续计算、分布式RPC、ETL等场景。Storm具有以下特点: 支持水平横向扩展; 具有...

深入理解Kafka副本机制

深入理解Kafka副本机制

一、Kafka集群Kafka使用Zookeeper来维护集群成员(brokers)的信息。每个broker都有一个唯一标识broker.id,用于标识自己在集群中的身份,可以在配置文件server.properties中进行配置,或者...

Kafka消费者详解

Kafka消费者详解

一、消费者和消费者群组在Kafka中,消费者通常是消费者群组的一部分,多个消费者群组共同读取同一个主题时,彼此之间互不影响。Kafka之所以要引入消费者群组这个概念是因为Kafka消费者经常会做一些高延迟的操作,比如把数据写到数据库或...

Kafka生产者详解

Kafka生产者详解

一、生产者发送消息的过程首先介绍一下Kafka生产者发送消息的过程: Kafka会将发送消息包装为ProducerRecord对象, ProducerRecord对象包含了目标主题和要发送的内容,同时还可以指定键和分区。在发送Pro...