多读书多实践,勤思考善领悟

Spark弹性式数据集RDDs

Spark弹性式数据集RDDs

一、RDD简介RDD全称为Resilient Distributed Datasets,是Spark最基本的数据抽象,它是只读的、分区记录的集合,支持并行操作,可以由外部数据集或其他RDD转换而来,它具有以下特性: 一个RDD由一个...