多读书多实践,勤思考善领悟

大数据hadoop之 四十八.Hadoop的CDH发行版本

本文于1841天之前发表,文中内容可能已经过时。

Hadoop的CDH版本是什么?

1.Apache社区版

优点:
完全开源免费 社区活跃 文档、资料详实

缺点:
版本管理比较混乱,各种版本层出不穷,很难选择,选择生态组件时需要大量考虑兼容性问题、版本匹配问题、组件冲突问题、编译问题等。
集群的部署安装配置复杂,需要编写大量配置文件,分发到每台节点,容易出错,效率低。
集群运维复杂,需要安装第三方软件辅助。

2.第三方发行版(CDH/HDP/MapR)

优点:
基于Apache协议,100%开源。
版本管理清晰
提供了部署、安装、配置工具,大大提高了集群部署的效率
运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。

缺点:
涉及到厂商锁定的问题。

1、cdh比原生的Apache发行版本包含了更多的补丁,用于增强稳定性,改善功能,有时候还增加功能特性
2、cdh版本是由cloudera公司开源的,可以使用cm平台进行管理,比原生的Apache版本安装、维护更加省力
3、但是对技术人员的要求更高,必须对原生apache版本的各个组件理解清晰
4、在cm管理平台中,cdh的parcel包不包含某些组件,需要自己下载对应的parcel包,比如说kafka
5、对hdfs部署过程中,对磁盘进行lvm卷轴或者是磁盘目录统一,对于多台机器,否则之后维护成本高

总结:更安全、更方便。