多读书多实践,勤思考善领悟

大数据hadoop之 四十八.Hadoop的CDH发行版本

大数据hadoop之 四十八.Hadoop的CDH发行版本

Hadoop的CDH版本是什么?1.Apache社区版 优点:完全开源免费 社区活跃 文档、资料详实 缺点:版本管理比较混乱,各种版本层出不穷,很难选择,选择生态组件时需要大量考虑兼容性问题、版本匹配问题、组件冲突问题、编译问题等。...

大数据hadoop之 四十五.Spark介绍

大数据hadoop之 四十五.Spark介绍

一. Apache Spark是什么?Spark是一个用来实现快速而通用的集群计算的平台。扩展了广泛使用的MapReduce计算模型,而且高效地支持更多的计算模式,包括交互式查询和流处理。在处理大规模数据集的时候,速度是非常重要的。S...

大数据hadoop之 四十四.HBase监控语诊断

大数据hadoop之 四十四.HBase监控语诊断

一. 监控为什么需要监控?为了保证系统的稳定性,可靠性,可运维性。 掌控集群的核心性能指标,了解集群的性能表现。 集群出现问题时及时报警,便于运维同学及时修复问题。 集群重要指标值异常时进行预警,将问题扼杀在摇篮中,不用等集群真正不...

大数据hadoop之 四十二.HBASE使用管理工具

大数据hadoop之 四十二.HBASE使用管理工具

每个人都希望自已的HBASE管理员能够让集群运行流畅,存储大量的数据,并且能同时,迅速和可靠地处理几百万的并发请求.对于管理员来说,让HBASE中海量数据一直保持可存取,易管理和便于查询是一项至关重要的任务. 除了对于你运行的集群要有...