实战大数据（Hadoop+Spark+Flink）：从平台构建到交互式数据分析（离线/实时）

上QQ阅读APP看书，第一时间看更新

第3章基于Hadoop构建大数据平台

学习目标

● 掌握Zookeeper分布式集群的构建。

● 理解HDFS分布式文件系统的架构与设计。

● 理解YARN资源管理系统的架构与设计。

● 掌握Hadoop分布式集群的构建。

● 理解MapReduce编程模型。

大数据项目最终需要运行在大数据平台之上，而构建Hadoop集群是构建整个大数据平台的核心。Hadoop集群包含HDFS集群和YARN集群，想要构建高可用的Hadoop集群又依赖Zookeeper集群提供协调服务，所以需要在hadoop01、hadoop02和hadoop03节点上依次构建Zookeeper、HDFS和YARN集群。接下来，首先认识和了解Zookeeper，并安装部署Zookeeper集群，然后再分别安装部署HDFS集群和YARN集群，最终完成Hadoop分布式集群的构建。

第3章 基于Hadoop构建大数据平台

第3章基于Hadoop构建大数据平台