实战大数据(Hadoop+Spark+Flink):从平台构建到交互式数据分析(离线/实时)
上QQ阅读APP看书,第一时间看更新

第3章 基于Hadoop构建大数据平台

学习目标

掌握Zookeeper分布式集群的构建。

理解HDFS分布式文件系统的架构与设计。

理解YARN资源管理系统的架构与设计。

掌握Hadoop分布式集群的构建。

理解MapReduce编程模型。

大数据项目最终需要运行在大数据平台之上,而构建Hadoop集群是构建整个大数据平台的核心。Hadoop集群包含HDFS集群和YARN集群,想要构建高可用的Hadoop集群又依赖Zookeeper集群提供协调服务,所以需要在hadoop01、hadoop02和hadoop03节点上依次构建Zookeeper、HDFS和YARN集群。接下来,首先认识和了解Zookeeper,并安装部署Zookeeper集群,然后再分别安装部署HDFS集群和YARN集群,最终完成Hadoop分布式集群的构建。