百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Hadoop集群部署之大数据平台组件配置——基于CM和CDH

wptr33 2024-12-20 19:03 15 浏览

CDH(Cloudera’s Distribution Including Apache Hadoop)是大数据平台Hadoop的Cloudera发行版。

Cloudera Manager(简称CM)是Cloudera公司开发的一款CDH大数据集群部署运维工具,具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。

CM提供HDFS,YARN,MapReduce,HBase,Hive等组件,可满足大数据的存储和数据分析、数据仓库、数据挖掘的需要。本文介绍集群部署时CM组件的部署安装。

1 CM组件安装

集群规划


1.1 配置CM运行环境

选择CM 企业版试用版本

在群集安装时,选择方法-》更多选项,删除远程地址。



消除主机正确性检查的警告:

echo 10 > /proc/sys/vm/swappiness

echo never > /sys/kernel/mm/transparent_hugepage/defrag

echo never > /sys/kernel/mm/transparent_hugepage/enabled

1.2 增加report数据库

CDH运行时生成的报告需要使用的数据库。

create database report;

create user 'reportmanager'@'%' identified by 'reportmanager';

grant all on report.* TO 'reportmanager'@'%';

grant all on report.* TO 'reportmanager'@'localhost' identified by 'reportmanager';

1.3 安装HDFS

修改目录,将/etc修改为/home/cdh

注意:HDFS的节点路径不能有777权限,应使用755。



安装完成后进入主界面


1.4 增加HDFS的节点

需要先将主机加入集群。

群集-》HDFS-》实例-》添加角色实例。


自定义-》选择主机,按照向导逐步完成。



1.5 ZooKeeper

规划:3个节点的zk

集群-》操作-》添加服务,选择ZooKeeper。



主机选择01,02,03,部署3个节点的zk



按照向导,默认安装。



1.6 YARN

集群规划


修改目录,将/etc修改为/home/cdh,其他默认


1.7 HBase

集群规划


默认安装



1.8 Hive

集群规划



默认安装



1.9 Impala

集群规划



修改目录,将/etc修改为/home/cdh,其他默认




如果服务未启动,执行重启



1.10 Solr

默认安装Solr,需要HDFS,ZooKeeper支持



1.11 Flume

添加Flume服务,在指定主机(03)安装agent

安装完成后在03主机可以运行flume命令



1.12 Sqoop

添加Sqoop2服务,在指定主机(02)安装agent



安装完成后,在主机运行sqoop命令



sqoop import --connect jdbc:mysql://172.18.0.5:3306/test --username root --password root --table student -m 1



查看结果



1.13 Oozie

添加Oozie服务,在指定主机(01)安装




1.14 HUE


安装loadBalance依赖服务

yum install httpd -y

yum install mod_ssl –y

添加hue服务,在指定主机(01)安装Server,在01,03安装Load Balancer。




1.15 Spark

添加hue服务,在(01)安装Server,在01,02,03安装Gateway。



主机端可以进行spark交互



关于spark gateway不启动和不适用的说明

spark gateway标识的服务器具有spark-shell和spark-submit环境,没有服务,所以显示为灰色不适用。在节点中打开spark-shell正常使用就OK。



1.16 CM、HUE、Oozie时区统一

CM设置时区:CM服务器的时区设置

HUE设置时区:修改为 Asia/Shanghai


相关推荐

SpringBoot 3 + Flutter3 实战低代码运营管理-10章

获课》aixuetang.xyz/5075/三天构建运营管理系统:SpringBoot3+Flutter3高效开发方法论...

SpringBoot探针实现:从零构建应用健康监控利器

SpringBoot探针实现:从零构建应用健康监控利器声明本文中的所有案例代码、配置仅供参考,如需使用请严格做好相关测试及评估,对于因参照本文内容进行操作而导致的任何直接或间接损失,作者概不负责。本文...

Spring Batch中的JobRepository:批处理的“记忆大师”是如何工作

一、JobRepository是谁?——批处理的“档案馆”JobRepository是SpringBatch的“记忆中枢”,负责记录所有Job和Step的执行状态。它像一位严谨的档案管理员,把任务执...

Github霸榜的SpringBoot全套学习教程,从入门到实战,内容超详细

前言...

还在为 Spring Boot3 技术整合发愁?一文解锁大厂都在用的实用方案

你在使用SpringBoot3开发后端项目时,是不是常常陷入这样的困境?想提升项目性能和功能,却不知道该整合哪些技术;好不容易选定技术,又在配置和使用上频频踩坑。其实,这是很多互联网大厂后端开发...

一文吃透!Spring Boot 项目请求日志记录,这几招你绝对不能错过!

在互联网应用开发的高速赛道上,系统的稳定性、可维护性以及安全性是每一位开发者都必须关注的核心要素。而请求日志记录,就如同系统的“黑匣子”,能够为我们提供排查故障、分析用户行为、优化系统性能等关键信息...

spring-boot-starter-actuator简单介绍

SpringBootActuator是SpringBoot的一个功能强大的子项目,它提供了一些有用的监控和管理SpringBoot应用程序的端点。SpringBootActuat...

使用SpringBoot钩子或Actuator实现优雅停机

服务如何响应停机信号在java中我们可以直接利用通过Runtime...

28-自定义Spring Boot Actuator指标

上篇我们学习了《27-自定义SpringBootActuator健康指示器》,本篇我们学习自定义SpringBootActuator指标(Metric)。...

如何在Spring Boot中整合Spring Boot Actuator进行服务应用监控?

监控是确保系统稳定性和性能的关键组成部分,而在SpringBoot中就提供了默认的应用监控方案SpringBootActuator,通过SpringBootActuator提供了开箱即用的应...

「Spring Boot」 Actuator Endpoint

Actuator官网地址:https://docs.spring.io/spring-boot/docs/2.5.6/reference/html/actuator.html目的监控并管理应用程序...

Spring Boot Actuator监控功能全面剖析

SpringBootActuator监控功能全面剖析在现代企业级Java开发中,SpringBoot以其轻量化、高效率的特性深受开发者青睐。而作为SpringBoot生态系统的重要组成部分,S...

1000字彻底搞懂SpringBootActuator组件!

SpringBootActuator组件SpringBootActuator通过HTTPendpoints或者JMX来管理和监控SpringBoot应用,如服务的审计、健康检查、指标统计和...

JavaScript数据类型(javascript数据类型介绍)

基本数据类型BooleanNullNumberStringSymbolUndefined对象数据类型ObjectArray定义:JavaScript数组是内置的对象之一,它可以用一个变量来存储多个同种...

能运行,不代表它是对的:5 个潜伏在正常功能下的 JavaScript 错误

JavaScript的动态性和复杂性意味着,代码虽然表面上正常运行,但一些深层次、隐蔽的陷阱往往让人意想不到,梳理了几个JavaScript开发中难以发现的隐蔽错误,旨在帮助我们写出更健壮、更可...