centos6.5安装CDH5.5.1
安装并配置系统
安装系统
系统使用 centos6.5 64位
集群中使用到的所有主机必须使用完全相同的系统。
配置系统
关闭 iptables
1
2
3
4
5# 关闭 iptables
service iptables stop
# 设置成开机不启动
chkconfig iptables off禁用 SELinux
1
2
3
4
5
6
7
8# method1
vim /etc/selinux/config # 改为 SELINUX=disabled
# method2, 可以在脚本中使用
sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
# 临时禁用
setenforce 0设置 swappiness
1
2
3
4
5
6
7
8# 临时禁用
echo 0 > /proc/sys/vm/swappiness
# 或者
sysctl vm.swappiness=10
# 永久生效, 在下面文件最后
# 添加 vm.swappiness=0 即可
vim /etc/sysctl.conf
禁用 透明大页面
1
2
3
4
5
6
7
8# 临时生效
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
# 将下面的代码片断,添加到 /etc/rc.local 文件中。
if test -f /sys/kernel/mm/redhat_transparent_hugepage/enabled; then
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
fi
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
设置主机的 HOSTNAME
规划系统。准备4台机器,其中一台中安装clouderaManger 的 server, 其余3台机器作为 clouderaManger 的 agent. 假设,存在四台机器:192.168.0.1[0-3], 则执行以下配置:
设置 HOSTNAME
1
2# 在下面文件中添加 HOSTNAME=<HOSTNAME>
vi /etc/sysconfig/network
每台机器依次设置成如下 hostname:
1
2
3
4
192.168.0.10 <==> clouderaManger
192.168.0.11 <==> hadoop-worker1
192.168.0.12 <==> hadoop-worker2
192.168.0.13 <==> hadoop-worker3
设置 hosts
1
2# 编辑 hosts 文件
vi /etc/hosts在所有主机上的 hosts 文件中追加如下配置:
1
2
3
4192.168.0.10 clouderaManager
192.168.0.11 hadoop-worker1
192.168.0.12 hadoop-worker2
192.168.0.13 hadoop-worker3
上面的设置完成之后,需要重新启动系统。
以下行文中出现 clouderManager主机 就表示 192.168.0.10 这台机器,同理 hadoop-worker1 表示 192.168.0.11 这台机器
下载安装文件
提供,两种形式的包,parcel 和 yum
CouderaManager包
parcel: 对于 CouderaManager 的 server 和 agent的安装,并没有提供 parcel 形式的包。
yum: http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/
tarball: http://archive.cloudera.com/cm5/repo-as-tarball/
需要下载的文件:
cloudera-manager-installer.bin
clouderaManager-下载这个路径下的所有文件
对于这个路径下的包,还有另一种下载方法,http://archive.cloudera.com/cm5/cm/5/cloudera-manager-el6-cm5.5.1_x86_64.tar.gz 这个路径下的就包含了上面文件夹中的所有包。直接下载即可。将下载好的文件放置到 cm5.5.1 文件夹中。
CDH 包
parcel: http://archive.cloudera.com/cdh5/parcels/
yum:http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/
tarball: http://archive.cloudera.com/cdh5/repo-as-tarball/
需要下载的文件:
如果使用 parcel 形式安装:则下载 http://archive.cloudera.com/cdh5/parcels/5.5.1/ 这个路径下的:-
如果使用 yum 方法安装则下载:
http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.5.1/RPMS/x86_64/
这个路径下的所有rpm.
将下载好的文件放置到 cdh5.5.1 文件夹中。
安装所需的支持包,工具包
3.1 createrepo
3.2 postgresql
3.3 cloudera-manager-agent的依赖包
分别下载之。
最终将上面下载的文件,以如下的目录结构存放:
1 | +--- clouderaManager5.5.1 |
使用命令进行打包:
1 | tar cvf clouderaManager5.5.1.tar clouderaManager5.5.1/ |
将 clouderaManager5.5.1.tar 上传到 clouderManager主机上。解压之:1
tar xvf clouderaManager5.5.1.tar
搭建本地 yum 源
创建仓库
安装 createrepo
创建仓库所在文件夹
1
mkdir -p /usr/local/local-repo/
将 clouderaManager5.5.1/local-repo 拷贝到 /usr/local/local-repo/
1
cp clouderaManager5.5.1/local-repo /usr/local/local-repo/
创建仓库
1
createrepo -v /usr/local/local-repo/
刷新仓库
如果,有新的 rpm 添加进来,则使用下面的命令刷新。
1
createrepo -v --update /usr/local/local-repo/
创建临时 yum 源服务器
1
2# 确定 8900 端口未被占用
python -m SimpleHTTPServer 8900
验证
使用
http://clouderaManager:8900/
访问yum仓库
配置本地源
创建 repo 文件
在/etc/yum.repo.d/下创建一个local-repo.repo文件,添加如下内容到该文件
1
2
3
4
5[local-repo] #仓库名称可以自定义
name=This is a local repo #描述信息
baseurl=http://192.168.0.1:8900 # 或者 http://clouderaManager:8900
enabled=1 #是否开启仓库,1为开启,0为关闭
gpgcheck=0 #是否检查gpgkey,1为开启,0为关闭禁用外部源
1
mv CentOS-Base.repo CentOS-Base.repo.bak
刷新yum缓存
1
yum clean all
验证
1
yum list | grep clouder*
可以看到本地仓库中rpm:
cloudera-manager-agent.x86_64
cloudera-manager-daemons.x86_64
说明本地yum源安装成功。
安装 Cloudera Manager Server
进入到 clouderaManager5.5.1 目录
1
cd ~/clouderaManager5.5.1/
安装 Server
1
./cloudera-manager-installer.bin --skip_repo_package=1
**注意:已经配置好了本地仓库,所以添加--skip_repo_package=1,尤其是在clouderManager主机是未联网的情况下一定要添加这个选项**
执行这个命令后会启动一个安装界面,按步骤安装即可。
执行这个命令,会将安装日志记录到 `/var/log/cloudera-manager-installer/` 下面,如果安装过程中遇到问题,可以查看这里的日志信息。
如果,正常安装,则可以看到以下日志记录:
1
2
3
4
5
6
7
8
9
0.check-selinux.log
1.install-oracle-j2sdk1.7.log
1.install-repo-pkg.log
2.install-cloudera-manager-server.log
2.install-oracle-j2sdk1.7.log
3.install-cloudera-manager-server-db-2.log
3.remove-cloudera-manager-repository.log
4.start-embedded-db.log
5.start-scm-server.log
可以看到如果安装完成,scm-server 将会启动。
配置 CDH 源
拷贝 CDH 源
将 clouderaManager5.5.1/cdh5.5.1 中所有的文件(3个)拷贝到 /opt/cloudera/parcel-repo 仓库中。
1
2cd ~/clouderaManager5.5.1/cdh5.5.1/
cp * /opt/cloudera/parcel-repo/更改文件权限
1
chown -R cloudera-scm:cloudera-scm ./*
Cloudera Manager Server 安装成功之后,会在 /opt 目录下创建 cloudera 文件夹,注意到cloudera-manager-installer.bin会创建一个名为 cloudera-scm 的用户和组,用 cloudera-scm 用户来安装配置文件等,所以配置的CDH源中的文件也需要将其改成 cloudera-scm。
验证
在浏览器中输入
http://<clouderaManager's IP>:7180/
, 应该会打开 Cloudera Manager 的 web 管理界面。默认的用户名:admin, 密码:admin如果没有打开,可以到 /var/log/cloudera-scm-server/ 目录中,查看日志
1
tail -f cloudera-scm-server.log
**注意是 .log 文件,不是 .out 文件。**
![](D:\cygwin64\home\Administrator\workspace\a-ray-of-sunshine.github.io\source\images\ClouderaManager-Login.png)
创建集群
安装 agent
为 CDH 群集安装指定主机
输入主机或者ip,Cloudera Manger 将在这些主机上安装 agent,可以通过以下几种方式来指定主机。
- 192.168.0.11, 192.168.0.12, 192.168.0.13
- hadoop-worker1, hadoop-worker2, hadoop-worker3
- 192.168.0.1[1-3]
- hadoop-worker[1-3]
执行搜索
选中需要安装的主机,点击继续
群集安装
设置 Parcel 存储库,配置成本地源,将其指定为前面配置的临时yum源。http://clouderaManager:8900
设置 agent 的安装源,配置成本地源,将其指定为前面配置的临时yum源。http://clouderaManager:8900,然后继续
JDK 安装选项
勾选 安装 Oracle Java SE 开发工具包 (JDK)
正在安装
安装过程中,可以点击 详细信息 查看安装日志。
也可以在
/var/log/cloudera-scm-agent/
中找到安装日志。这个步骤完成之后,agent就会启动,协助 server安装 CDH
正在安装选定 Parcel
检查主机正确性
到此为到 agent 已经安装好了, CDH的 parcels包,也已经拷贝到 /opt/cloudera/parcels 处。CouderaManager server和agent安装完毕。
群集设置
在这个界面中选择,需要安装的组件。安装默认配置安装即可。
安装配置完之后: