日期:2014-05-16  浏览次数:20501 次

Hadoop自学笔记(四)安装Hadoop

Hadoop的三种安装模式:


1. Stand Alone Mode, 所有Hadoop实例都在一个jvm里面运行

2. Psuedo Distributed Mode 所有Hadoop实例运行在不同的jvm(本课程)

3. Fully Distributed Mode 每个实例都运行在各自机器上

 

1. Installation Overview

a) 安装前提

i. 使用SSH来完成主从机器的沟通。所以本过程至少要两台机器(或者一台机器中的虚拟机也行)。然后两台机器上安装ssh,这样可以从主机登录到客户机器上(该教程花了很长时间处理ssh免输入密码登录)。这里我们把Hadoop NameNode 和 Data Node都装到一台机器上,另外一台机器只是用于登录。所以理论上讲,如果不想登录的话,一台ubuntu机器就可以了,可以直接忽略这一步。(如图所示)

ii. 两个机器上都装有JRE6.0或以上。因为Hadoop运行在jvm

b) 安装Hadoop

i. 下载安装Hadoop

ii. 添加环境变量

iii. 配置Hadoop环境:包括指定jre运行环境,和关闭ipv6

iv. 配置Name NodeJob Trackerxml文件

v. 运行hadoop


2. Install Hadoop

 第一步:在主机上安装ssh,这里的主机名HNClient

sudo apt-get install openshh-server

第二步:连接到Name Node上(也就是我们的hadoop安装的机器