linux环境停Hadoop 2.0.3单机部署-Linux-爱易网页

linux环境停Hadoop 2.0.3单机部署

日期：2014-05-16　浏览次数：21274 次

linux环境下Hadoop 2.0.3单机部署

1.Hadoop2.0简述^[1]

???????与之前的稳定的hadoop-1.x相比，Apache Hadoop 2.x有较为显著的变化。这里给出在HDFS和MapReduce两方面的改进。

　　HDFS:为了保证name服务器的规模水平，开发人员使用了多个独立的Namenodes和Namespaces。这些Namenode是联合起来的，它们之间不需要相互协调。Datanode可以为所有Namenode存放数据块，每个数据块要在平台上所有的Namenode上进行注册。Datenode定期向Namenode发送心跳信号和数据报告，接受和处理Namenodes的命令。

　　YARN(新一代MapReduce)：在hadoop-0.23中介绍的新架构，将JobTracker的两个主要的功能：资源管理和作业生命周期管理分成不同的部分。新的资源管理器负责管理面向应用的计算资源分配和每个应用的之间的调度及协调。

　　每个新的应用既是一个传统意义上的MapReduce作业，也是这些作业的 DAG(Database Availability Group数据可用性组)，资源管理者（ResourcesManager）和管理每台机器的数据管理者（NodeManager）构成了整个平台的计算布局。

　　每一个应用的应用管理者实际上是一个架构的数据库，向资源管理者（ResourcesManager）申请资源，数据管理者（NodeManager）进行执行和监测任务。

2. Hadoop2.0的目录结构^[2]

　　Hadoop2.0的目录结构很像Linux操作系统的目录结构，各个目录的作用如下：

　　(1) 在新版本的hadoop中，由于使用hadoop的用户被分成了不同的用户组，就像Linux一样。因此执行文件和脚本被分成了两部分，分别存放在bin和sbin目录下。存放在sbin目录下的是只有超级用户(superuser)才有权限执行的脚本，比如start-dfs.sh, start-yarn.sh, stop-dfs.sh, stop-yarn.sh等，这些是对整个集群的操作，只有superuser才有权限。而存放在bin目录下的脚本所有的用户都有执行的权限，这里的脚本一般都是对集群中具体的文件或者block pool操作的命令，如上传文件，查看集群的使用情况等。

　　(2) etc目录下存放的就是在0.23.0版本以前conf目录下存放的东西，就是对common, hdfs, mapreduce(yarn)的配置信息。

　　(3) include和lib目录下，存放的是使用Hadoop的C语言接口开发用到的头文件和链接的库。

　　(4) libexec目录下存放的是hadoop的配置脚本，具体怎么用到的这些脚本，我也还没跟踪到。目前我就是在其中hadoop-config.sh文件中增加了JAVA_HOME环境变量。

　　(5) logs目录在download到的安装包里是没有的，如果你安装并运行了hadoop，就会生成logs 这个目录和里面的日志。

　　(6) share这个文件夹存放的是doc文档和最重要的Hadoop源代码编译生成的jar包文件，就是运行hadoop所用到的所有的jar包。

3.学习hadoop的配置文件^[3]

上一篇：Ubuntu 24.04磁盘挂载数据盘

下一篇： linux支配java项目

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

请问select函数等待超时的有关问题

arm linux web视频采集怎么做

Linux有关介绍

使用gcc代替oraxlc命令的方法

给点学习LINUX的指导观点[急]解决方法

WAS7.0 在Linux（Suse）停的静默安装

linux 中phpmyadmin 无法载入mysql扩展，请检查php配置文档解决办法

Linux:libstdc++.so.6有关问题！求解啊

nfs - gdbserver 远程调试有关问题

推荐阅读更多>

~大家都如何调试网络程序？

七天LLVM零基础入门（Linux版本）-第二天

archlinux停chroot安装gentoo

linux 起动ftp服务，sftp服务

linux上几种目标文件的分析

嵌入式linux ext4映像制造工具说明 real210_v62

shell有关问题！求教

不知道为啥，不能安装vmtools，很是迷惑

Linux Login相干知识整理

ARM Linux 的TLB miss和page fault的错误处理

Linux稳步前进学（更新程度：完毕）最给力的Linux入门视频教程

请问cshell模式下怎么让history显示日期

《Unix & Linux 高等学校教程》 - 第五、六章学习笔记

优化Linux下的内核TCP参数来增高服务器负载能力

Linux上设置静态IP和获取动态IP的方法

今日fedora更新kernel了，散分

cygwin安装异常提示

Linux中历程的优先级

开始干Linux驱动了，三年的时间能做到什么样？大牛们请答话

linux 无线网卡socket编程出错解决方案