文件Linux下安装Hadoop完全分布式(Ubuntu12.10)

ubuntu12.10  时间:2021-03-12  阅读:()

精品文档

Linux下安装Hadoop完全分布式Ubuntu12. 10

Hadoop的安装非常简单可以在官网上下载到最近的几个版本最好使用稳定版。本例在3台机器集群安装。hadoop版本如下

工具/原料hadoop-0.20.2. tar.gz

Ubuntu12. 10

安装步骤

1

安装ubuntu

Ubuntu12. 10交换空间4G(内存2G) 。具体安装过程不赘述。

用户名统一为 hadoop;

组群:hadoop;

机器名 namenode(主节点) ,datanode1 (从节点

1) ,datanode2(从节点2) 。

在Ubuntu下创建hadoop用户组和用户(也可在安装系统时通过界面配置)

1.创建hadoop用户组;

$sudoaddgrouphadoop

记下这里为 hadoop用户设置的密码 后面使用

1/9

精品文档hadoop用户登录时需要用到。

.创建hadoop用户;

$sudoadduser-ingrouphadoophadoop

.给hadoop用户添加权限打开/etc/sudoers文件;

$sudogedit/etc/sudoers

.给hadoop用户赋予root用户同样的权限。

在rootALL=(ALL:ALL) ALL下添加如下内容hadoopALL=(ALL:ALL) ALL

在Ubuntu下安装JDK

配置环境变量

$ sudo gedit /etc/profile

在文件的末尾加上如下内容保存并关闭文件

# for javaexport JAVA_HOME=/usr/lib/jvm/jdk1.8.0export JRE_HOME=${JAVA_HOME}/jreexport

CLASSPATH=. :${JAVA_HOME}/l ib:${JRE_HOME}/l ibexport

PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH

使设置生效到此部JDK的配置就都完成了

$ source /etc/profile

2/9

精品文档

为保证正确性进行简单的测试

$ java -version

输出java version "1.8.0"

Java(TM) SE Runtime Environment (build 1.8.0)

Java HotSpot(TM) Server VM

修改默认JDKsudo update-alternatives --install /usr/bin/javajava /usr/lib/jvm/jdk1.8.0/bin/java00sudo update-alternatives--install /usr/bin/javacjavac /usr/lib/jvm/jdk1.8.0/bin/javac00sudo update-alternatives --install /usr/bin/jarjar /usr/lib/jvm/jdk1.8.0/bin/jar00

以下两句可选(最好执行) sudo update-alternatives --config javasudo update-alternatives --config javac

修改机器名(这步骤可以省略)

每当ubuntu安装成功时机器名都默认为 ubuntu 但为了以后集群中能够容易分辨各台服务器需要给每台机器取个不同的名字。机器名由/etc/hostname文件决定。

1.打开/etc/hostname文件;

3/9

精品文档

$sudogedit/etc/hostname

.将/etc/hostname文件中的ubuntu改为对应机器如主节点中修改为"namenode"。重启生效。

.修改/etc/hosts文件

$sudogedit/etc/hosts

改为如下所示并且将每台机器的IP设置为固定IP

安装ssh服务

这 里 的 ssh 不 是 指 三 大 框架:spring, struts,hibernate而是一种远程登录协议。ubuntu一般只是默认安装了 ssh-agent, 可以用如下命令查看

$sudops-ef|grepssh

如果只有ssh-agent就需要安装openssh-server了。

$sudoapt-getinstallsshopenssh-server

建立ssh无密码登录本机

首先要转换成hadoop用户执行以下命令

$sudosu-hadoopssh生成密钥有rsa和dsa两种生成方式默认情况下采用rsa方式。

1.创建ssh-key 这里我们采用rsa方式;

4/9

精品文档

$ssh-keygen-trsa-P""

请注意 ssh-kengen是用连字符连着的千万不要分开。 问题如下

按照您的步行的程中我在ssh -keygen -t rsa -P ""生的小入之後端示Bad escape character "ygen"(红字部分就是问题所在他将ssh-keygen分开了。 )

(注 回车后会在~/. ssh/下生成两个文件 id_rsa和id_rsa.pub这两个文件是成对出现的)

.创建授权文件authorized_keys

进入~/. ssh/目录下发现开始是没有authorized_keys文件的可以使用以下两种方法

(1)将id_rsa.pub追加到authorized_keys授权文件中;

$cd~/. ssh

$catid_rsa.pub>>authorized_keys

(2)复制id_rsa.pub为authorized_keys

$cp~/. ssh/id_rsa.pub~/. ssh/authorized_keys

.登录localhost;

$sshlocalhost

.执行退出命令(exit或CTRL+D) ;

安装hadoop

5/9

精品文档

1.假设hadoop-0. 20. 2. tar.gz在桌面将它复制到安装目录/usr/local/下;

$sudocphadoop-0. 20.2.tar.gz/usr/local/

.解压hadoop-0.20.2. tar.gz;

$cd/usr/local

$sudotar-zxvfhadoop-0. 20.2. tar.gz

.将解压出的文件夹改名为hadoop;

$sudomvhadoop-0. 20.2hadoop

.将该hadoop文件夹的属主用户设为hadoop

$sudochown-Rhadoop:hadoophadoop

.打开hadoop/conf/hadoop-env. sh文件;

$sudogedithadoop/conf/hadoop-env. sh

.配置conf/hadoop-env. sh(找到#exportJAVA_HOME=. . . ,去掉#然后加上本机jdk的路径) ;exportJAVA_HOME=/usr/l ib/jvm/java1.8.0

.打开conf/core-site.xml文件;

$sudogedithadoop/conf/core-site.xmlf s.default.namehdfs://namenode:9000

.打开conf/mapred-site.xml文件;

$sudogedithadoop/conf/mapred-site.xmlmapred. job. tracker

6/9

精品文档namenode:9001

.打开conf/hdfs-site.xml文件;

注意 datalog1 datalog2 data1 data2文件夹最好事先建好。

10. 打开 conf/masters 文件 添加作为secondarynamenode的主机名.

11.打开conf/slaves文件添加作为slave的主机名一行一个。

作者设置如下

运行hadoop

1.进入hadoop目录下格式化hdfs文件系统初次运行hadoop时一定要有该操作

$cd/usr/local/hadoop/

$bin/hadoopnamenode-format

.启动bin/start-all. sh

进入bin 目录下 $ ./start-all. sh关闭 同目录下./stop-all. sh

.检测hadoop是否启动成功

$ jps

.Web查看

注意事项

7/9

精品文档

集群中所有机器的登录用户名和所属组都要相同本文用户名为hadoop组群也为Hadoop。

每台机器的IP设置为固定IP主机名-ip需要在每一台机器里修改对应的hosts文件。

注意代码中的粗斜体为具体安装目录要和实际目录相同。

衰莫大于心死愁莫大于无志。

8/9

精品文档

感 谢 阅 读

9/9

CloudCone 新增洛杉矶优化线路 年付17.99美元且简单线路测试

CloudCone 商家在以前的篇幅中也有多次介绍到,这个商家也蛮有意思的。以前一直只有洛杉矶MC机房,而且在功能上和Linode、DO、Vultr一样可以随时删除采用按时计费模式。但是,他们没有学到人家的精华部分,要这样的小时计费,一定要机房多才有优势,否则压根没有多大用途。这不最近CloudCone商家有点小变化,有新人洛杉矶优化线路,具体是什么优化的等会我测试看看线路。内存CPU硬盘流量价格...

VoLLcloud(月付低至2.8刀)香港vps大带宽,三网直连

VoLLcloud LLC是一家成立于2020年12月互联网服务提供商企业,于2021年1月份投入云计算应用服务,为广大用户群体提供云服务平台,已经多个数据中心部署云计算中心,其中包括亚洲、美国、欧洲等地区,拥有自己的研发和技术服务团队。现七夕将至,VoLLcloud LLC 推出亚洲地区(香港)所有产品7折优惠,该产品为CMI线路,去程三网163,回程三网CMI线路,默认赠送 2G DDoS/C...

tmhhost(100元/季)自带windows系统,香港(三网)cn2 gia、日本cn2、韩国cn2、美国(三网)cn2 gia、美国cn2gia200G高防

tmhhost可谓是相当熟悉国内网络情况(资质方面:ISP\ICP\工商齐备),专业售卖海外高端优质线路的云服务器和独立服务器,包括了:香港的三网cn2 gia、日本 cn2、日本软银云服务器、韩国CN2、美国三网cn2 gia 云服务器、美国 cn2 gia +200G高防的。另外还有国内云服务器:镇江BGP 大连BGP数据盘和系统盘分开,自带windows系统,支持支付宝付款和微信,简直就是专...

ubuntu12.10为你推荐
12306崩溃12306是不是瘫痪了?安徽汽车网安徽省各地车牌号简称是按照什么顺序排的地图应用谁知道什么地图软件好用,求 最好可以看到路上行人kaixin.com开心网。www.kaixin.com是什么时间出来的。lunwenjiancewritecheck论文检测准吗?罗伦佐娜罗拉芳娜 (西班牙小姐)谁可以简单的介绍以下同一服务器网站同一服务器上可以存放多个网站吗?mole.61.com摩尔庄园RK的秘密是什么?javmoo.comjavbus上不去.怎么办百度指数词为什么百度指数里有写词没有指数,还要购买
域名备案查询 vps服务器 域名备案信息查询 linuxapache虚拟主机 企业主机 edis cdn服务器 10t等于多少g 轻博客 回程路由 网通服务器ip eq2 中国特价网 北京双线机房 免费个人空间 200g硬盘 免费美国空间 paypal注册教程 华为云盘 登陆空间 更多