文件linux下安装hadoop完全分布式(ubuntu12.10)

ubuntu12.10  时间:2021-03-12  阅读:()

Linux下安装Hadoop完全分布式Ubuntu12.10

Hadoop 的安装非常简单 可以在官网上下载到最近的几个版本 最好使用稳定版。 本例在3台机器集群安装。 hadoop版本如下

工具/原料hadoop-0.20.2.tar.gz

Ubuntu12. 10

安装步骤

1

安装ubuntu

Ubuntu12. 10交换空间4G(内存2G) 。 具体安装过程不赘述。

用户名统一为 hadoop;

组群:hadoop;

机器名namenode(主节点),datanode1(从节点 1),datanode2(从节点2) 。

2

在Ubuntu下创建hadoop用户组和用户(也可在安装系统时通过界面配置)

1 .创建hadoop用户组;

$sudoaddgrouphadoop

记下这里为 hadoop 用户设置的密码后面使用 hadoop 用户登录时需要用到。

2.创建hadoop用户;

$sudoadduser-ingrouphadoophadoop

3.给hadoop用户添加权限 打开/etc/sudoers文件;

$sudogedit/etc/sudoers

4. 给hadoop用户赋予root用户同样的权限。

在rootALL=(ALL:ALL)ALL下添加如下内容hadoopALL=(ALL:ALL)ALL

3

在Ubuntu下安装JDK

配置环境变量

$ sudo gedit /etc/profile

在文件的末尾加上如下内容 保存并关闭文件

# for javaexport JAVA_HOME=/usr/lib/jvm/jdk1 .8.0export JRE_HOME=${JAVA_HOME} /jreexport CLASSPATH=. :${JAVA_HOME} /lib:${JRE_HOME} /libexport PATH=${JAVA_HOME}/bin:${JRE_HOME} /bin:$PATH使设置生效 到此部JDK的配置就都完成了

$ source /etc/profile

为保证正确性 进行简单的测试

$ java -version

输出javaversion 1 .8.0

Java(TM) SE Runtime Environment (build 1 .8.0)

Java HotSpot(TM) Server VM

修改默认JDKsudo update-alternatives --install /usr/bin/java java/usr/lib/jvm/jdk1 .8.0/bin/java 300sudo update-alternatives --install /usr/bin/javac javac/usr/lib/jvm/jdk1 .8.0/bin/javac 300sudo update-alternatives --install /usr/bin/jar jar/usr/lib/jvm/jdk1 .8.0/bin/jar 300

以下两句可选(最好执行) sudo update-alternatives --config javasudo update-alternatives --config javac

4

修改机器名(这步骤可以省略)

每当ubuntu安装成功时机器名都默认为 ubuntu  但为了以后集群中能够容易分辨各台服务器 需要给每台机器取个不同的名字。机器名由/etc/hostname文件决定。

1 .打开/etc/hostname文件;

$sudogedit/etc/hostname

2.将/etc/hostname文件中的ubuntu改为对应机器如主节点中修改为namenode。 重启生效。

3.修改/etc/hosts文件

$sudogedit/etc/hosts

改为如下所示 并且将每台机器的IP设置为固定IP

5

安装ssh服务

这里的 ssh不是指三大框架:spring,struts,hibernate 而是一种远程登录协议。ubuntu一般只是默认安装了 ssh-agent, 可以用如下命令查看

$sudops-ef|grepssh

如果只有 ssh-agent就需要安装openssh-server了。

$sudoapt-getinstallsshopenssh-server

6

建立ssh无密码登录本机

首先要转换成hadoop用户 执行以下命令

$sudosu-hadoopssh生成密钥有rsa和dsa两种生成方式 默认情况下采用rsa方式。

1 .创建ssh-key  这里我们采用rsa方式;

$ssh-keygen-trsa-P

请注意 ssh-kengen 是用连字符连着的千万不要分开。 问题如下

按照您的步行的程中我在ssh-keygen-t rsa -P生的小入之後端示Badescape character ygen(红字部分就是问题所在他将 ssh-keygen 分开了。 )

(注 回车后会在~/.ssh/下生成两个文件 id_rsa和id_rsa.pub这两个文件是成对出现的)

2.创建授权文件authorized_keys

进入~/.ssh/目录下 发现开始是没有authorized_keys文件的 可以使用以下两种方法

( 1) 将id_rsa.pub追加到authorized_keys授权文件中;

$cd~/.ssh

$catid_rsa.pub>>authorized_keys

(2) 复制 id_rsa.pub 为 authorized_keys

$cp~/.ssh/id_rsa.pub~/.ssh/authorized_keys

3.登录localhost;

$sshlocalhost

4. 执行退出命令(exit或CTRL+D) ;

7

安装hadoop

1 .假设 hadoop-0.20.2.tar.gz在桌面 将它复制到安装目录/usr/local/下;

$sudocphadoop-0.20.2.tar.gz/usr/local/

2.解压hadoop-0.20.2.tar.gz;

$cd/usr/local

$sudotar-zxvfhadoop-0.20.2.tar.gz

3.将解压出的文件夹改名为hadoop;

$sudomvhadoop-0.20.2hadoop

4.将该hadoop文件夹的属主用户设为hadoop

$sudochown-Rhadoop:hadoophadoop

5.打开hadoop/conf/hadoop-env.sh文件;

$sudogedithadoop/conf/hadoop-env.sh

6.配置 conf/hadoop-env.sh(找到#exportJAVA_HOME=. . . ,去掉# 然后加上本机jdk的路径) ;

exportJAVA_HOME=/usr/lib/jvm/java1 .8.0

7.打开conf/core-site.xml文件;

$sudogedithadoop/conf/core-site.xmlfs.default.namehdfs://namenode:9000

8.打开conf/mapred-site.xml文件;

$sudogedithadoop/conf/mapred-site.xmlmapred.job.trackernamenode:9001

9.打开conf/hdfs-site.xml文件;

注意 datalog1  datalog2 data1  data2文件夹最好事先建好。

10.打开conf/masters文件 添加作为secondarynamenode的主机名.

1 1 .打开conf/slaves文件 添加作为slave的主机名 一行一个。

作者设置如下

8

运行hadoop

1 .进入hadoop 目录下格式化hdfs文件系统 初次运行hadoop时一定要有该操作

$cd/usr/local/hadoop/

$bin/hadoopnamenode-format

2.启动bin/start-all.sh

进入bin 目录下 $ ./start-all.sh关闭 同目录下./stop-all.sh

3.检测hadoop是否启动成功

$ jps

4.Web查看

注意事项

集群中所有机器的登录用户名和所属组都要相同 本文用户名为hadoop 组群也为Hadoop。

每台机器的IP设置为固定IP主机名-ip需要在每一台机器里修改对应的hosts文件。

注意代码中的粗斜体为具体安装目录 要和实际目录相同。

忍耐和坚持虽是痛苦的事情 但却能渐渐地为你带来好处。 ――奥维德

vdsina:俄罗斯VPS(datapro),6卢布/天,1G内存/1核(AMD EPYC 7742)/5gNVMe/10T流量

今天获得消息,vdsina上了AMD EPYC系列的VDS,性价比比较高,站长弄了一个,盲猜CPU是AMD EPYC 7B12(经过咨询,详细CPU型号是“EPYC 7742”)。vdsina,俄罗斯公司,2014年开始运作至今,在售卖多类型VPS和独立服务器,可供选择的有俄罗斯莫斯科datapro和荷兰Serverius数据中心。付款比较麻烦:信用卡、webmoney、比特币,不支持PayPal...

georgedatacenter:美国VPS可选洛杉矶/芝加哥/纽约/达拉斯机房,$20/年;洛杉矶独立服务器39美元/月

georgedatacenter怎么样?georgedatacenter这次其实是两个促销,一是促销一款特价洛杉矶E3-1220 V5独服,性价比其实最高;另外还促销三款特价vps,大家可以根据自己的需要入手。georgedatacenter是一家成立于2019年的美国vps商家,主营美国洛杉矶、芝加哥、达拉斯、新泽西、西雅图机房的VPS、邮件服务器和托管独立服务器业务。georgedatacen...

百驰云(19/月),高性能服务器,香港三网CN2 2核2G 10M 国内、香港、美国、日本、VPS、物理机、站群全站7.5折,无理由退换,IP免费换!

百驰云成立于2017年,是一家新国人IDC商家,且正规持证IDC/ISP/CDN,商家主要提供数据中心基础服务、互联网业务解决方案,及专属服务器租用、云服务器、云虚拟主机、专属服务器托管、带宽租用等产品和服务。百驰云提供源自大陆、香港、韩国和美国等地骨干级机房优质资源,包括BGP国际多线网络,CN2点对点直连带宽以及国际顶尖品牌硬件。专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端...

ubuntu12.10为你推荐
12306崩溃iphone 12306网络错误特朗普取消访问丹麦特朗普当选总统后对准备出国留学的学生有什么影响怎么查询商标手机上能查询商标吗?怎么查?杨紫别祝我生日快乐祝我生日快乐的歌词www.4411b.com难道那www真的4411B坏了,还是4411b梗换com鑫域明了关键字关键词标签里写多少个关键词为最好比肩工场比肩是什么意思,行比肩大运的主要意象杰景新特谁给我一个李尔王中的葛罗斯特这个人物的分析?急 ....先谢谢了psbc.comwap.psbc.com网银激活长尾关键词挖掘工具大家是怎么挖掘长尾关键词的?
vps是什么 如何注册网站域名 新通用顶级域名 net主机 免费申请网页 t楼 tier mediafire webhosting 外国服务器 sugarsync 视频存储服务器 香港cdn 360抢票助手 韩国网名大全 空间论坛 lamp什么意思 测速电信 杭州电信宽带 国外免费网盘 更多