博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark学习记录(二)Spark集群搭建
阅读量:5859 次
发布时间:2019-06-19

本文共 1082 字,大约阅读时间需要 3 分钟。

hot3.png

Hadoop  Spark集群搭建,以及IDEA远程调试

环境:Hadoop-2.7.2  jdk-1.8   scala-2-11-12  spark-2.1.0

spark2.0.0开始,只支持Java8版本了,并且Java8版本最好相对高一点,并且从spark2.1.0开始只支持scala2.11了

 image2018-9-28_16-12-57.png?version=1&modificationDate=1538122377000&api=v2

scala下载地址(选择2.11.X以上版本):

spark下载地址:

 

由于我们的hadoop是2.7.2 版本,这里选择下载对应的spark版本。

首先,将scala和spark的tar包上传到我们的三台虚拟机上,并进行解压配置。

三台虚拟机IP:

192.168.194.131 Hadoop.Master

192.168.194.129 Hadoop.Slave1
192.168.194.130 Hadoop.Slave2

我们先来配置scala,在配置scala之前我们必须保证服务器上有Java8之后,配置scala的环境变量,编辑/etc/profile:

 image2018-9-28_16-13-4.png?version=1&modificationDate=1538122384000&api=v2

保存然后使其生效之后,执行scala -version观察输出:

 image2018-9-28_16-13-9.png?version=1&modificationDate=1538122389000&api=v2

如果输出对应版本号则说明配置成功。

接下来我们配置spark,首先就是环境变量:

 image2018-9-28_16-13-17.png?version=1&modificationDate=1538122396000&api=v2

然后我们进入spark目录下的conf目录,去配置两个配置文件spark-env.sh slaves

首先我们编辑spark-env.sh,将spark-env.sh.template文件重命名

 image2018-9-28_16-13-24.png?version=1&modificationDate=1538122403000&api=v2

然后我们编辑slaves,将slaves.template文件重命名,并且将hosts文件中我们的两个hadoop从节点的host也来充当我们的spark的从节点

 image2018-9-28_16-13-35.png?version=1&modificationDate=1538122414000&api=v2

然后我们进入spark目录下的sbin目录中执行start-all.sh,用jps命令观察各个节点的启动效果。

Master:

 image2018-9-28_16-13-59.png?version=1&modificationDate=1538122438000&api=v2

Slave:

 image2018-9-28_16-14-4.png?version=1&modificationDate=1538122444000&api=v2

 

遇到的坑:

1.stop-all.sh执行关闭spark集群的时候,worker节点没有正常关闭(原因看第3点)

2.spark UI在单机节点的时候访问地址为 IP:4040 ,集群状态下 的访问地址为IP:8080。

3.由于我的hadoop的环境变量中,将hadoop目录下的sbin目录配置到了PATH中,导致我在spark目录下的sbin目录下执行start-all.sh/stop-all.sh时,总是执行hadoop的start-all.sh/stop-all.sh,想执行spark的start-all.sh只能通过绝对路径执行

转载于:https://my.oschina.net/u/3687664/blog/2876015

你可能感兴趣的文章
【移动开发】Android中Fragment+ViewPager的配合使用
查看>>
[你必须知道的异步编程]——基于事件的异步编程模式
查看>>
总结关于登陆ECS的三种方式(Linux系统)
查看>>
MED-V虚拟镜像的制作与测试
查看>>
JavaScript正则表达式19例(14)
查看>>
C#设计模式(5)——建造者模式(Builder Pattern)
查看>>
基于corosync+pacemaker 实现web的高可用
查看>>
疯狂ios讲义之网页控件(UIWebView)
查看>>
AVG2013病毒数据库
查看>>
非常实用的Windows7进阶功能
查看>>
监控软件zabbix之安装
查看>>
Python [4] Django的安装和基础运行环境简介
查看>>
关于l ibrary not found for -lz.1.2.3 编译错误
查看>>
No architectures to compile for (ONLY_ACTIVE_ARCH=YES, active arch=arm64, VALID_ARCHS=armv7 armv7s)
查看>>
部署WSUS2.0+SP1
查看>>
GAE开发注意事项总结
查看>>
Codeforces Round #326 (Div. 2) B. Pasha and Phone C. Duff and Weight Lifting
查看>>
zabbix 监控主机tcp连接数
查看>>
【Hibernate框架开发之二】采用@Entity、@Id直接映射实体类
查看>>
从server 2003域控制器升级到server 2008
查看>>