一、基础介绍
Storm是一个免费开源的分布式实时计算系统。分布式意味着Storm是一个集群,部署在多台机器上。实时便是实时计算,相比于MapReduce的批处理,实时更关注于数据处理的速度和延时。
Apache Storm官网提供了各个版本的下载,体现为apache-storm-*.tar.gz,部署Storm时,直接将其解压,并配置相关配置文件即可。注意到,Storm采用Clojure和Java语言编写,Clojure也是运行在JVM之上的,所以环境上要保证安装Java环境。
Storm运行时体现为Master-Worker集群。Master节点运行nimbus进程,给Work节点分任务。Worker节点运行supervisor进程,负责分配nimbus传递过来的任务,以启动或停止worker进程。nimbus和supervisor都是无状态的,它们之间通过zookeeper来协调任务,也就是将状态信息存放在zookeeper中。
Storm的集群部署为:
二、基础环境
# Linux操作系统版本
root@linux:# lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04.2 LTS
Release: 18.04
Codename: bionic
# python版本
root@linux:# python --version
Python 2.7.17
root@linux:# python3 --version
Python 3.6.9
# java版本
root@linux:# java -version
openjdk version "1.8.0_272"
OpenJDK Runtime Environment (build 1.8.0_272-8u272-b10-0ubuntu1~18.04-b10)
OpenJDK 64-Bit Server VM (build 25.272-b10, mixed mode)
三、Zookeeper安装
- 下载Zookeeper包,解压并部署在/opt目录下
tar -xvf apache-zookeeper-3.7.1-bin.tar.gz
mkdir /opt/zookeeper
chmod 777 /opt/zookeeper/
mv apache-zookeeper-3.7.1-bin.tar.gz /opt/zookeeper/
- 配置zoo.cfg文件
# The number of milliseconds of each tick
# 心跳时间,单位毫秒
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
# Leader和Follower初始连接时最大的心跳数
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
# 保存Zookeeper数据的目录
dataDir=/opt/zookeeper/zkdata
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
3.启动 Zookeeper 服务端
root@linux:/opt/zookeeper/apache-zookeeper-3.7.1-bin/bin# ./zkServer.sh start
/usr/bin/java
ZooKeeper JMX enabled by default
Using config: /opt/zookeeper/apache-zookeeper-3.7.1-bin/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
root@linux:/opt/zookeeper/apache-zookeeper-3.7.1-bin/bin#
- 查看进程
root@linux:/opt/zookeeper/apache-zookeeper-3.7.1-bin/bin# jps
18706 Jps
18670 QuorumPeerMain #Zookeeper服务进程
root@linux:/opt/zookeeper/apache-zookeeper-3.7.1-bin/bin#
查看状态
root@linux:/opt/zookeeper/apache-zookeeper-3.7.1-bin/bin# ./zkServer.sh status
/usr/bin/java
ZooKeeper JMX enabled by default
Using config: /opt/zookeeper/apache-zookeeper-3.7.1-bin/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost. Client SSL: false.
Mode: standalone
四、Storm安装
- 修改conf/storm.yaml文件,修改为本机的IP地址
########### These MUST be filled in for a storm configuration
storm.zookeeper.servers: #Zookeeper主机列表
- "30.0.0.218"
nimbus.seeds: ["30.0.0.218"] #master候选者
- 打开/etc/profile文件,增加如下:
export PATH=$PATH:/opt/apache-storm-2.3.0/bin
- 执行命令:source /etc/profile。
- 按照顺序启动:
storm nimbus &
storm supervisor &
storm ui &
- 查看启动进程:
root@linux:# jps
22817 UIServer
22549 Nimbus
22709 Supervisor
20775 QuorumPeerMain
23039 Jps
可能会遇到的问题:
端口冲突问题:
root@linux:/opt# Running: java -server -Ddaemon.name=ui -Dstorm.options= -Dstorm.home=/opt/apache-storm-2.3.0 -Dstorm.log.dir=/opt/apache-storm-2.3.0/logs -Djava.library.path=/usr/local/lib:/opt/local/lib:/usr/lib:/usr/lib64 -Dstorm.conf.file= -cp /opt/apache-storm-2.3.0/*:/opt/apache-storm-2.3.0/lib/*:/opt/apache-storm-2.3.0/extlib/*:/opt/apache-storm-2.3.0/extlib-daemon/*:/opt/apache-storm-2.3.0/lib-webapp/*:/opt/apache-storm-2.3.0/conf -Xmx768m -Djava.deserialization.disabled=true -Dlogfile.name=ui.log -Dlog4j.configurationFile=/opt/apache-storm-2.3.0/log4j2/cluster.xml org.apache.storm.daemon.ui.UIServer
Exception in thread "main" java.lang.RuntimeException: java.io.IOException: Failed to bind to 0.0.0.0/0.0.0.0:8080
at org.apache.storm.daemon.ui.UIServer.main(UIServer.java:183)
Caused by: java.io.IOException: Failed to bind to 0.0.0.0/0.0.0.0:8080
at org.eclipse.jetty.server.ServerConnector.openAcceptChannel(ServerConnector.java:346)
at org.eclipse.jetty.server.ServerConnector.open(ServerConnector.java:308)
at org.eclipse.jetty.server.AbstractNetworkConnector.doStart(AbstractNetworkConnector.java:80)
at org.eclipse.jetty.server.ServerConnector.doStart(ServerConnector.java:236)
at org.eclipse.jetty.util.component.AbstractLifeCycle.start(AbstractLifeCycle.java:68)
at org.eclipse.jetty.server.Server.doStart(Server.java:394)
at org.eclipse.jetty.util.component.AbstractLifeCycle.start(AbstractLifeCycle.java:68)
at org.apache.storm.daemon.ui.UIServer.main(UIServer.java:179)
Caused by: java.net.BindException: Address already in use
at sun.nio.ch.Net.bind0(Native Method)
at sun.nio.ch.Net.bind(Net.java:461)
at sun.nio.ch.Net.bind(Net.java:453)
at sun.nio.ch.ServerSocketChannelImpl.bind(ServerSocketChannelImpl.java:222)
at sun.nio.ch.ServerSocketAdaptor.bind(ServerSocketAdaptor.java:85)
at org.eclipse.jetty.server.ServerConnector.openAcceptChannel(ServerConnector.java:342)
... 7 more
执行命令:lsof -i:8080,可以看到8080被zookeeper占用。
修改zookeeper的zoo.cfg文件,添加如下:
admin.serverPort=8008
端口冲突解决。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
计算系统
+关注
关注
0文章
37浏览量
10222 -
MapReduce
+关注
关注
0文章
44浏览量
6254 -
Storm
+关注
关注
0文章
5浏览量
2617
发布评论请先 登录
相关推荐
怎样在Docker Swarm上部署Apache Storm
本文是一篇来源于Baqend Tech博客的客座转贴,描述了如何在Docker Swarm,而不是在虚拟机上部署和调配Apache Storm集群。这个题目很有意思,Wolfram
发表于 10-10 14:24
•0次下载
Apache完全安装指南
本文讨论如何安装支持mod_perl、mod_ssl及php的apache web服务器,并安装webalizer实现对web访进行日志分析。手把手引导初学者编辑一个安全、功能完备的web服务器系统
发表于 11-07 11:36
•0次下载
如何利用Storm完成实时分析处理数据
Storm本身是Apache托管的开源的分布式实时计算系统,它的前身是Twitter Storm。在Storm问世以前,处理海量的实时数据信息,大部分是类似于使用消息队列,加上工作进程
发表于 04-26 15:30
•7932次阅读
Storm环境下基于权重的任务调度算法
大数据流式计算平台Apache Storm默认采用轮询的方式进行任务调度,未考虑到拓扑中各任务计算开销的差异以及任务之间不同类型的通信模式,在负载均衡和通信开销方面存在较大的优化空间。针对这一
发表于 04-17 10:52
•0次下载
探讨Apache kafka在部署可伸缩物联网解决方案中所扮演的角色
中由Apache storm、Apache spark和Apache hadoop集群提供支持的数据处理管道的网关。
发表于 07-21 09:37
•467次阅读
一种基于Apache Storm的增量式FFT方法
针对传统单机版批处理式的快速傅里叶变换( Fast fourier transfor,FFT)难以满足工业生产现场海量流数据实时处理的需求,提出一种基于Δ pache Storm的增量式FFT方法
发表于 04-28 14:44
•10次下载
Linux下Apache服务器的安装和配置
Linux下Apache服务器的安装和配置(现代电源技术的发展概况)-Linux下Apache服务器的安装和配置,有需要的可以参考!
发表于 08-31 16:22
•8次下载
Php+mysql+apache编译安装详述
Php+mysql+apache编译安装详述(深圳市核达中远通电源技术股份有限公司大吗)-文档为Php+mysql+apache编译安装详述详解文档,是一份不错的参考资料,感兴趣的可以
发表于 09-18 14:42
•2次下载
在linux下安装Apache+Php+Mysql
在linux下安装Apache+Php+Mysql(数字电源技术及其应用)-文档为在linux下安装Apache+Php+Mysql详解文档,是一份不错的参考资料,感兴趣的可以下载看看
发表于 09-18 16:09
•5次下载
mysql的安装-与php、Apache相结合
mysql的安装-与php、Apache相结合(深圳核达中远通电源技术有限公司 产品功能用途)-文档为mysql的安装-与php、Apache相结合总结文档,是一份不错的参考资料,感兴
发表于 09-18 16:33
•20次下载
云服务器apache如何配置解析php文件?
在云服务器上配置Apache以解析PHP文件通常需要以下步骤: 1、安装PHP:首先确保在服务器上安装了PHP。你可以使用包管理工具(如apt、yum等)来安装PHP。例如,在Ubun
评论