storm是一个开源免费的分布式计算框架,可以实时处理大量的数据流。
容错:单个节点挂了,不影响整个应用。
storm与hadoop的编程模型相似。
处理数据的粒度变大,导致spark streaming的数据延时不如storm,spark streaming是秒级返回结果(与设置的batch间隔有关),storm则是毫秒级。
zookeeper:用来协调nimbus和supervisor,如果supervisor因故障出现问题而无法运行topology,nimbus会第一时间感知到,并重新分配topology到其他可用的supervisor上运行。
stream:tuple的集合。表示数据的流向。
supervisor:storm集群的从节点,负责管理运行在supervisor节点上的每一个worker进程的启动和终止。
如对本文有疑问, 点击进行留言回复!!
去 HBase,Kylin on Parquet 性能表现如何?
如何找到Hive提交的SQL相对应的Yarn程序的applicationId
如何在 HBase Shell 命令行正常查看十六进制编码的中文?哈哈~
网友评论