当前位置: 移动技术网 > IT编程>数据库>其他数据库 > Flume的概述和安装部署

Flume的概述和安装部署

2019年02月24日  | 移动技术网IT编程  | 我要评论

一、flume概述

  flume是一种分布式、可靠且可用的服务,用于有效的收集、聚合和移动大量日志文件数据。flume具有基于流数据流的简单灵活的框架,具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错能力。flume使用简单的的可扩展数据模型,循环在线分析应用程序。

 

二、flume的作用

  数据的来源大致有三类:

  1.爬虫

  2.日志数据   =>使用flume进行获取传输

  3.传统数据库  =>使用sqoop进行数据迁移

 

三、flume架构

  1.source:数据源

    接收webser端的数据,产生数据流

    同时source将产生数据流传输到channel

  2.channel:传输管道

    用于桥接source和sinks

  3.sinks:下沉

    从channel接收数据,并传输到hdfs或下一个agent

  4.agent:代理

    一个agent中包含一组source,channel,sinks

四、flume的安装部署

  1.从官网下载flume安装包(本人使用的是1.6.0版本)

  2.上次到linux中解压

    tar -zxvf ***.tar

  3.重命名解压缩的文件夹为flume,方便以后更新维护

  4.进去flume下的conf文件夹,将文件flume-env.sh.template重命名为flume-env.sh

  5.进去该文件,删除java_home的注释,并修改java路径为本机的java_home路径

    export java_home=/root/hd/jdk1.8.0_102

  6.保存并退出,安装完成!

 

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网