
Hadoop Flume 收集數據培訓
Flume 可以從多個數據源獲取數據,把這些數據傳給遠程主機(可能是一對多或流水線模型 中的多個目標),再把它們傳給多個目的端。
盡管 Flume 提供了開發自定義數據源和數據目的端的編程 API,但它原本就支持許多常見的場景。
1
使用 Flume 收集數據
1.Flume核心概念agent
2.agent里面包含3個核心組件:source、channel、sink。
3.sink組件是用于把數據發送到目的地的組件,目的地包括hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自定義。

請
登錄
后發表評論
新評論
全部
第1節
第2節
第3節
第4節
第5節
第6節
第7節
第8節
第9節
第10節
第11節
第12節
第13節
第14節
第15節
第16節
第17節
我的報告 / 所有報告