2.flume sources

2020-05-13 13:44:03

版权申明：转载请注明出处。
文章来源：

flume中提供了多种source来应对不同场景的数据传输，常用的有exec source和spooling directory source。下面对flume的source做详细的说明。

1.Spooling Directory Source

这种方式是将要传输的文件放在磁盘的某个目录下，这个目录可以理解为一个池子，当池子中有文件的时候就会被放入channel，当确认文件已经放入channel，原始文件会被重命名或者删除。
这种方式是可靠的、并且不会丢失数据，当agent挂掉重启后也能接着传输。需要注意的是放入池子的文件不能再被写入或者不能出现重名文件，否则传输会报错。
需要注意的是尽管这种方式提供了可靠性保证，但是下游的某种失败也会导致event重复。
以下是该source的配置属性，加粗的为必选属性。

配置示例

a1.channels = ch-1
a1.sources = src-1
a1.sources.src-1.type = spooldir
a1.sources.src-1.channels = ch-1
a1.sources.src-1.spoolDir = /var/log/apache/flumeSpool
a1.sources.src-1.fileHeader = true

2.Scribe Source

scribe是facebook 提供的另外一种数据传输系统，使用scribe source相当于在scribe之后又套接了flume传输数据。以下是各个数据传输系统的对比图。

scribe source 的属性配置如下：
属性 | 默认值 | 说明
-- | -- | --
type | - | org.apache.flume.source.scribe.ScribeSource
port | 1499 | 端口
maxReadBufferBytes | 16384000 | thrift默认的配置
workerThreads | 5 | 工作线程数
selector.type | replicating | 取值有replicating、multiplexing
selector.* | | 依赖于selector.type

配置示例：

a1.sources = r1
a1.channels = c1
a1.sources.r1.type = org.apache.flume.source.scribe.ScribeSource
a1.sources.r1.port = 1463
a1.sources.r1.workerThreads = 5
a1.sources.r1.channels = c1

3.Exec Source

配置示例：

a1.sources = r1
a1.channels = c1
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /var/log/secure
a1.sources.r1.channels = c1

4.Taildir Source

配置示例：

a1.sources = r1
a1.channels = c1
a1.sources.r1.type = TAILDIR
a1.sources.r1.channels = c1
a1.sources.r1.positionFile = /var/log/flume/taildir_position.json
a1.sources.r1.filegroups = f1 f2
a1.sources.r1.filegroups.f1 = /var/log/test1/example.log
a1.sources.r1.headers.f1.headerKey1 = value1
a1.sources.r1.filegroups.f2 = /var/log/test2/.*log.*
a1.sources.r1.headers.f2.headerKey1 = value2
a1.sources.r1.headers.f2.headerKey2 = value2-2
a1.sources.r1.fileHeader = true

分享好友

分享这个小栈给你的朋友们，一起进步吧。

Apache Spark技术专区

创建时间：2020-05-08 17:16:40

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。现在形成一个高速发展应用广泛的生态系统。

展开

订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅：虚拟交易，一经交易不退款；若特殊情况，可3日内客服咨询

• 专区发布评论属默认订阅所评论专区（除付费小栈外）

技术专家

查看更多

栈栈
专家