好文档 - 专业文书写作范文服务资料分享网站

《大数据技术原理与操作应用》第8章习题答案

天下 分享 时间: 加入收藏 我要投稿 点赞

第八章 一、单选题

1. 当服务器突然宕机,下列Channels选项中,哪一个可以保证数据不会丢失。

A、Memory Channel B、File Channel C、JDBC Channel D、Kafka Channel

参考答案:

B

2.、以下关于flume的说法正确的是

A Event是Flume数据传输的基本单元 B Sink是Flume数据传输的基本单元 C Channel是Flume数据传输的基本单元 D Source是Flume数据传输的基本单元

参考答案: A

二、多选题

1、下列选项中,说法错误的是()。

? ? ? ?

A、在一个Agent中,同一个source可以有多个channel B、在一个Agent中,同一个sink可以有多个channel C、在一个Agent中,同一个source只能多1个channel D、在一个Agent中,同一个sink只能有1个channel

参考答案: A,D

2、下列说法中,关于配置参数说法错误的是()。

? ? ? ?

A、a1.sources.r1.channels = c1 B、a1.sinks.k1.channel = c1 C、a1.source.r1.channels = c1 D、a1.sinks.k1.channels = c1

参考答案: C,D

三、判断题

1、在一个POST请求发送的所有的events数据,可以在多个事务中插入channel。

? ?

对 错

参考答案: 错

答案解析:

在一个POST请求发送的所有的events都被认为是一个批次,会在一个事务中插入channel。

2、Flume负载均衡接收器处理器能够在多个Sink上进行均衡流量的功能。

? ?

对 错

参考答案: 对

3、查询和替换拦截器基于Java正则表达式提供了简单的用于字符串的搜索和替换功能,同时还具有进行回溯/群组捕捉功能。

? ?

对 错

参考答案: 对

4、采集方案中的sources、channels、sinks是在具体编写时根据业务需求进行配置的,可以随意设置。

? ?

对 错

参考答案: 错

5、Spooling Directory Source对指定磁盘上的文件目录进行监控并提取数据,但是不能查看新增文件数据。

? ?

对 错

参考答案: 错

答案解析:

Spooling Directory Source对指定磁盘上的文件目录进行监控并提取数据,可以查看新增文件数据。

6、Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。

? ?

对 错

参考答案: 对

答案解析:

Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。

7、Channel组件对采集到的数据进行缓存,可以存放在Memory或File中。

? ?

对 错

参考答案: 对

答案解析:

Channel组件对采集到的数据进行缓存,可以存放在Memory或File中。

8、在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。

? ?

对 错

参考答案: 对

答案解析:

在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。

9、Source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec等。

? ?

对 错

参考答案: 对

10、Timestamp Interceptor能够过滤掉数据中的时间戳。

? ?

对 错

参考答案: 错

答案解析:

Timestamp Interceptor(时间戳拦截器)会将流程执行的时间插入到event的header头部。此拦截器插入带有timestamp键(或由header属性指定键名)的标头,其值为对应时间戳。如果配置中已存在时间戳时,此拦截器可以保留现有的时间戳。

11、Static Interceptor(静态拦截器)允许用户将具有静态值的静态头附加到所有event。

? ?

对 错

参考答案: 对

12、Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。

?

? 错

参考答案: 对

答案解析:

Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。

13、Logger Sink通常用于调试,Logger Sink接收器的不同处是它不需要在记录原始数据部分中说明额外的配置。

? ?

对 错

参考答案: 对

答案解析:

Logger Sink通常用于调试,Logger Sink接收器的不同处是它不需要在记录原始数据部分中说明额外的配置。

14、关于静态拦截器,用户可以定义多个静态拦截器来为每一个拦截器都追加一个header。

? ?

对 错

参考答案: 对

答案解析:

关于静态拦截器,用户可以定义多个静态拦截器来为每一个拦截器都追加一个header。

15、Flume-og与Flume-ng两个版本基本相同,开发者可以使用任意一款工具。

? ?

对 错

参考答案: 错

16、禁用backoff功能的情况下,在round_robin机制下,所有失败的sink将被传递到sink队列中的下一个sink后,因此不再均衡。

《大数据技术原理与操作应用》第8章习题答案

第八章一、单选题1.当服务器突然宕机,下列Channels选项中,哪一个可以保证数据不会丢失。A、MemoryChannelB、FileChannelC、JDBCChannelD、KafkaChannel参考答案:B2.、以下关于flume的说法正确的是AEvent是Flu
推荐度:
点击下载文档文档为doc格式
7gk982xb5c44p5c1cp2i5zpak1cssx00db2
领取福利

微信扫码领取福利

微信扫码分享