第三章
单选题
1、下列选项中,若是哪个节点关闭了,就无法访问Hadoop集群()。
? ? ? ?
A、namenode B、datanode
C、secondary namenode D、yarn
参考答案: A
答案解析: 暂无解析
2、下列说法中,关于客户端从HDFS中读取数据的说法错误的是()。
? ? ? ?
A、客户端会选取排序靠前的DataNode来依次读取Block块
B、客户端会把最终读取出来所有的Block块合并成一个完整的最终文件 C、客户端会选取排序靠后的DataNode来依读取Block块 D、如果客户端本身就是DataNode,那么将从本地直接获取数据
参考答案: C
答案解析: 暂无解析
3、下列选项中,用于检验数据完整性的信息的是()。
? ? ? ?
A、心跳机制 B、ACK机制 C、选举机制 D、垃圾回收机制
参考答案: B
答案解析: 暂无解析
4、下列选项中,关于HDFS说法错误的是()。
? ? ? ?
A、HDFS是Hadoop的核心之一 B、HDFS源于Google的GFS论文 C、HDFS用于存储海量大数据 D、HDFS是用于计算海量大数据
参考答案: D
答案解析: 暂无解析
5、下列选项中,用于存放部署Hadoop集群服务器的是()。
? ? ? ?
A、namenode B、datanode C、rack D、metadata
参考答案: C
答案解析:
Rack是用来存放部署Hadoop集群服务器的机架。
6、下列选项中,用于删除HDFS上文件夹的方法是()。
? ? ? ?
A、delete() B、rename() C、mkdirs()
D、copyToLocalFile()
参考答案: A
答案解析:
FileSystem对象调用delete()方法可以删除文件夹,delete()方法接收两个参数,第一个参数表示要删除的文件夹路径,第二个参数用于设置是否递归删除目录。
7、下列选项中,关于HDFS的架构说法正确的是()。
? ? ? ?
A、HDFS采用的是主备架构 B、HDFS采用的是主从架构 C、HDFS采用的是从备架构 D、以上说法均错误
参考答案:
B
答案解析:
HDFS采用主从架构(Master/Slave架构)。
8、下列选项中,用于上传文件的Shell命令是()。
? ? ? ?
A、-ls B、-mv C、-cp D、-put
参考答案: D
答案解析: 暂无解析
多选题
1、下列选项中,关于数据块说法正确的是()。
? ? ? ?
A、磁盘进行数据读/写的最大单位 B、磁盘进行数据读/写的最小单位 C、数据块是抽象的块
D、DataNode是按block对数据进行存储。
参考答案: B,C,D
答案解析: 暂无解析
2、下列说法中,关于crontab表达式说法正确的是()。
? ? ? ?
A、通过执行crontab表达式可以执行定时任务 B、crontab表达式是由6个参数决定 C、Crontab表达式是由5个参数决定 D、以上说法均正确
参考答案: A,B
答案解析: 暂无解析
3、下列说法中,关于使用Java API操作HDFS说法正确的是()。
? ? ? ?
A、需要引入hadoop-common依赖 B、需要引入hadoop-hdfs依赖 C、需要引入hadoop-client依赖 D、以上说法均错误
参考答案: A,B,C
答案解析: 暂无解析
4、下列选项中,关于Metadata元数据说法正确的是()。
? ? ? ?
A、元数据维护HDFS文件系统中文件和目录的信息 B、元数据记录与文件内容存储相关的信息
C、元数据用来记录HDFS中所有DataNode的信息 D、元数据用于维护文件系统名称并管理客户端对文件的访问
参考答案: A,B,C
答案解析:
NameNode用于维护文件系统名称并管理客户端对文件的访问。
判断题
1、HDFS目前不支持并发多用户的写操作,写操作只能在文件末尾追加数据。
? ?
对 错
参考答案: 对
答案解析:
HDFS目前不支持并发多用户的写操作,写操作只能在文件末尾追加数据。
2、HDFS中提供Secondary NameNode节点,是为了取代掉NameNode节点。
? ?
对 错
参考答案: 错
答案解析: 暂无解析
3、在Windows平台开发HDFS项目时,若不设置Hadoop开发环境,也是没问题的。
? ?
对 错
参考答案: 错
答案解析:
在Windows平台开发HDFS项目时,若不设置Hadoop开发环境,则会报以下的错误:java.io.IOException: (null) entry in command string: null chmod 0644。
4、传统文件系统存储数据时,若文件太大,会导致上传和下载非常耗时。
? ?
对 错
参考答案: 对
答案解析:
传统文件系统存储数据时,若文件太大,会导致上传和下载非常耗时。
5、Hadoop在设计时考虑到数据的安全与高效,数据文件默认在HDFS上存放一份。
? ?
对 错
参考答案: 错
答案解析:
Hadoop在设计时考虑到数据的安全与高效,数据文件默认在HDFS上存放三份。
6、在采集数据的过程中,通过在滚动完文件的名称后添加一个标识的策略,不能避免因日志文件过大而导致上传效率低的问题。
? ?
对 错
参考答案: 错
答案解析:
为了避免因日志文件过大而导致上传效率低,可以采取在滚动完文件的名称后添加一个标识的策略来解决这个问题。
7、DataNode在客户端或者NameNode的调度下,存储并检索数据块,对数据块进行创建、删除等操作。