第一章
单选题
1、下列选项中,最早提出“大数据”这一概念的是()。
? ? ? ?
A、贝恩 B、麦肯锡 C、吉拉德 D、杰弗逊
参考答案: B
答案解析: 暂无解析
2、下列选项中,哪一项是研究大数据最重要的意义()。
? ? ? ?
A、分析 B、统计 C、测试 D、预测
参考答案: D
答案解析:
研究大数据,最重要的意义是预测。
3、Hadoop1.0中,Hadoop内核的主要组成是()。
? ? ? ?
A、HDFS和MapReduce B、HDFS和Yarn C、Yarn
D、MapReduce和Yarn
参考答案: A
答案解析:
Hadoop1.0中,Hadoop内核的主要是由HDFS和MapReduce两个系统组成。
4、在HDFS中,用于保存数据的节点是()。
? ? ? ?
A、namenode B、datanode C、secondaryNode D、yarn
参考答案: B
答案解析: 暂无解析
多选题
1、下列选项中,属于Google提出的处理大数据的技术手段有()。
? ? ? ?
A、MapReduce B、MySQL C、BigTable D、GFS
参考答案: A,C,D
答案解析:
Google提出了三个处理大数据的技术手段,分别是MapReduce、BigTable和GFS。
2、下列选项中,属于Hadoop优势的有()。
? ? ? ?
A、扩容能力强 B、可靠性 C、低效率 D、高容错性
参考答案: A,B,D
答案解析:
Hadoop具有扩展能力强、成本低、高效率、可靠性、高容错性的优势。
3、下列选项中,属于Hadoop版本系列的有()。
? ? ?
A、Hadoop4 B、Hadoop2 C、Hadoop1
? D、Hadoop3
参考答案: B,C,D
答案解析:
Hadoop主要分为Hadoop1、Hadoop2、Hadoop3三个系列的多个版本。
判断题
1、大数据提供的是一些描述性的信息,而创新还是需要人类自己实现。
? ?
对 错
参考答案: 对
答案解析: 暂无解析
2、JobTracker只负责执行TaskTracker分配的计算任务。
? ?
对 错
参考答案: 错
答案解析:
TaskTracker只负责执行JobTracker分配的计算任务。
3、大数据在医疗行业中可以有效控制疾病的发生。
? ?
对 错
参考答案: 错
答案解析:
在医疗行业中,大数据可以有效预防预测疾病。
4、在HDFS中,namenode用于决定数据存储到哪一个datanode节点上。
? ?
对 错
参考答案:
对
答案解析: 暂无解析
5、Hadoop是Apache顶级的开源项目。
? ?
对 错
参考答案: 对
答案解析: 暂无解析
6、Hadoop的开源社区版比较著名的是Cloudera公司的CDH版本。
? ?
对 错
参考答案: 错
答案解析:
Hadoop的商业版比较著名的是Cloudera公司的CDH版本。
填空题
1、马云曾经说过未来的时代将不是IT时代,而是【】时代。
参考答案: 【DT】 答案解析: 暂无解析
2、【】中引入了资源管理框架Yarn。
参考答案: 【Hadoop2.x】 答案解析: 暂无解析
3、大数据的四大特征是体量大(Volume)、【】、速度快(Velocity)和【】。
参考答案:
【多样(Varity)】【价值(Value)】 答案解析: 暂无解析
4、在Hadoop1.x版本中,MapReduce是由一个【】和多个TaskTracker组成。
参考答案:
【JobTracker】
答案解析: 暂无解析
5、大数据在金融行业中的具体表现为【】、【】、决策支持、服务创新以及产品创新。
参考答案:
【精准营销】【风险管控】 答案解析: 暂无解析
6、大数据的分为【】、非结构话数据和【】。
参考答案:
【结构化数据】【半结构化数据】 答案解析:
大数据的分为结构化数据、非结构话数据以及半结构化数据。
简答题
1、简述大数据在零售行业应用的具体表现。
参考答案:
大数据在零售行业的具体表现有三个,分别是精准定位零售行业市场、支撑行业收益管理以及挖掘零售业新需求。 答案解析: 暂无解析
2、简述Hadoop生态体系常见的子系统。
参考答案:
Hadoop生态体系中常见的子系统有HDFS分布式文件系统、MapReduce分布式计算框架、Yarn资源管理框架、Sqoop数据迁移工具、Mahout数据挖掘算法库、HBase分布式存储系统、Zookeeper分布式协作服务、Hive基于Hadoop的数据仓库以及Flume日志收集工具。 答案解析: 暂无解析