题库(第一、三、八章)
第一章 单选题
1、大数据的数据量现在已经达到了哪个级别?( C ) A、GB B、TB C、PB D、ZB
2、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?( A )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters” C、“Bigtable: A Distributed Storage System for Structured Data” D、“The Hadoop File System”
3、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?( B )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters” C、“Bigtable: A Distributed Storage System for Structured Data” D、“The Hadoop File System”
4、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?( C )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters” C、“Bigtable: A Distributed Storage System for Structured Data” D、“The Hadoop File System”
5、对于GFS架构,下面哪个说法是错误的?( A )
A、GFS Master节点管理所有的文件系统所有数据块。
B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。
C、GFS Master还管理着系统范围内的活动,比如块服务器之间的数据迁移等 D、GFS Master与每个块服务器通信(发送心跳包),发送指令,获取状态
6、下面哪个选项不是HDFS架构的组成部分?( D ) A、NameNode B、DataNode
C、SecondaryNameNode D、GFS
7、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?( D ) A、HDFS B、MapReduce C、Yarn D、HBase
8、与Hadoop 1.x相比,Hadoop 2.x采用全新的架构,最明显的变化就是增加了哪个组件?( D ) A、MapReduce B、Pig C、HBase D、Yarn
9、建立在Hadoop文件系统之上的分布式的列式数据库?( A ) A、HBase B、Hive C、YARN D、Mahout
10、下面哪个选项不属于Google的三驾马车?( A ) A、HDFS
B、MapReduce C、BigTable D、GFS 多选题
1、下面哪些是大数据的基本特征?( ABCD ) A、数据体量大 B、数据类型多 C、处理速度快 D、价值密度低
2、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点( ABCD ) A、高可靠性 B、高扩展性 C、高效性 D、高容错性 判断题
( × ) 1、Google的在大数据解决方案是开源的。
( √ ) 2、GFS分布式文件系统有两个基本组成部分,一个是客户端(Client),一个是服务端(Server)
( √ ) 3、上传的数据块保存在GFS上,在保存过程中需要水平复制,水平复
Hadoop题库(第1-3-8章)



