1、(单选,10分)
不属于Hadoop生态系统的是( )
A、HDFS B、GFS C、HBase D、Hive 答案:B
2、(单选,10分)
MapReduce计算模型的描述,错误的是( )
A、MapReduce采用的是一种分而治之的思想
B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集 C、MapReduce适合于实时在线任务的应用场景 D、MapReduce可以处理离线任务 答案:C
3、(单选,10分)
Spark描述正确的是( )
A、Spark Streaming是将Stream数据分成小的时间片段(几秒) B、Spark是专为大规模数据处理而设计的快速通用的计算引擎 C、内存计算下Spark比Hadoop快100倍 D、Spark不适合处理离线数据。 答案:D
5、(单选,10分)
聚类分析的描述错误的是( )
A、基于“物以类聚,人以群分”思想
B、采用样本间距离度量相似性,将数据分类划分到已有类别 C、k-means算法适合于非此即彼的聚类分析方法
D、对于有层级关系的样本,可以采用自底向上的凝聚式层次聚类分析方法 答案:B
6、(单选,10分)
关于深度学习算法的描述,错误的是( )
A、深度学习通过组合低层特征形成更加抽象的高层特征或类别。 B、深度学习算法适合于语音识别、文字识别、智能客服等应用场景
C、深度学习应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。
D、KNN、SVM等算法属于深度学习算法。 答案:D
7、(单选,10分)
计算智能描述错误的是( )
A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择中产生的 B、计算智能包括遗传算法、粒子群算法、蚁群算法等 C、粒子群算法是模拟鸟随机搜索食物的算法 D、计算智能是局部最优算法 答案:D
8、(单选,10分)
深度学习开源软件框架描述,错误的是( )
A、TensorFlow支持多种操作系统和终端设备
B、Caffe支持命令行、 Python和MATLAB接口
C、PyTorch内嵌自动求导系统,使其成为最流行的动态图像处理框架 D、2018年PyTorch项目并入Caffe2项目。 答案:D
9、(单选,10分)
HDFS是基于google的GFS白皮书设计开源分布式文件系统
A、正确 B、错误 答案:A
10、(单选,10分)
啤酒和尿布的关系是沃尔玛分析消费者购物行为时,利用分类分析方法发现的规律
A、正确 B、错误 答案:B
1、(单选,10分)
下列对大数据4V特征的说法中,错误的是( )
A、数据规模大 B、数据价值密度高 C、数据类型多样 D、数据处理速度快 答案:B
2、(单选,10分)
按照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是( )
大数据及其应用(2020成电)



