大数据及其应用
大数据方法与工具
不属于Hadoop生态系统的是( ) GFS
MapReduce计算模型的描述,错误的是( ) MapReduce适合于实时在线任务的应用场景
Spark描述正确的是( ) Spark不适合处理离线数据
下列关于人工智能技术描述错误的是( ) 深度学习通常需要昂贵的GPU设备,不太适合于大数据分析
聚类分析的描述错误的是( ) 采用样本间距离度量相似性,将数据分类划分到已有类别 关于深度学习算法的描述,错误的是( ) KNN、SVM等算法属于深度学习算法。 计算智能描述错误的是( ) 计算智能是局部最优算法
深度学习开源软件框架描述,错误的是( ) 2018年PyTorch项目并入Caffe2项目。 HDFS是基于google的GFS白皮书设计开源分布式文件系统 正确
啤酒和尿布的关系是沃尔玛分析消费者购物行为时,利用分类分析方法发现的规律 错误
大数据基本概念
下列对大数据4V特征的说法中,错误的是( ) 数据价值密度高
按照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是( ) 1TB=1024MB
下列关于大数据中计算机存储容量单位的说法中,错误的是( ) 一个英文字符需要2个字节的存储空间
数据清洗的方法不包括( ) 数据的可视化 非关系型数据库不包括( ) Mapreduce 数据库不包括( ) Mapreduce
下列关于分布式数据库的说法中,错误的是( ) 每台计算机中都一定有DBMS的一份完整拷贝副本
大数据4V特征不包括( ) 真实性(Veracity) 大数据的4V特征仅仅是指数据的体量大。 错误
分布式数据库是指物理上分散在不同地点,但是逻辑上是统一的数据库。 正确