第一章
1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。 A:计算 B:访问 C:应用 D:分析
答案: 分析
2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。
A:Variety
B:Vainly
C:Vagary
D:Valley
答案: Variety
3、大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。
A:数据统计
B:数据计算
C:数据聚类
D:数据清洗
答案: 数据聚类
4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。 A:对
B:错
答案: 错
5、目前的大数据处理技术只能处理结构化数据。 A:对 B:错
答案: 错 第二章
1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )A:mdf B:mdb C:dbf D:xls
: mdb 答案
、大多数日志文件的后缀名是(。 )2 A:txt B:csv C:xml D:log
: log 答案
。 weka3、本课程重点介绍的软件的专有文件格式是() A:MongoDB B:ARFF C:value
D:key map
。 答案: ARFF
4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。
A:专业性
B:排他性
C:一致性
D:共享性
答案: 一致性
5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。
A:电话号码
B:关键词
C:网页地址
D:用户名
答案: 网页地址
6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。 A:otd B:jpg C:png D:gif
答案: otd
可以通过“数据有效性”按钮操作来规范数据输入的范围。Excel、7. A:对 B:错
智慧树知到大数据工具应用章节测试答案



