. ... .
“曙光瑞翼杯”大数据知识竞赛试题
2024年度
一、单选题(每题1分)
1、 小米摄像头记录下来的10分钟视频属于哪类数据: A、结构化数据 B、半结构化数据 C、非结构化数据 2、 结构化数据具备哪种特征:
A、具备明确逻辑关系 B、不具备明确逻辑关系 C、不一定具备明确逻辑关系 3、 指纹打卡的数据属于哪些数据: A、传感数据 B、交互数据 C、交易数据 4、 大数据擅长处理哪个级别的数据? A、MB B、GB C、TB D、PB 5、 电子是什么类型数据:
A、非结构化数据 B、结构化数据 C、半结构化数据 6、 网络新闻是什么类型数据:
A、非结构化数据 B、结构化数据 C、半结构化数据 7、 下列属于结构化数据的是:
A、图片 B、一卡通学生信息 C、简历 8、 表1属于几维列表?
三 四 性别 男 女 学号 2016130133 2016131038 年级 2016 2016 成绩 80 60 表1
. . . . .z
. ... .
A、二维 B、三维 C、四维 D、五维 9、 图1中的警衔级别属于哪种属性?
图1
A、标称属性 B、二元属性 C、序数属性 D、数值属性 10、
关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联 B、数据模型满足一定条件的二维表格式 C、两个数据库之间有一定的关联 11、
下列哪种数据类型不适合MySQL存储:
A、EXCEL报表 B、图片和声音 C、数据库里的财务数据 12、
以下不属于ACID原则的是:
A、原子性 B、相对性 C、隔离性 D、 持久性 13、
淘宝自主设计的自动化分布式存储系统是:
A、MongoDB B、HBase C、Oceanbase 14、
BeansDB 是一个由我国哪个公司自主开发的:
A、淘宝 B、豆瓣社区 C、优酷 D、视觉中国 15、
下列不是NewSQL数据库的是:
. . . . .z
. ... .
A、Sybase B、MemSQL C、TokuDB 16、
下列不是NoSQL数据库的是:
A、Bigtable B、Dynamo C、DB2 17、
下列不是传统关系型数据库的是:
A、MySQL B、HBase C、Sybase 18、
下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等容 B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据 C、所有发现的知识都是绝对的 19、
下列不属于数据挖掘知识的方法
A、数学方法 B、归纳方法 C、实验方法 20、
一般情况下,舆情监测容不包含:
A、对主流门户、国外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计 C、对个人或家成员庭银行及个人财产情况进行全面收集、分析和统计 21、
科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系 B、三者属于递进关系 C、三者之间没有清晰边界 22、
下列哪个不属于可视化的作用:
A、信息传播与协调 B、支持对信息的推理和分析 C、对信息进行筛选和储存 23、
下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化 B、时空数据可视化 C、多变量数据可视化
. . . . .z
. ... .
24、
下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化 B、时空数据可视化 C、多变量数据可视化
25、
下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化 B、时空数据可视化 C、非结构化数据可视化
26、
目前在全球云计算市场份额占有率最高的公司是:
. . . . .z
. ... .
A、谷歌 B、亚马逊 C、微软 D、IBM 27、
在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化 B、产品和服务高度差异化和个性化 C、价值链上企业运作差异化和静态化 D、新型增值服务模式不断涌现 28、
下列哪个不是大数据下互联网广告的特点
A、广告容更有针对性 B、提高广告决策效率 C、广告以平面媒体为主 D、广告传播模式的改变 29、
微信朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近 B、对于目标受众的划分更加精细 C、大数据最本质的应用就在于预测 D、随意投放的广告 30、
啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为 B、客户群体细分 C、供应链管理
二、多选题(每题2分)
1. Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS B、HIVE C、HBase D、MapReduce 2. 以下平台属于Apache软件基金会项目的是:
. . . . .z
. ... .
A、Hadoop B、Spark C、Storm D、MongoDB 3. 以下属于大数据挖掘算法的是:
A、决策树 B、支持向量机 C、极差规格化 D、朴素贝叶斯 4. 以下属于Spark平台特点的是:
A、共享变量 B、离线处理 C、存计算 D、弹性分布式数据集 5. 在分布式云计算平台中,分布式文件系统的块文件的大小可以是: A、28M B、64M C、100M D、128M
三、判断题(每题1分)
1. Newsql是一种新兴的非关系型数据库。( )
2. 数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。( )
3. Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。( ) 4. 数据ETL属于数据分析和挖掘的畴。( )
5. MapReduce的输入是基于Key-Value键值对。( )
6. 云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软
件。( )
7. Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。( ) 8. 商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。( ) 9. R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。
( )
10. HDFS的主服务器名称叫做DataNode。( )
. . . . .z