精品文档
一、 判断题
1.样本容量是指从总体中抽取的个体。 正确答案: ×
2.品质数据既可以用整数值表示,也可以用连续值表示。 正确答案: √
3.需求弹性大的产品价格与销售收入反向变化。 正确答案: √
4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。
正确答案: √
5.在对不同项目进行风险衡量时, 正确答案: ×
6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成本才与产品产销量的增减变化发生关系。
可以用标准差作为标准, 标准差越大, 方案风险水平越高。
正确答案: √
7.如果两个变量不独立,那这两者的相关系数必然不等于 正确答案: ×
8.数据库类型是按照数据存取的方法来划分的。 正确答案: ×
0 。
9.SQL 语言中,条件年龄 BETWEEN 15 AND 35,表示年龄在 15 至 35 之间,且包括 15 岁但不包括 35 岁。
正确答案: ×
10.资本成本就是资金的时间价值。 正确答案: ×
.
11.一组数据排序后处于 25%和 75%位置上的值称为四分位数。
正确答案: √
12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。 正确答案: ×
13.内部收益率考虑了资金时间价值,受折现率高低的影响。 正确答案: ×
14.边际收入是指每增加 1 单位销量所带来的总收入的增加额度。
正确答案: √
15.分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即 F1-Score 。
正确答案: ×
二、 单选题
1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为( )
A、1 B、 -1
C、 +1 或 -1 D、0
正确答案: C
2.表示职称为副教授、性别为男的表达式为( )
A、职称 =' 副教授 ' OR 性别 =' 男 ' B、职称 =' 副教授 ' AND 性别 =' 男' C、 BETWEEN '副教授 ' AND ' 男' D、IN (' 副教授 ','男 ') 正确答案: B
3.对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用(
宜,其值是(
)。
A、平均数, 14.4 B、中位数, 8.5
.
精品文档
)最为适
精品文档
C、众数, 8 D、以上都可以 正确答案: C 4.(
)是进行项目投资效益评价的最终依据。
A、现金流量 B、盈亏平衡点 C、净现金流量 D、现金流入量 正确答案: C
5.有一组数据其均值是 值是( A、20 B、 10 C、 15 D、30
正确答案: D
6.分类变量使用以下哪个统计量进行缺失值填补较合适 A、均值 B、最大值 C、众数 D、中位数 正确答案: C
)。
20 ,对其中的每一个数据都加上 10 ,那么得到的这组新数据的均
7.假设 {BCE}为一频繁项目集 (Frequent Itemset) ,则根据 Apriori Principle 以下何者不是子频繁项目?
A、BC B、 CE C、 C D、CD
正确答案: D
8.请问以下何者属于时间序列的问题?
.
精品文档
A、信用卡发卡银行侦测潜在的卡奴
B、基金经理人针对个股做出未来价格预测 C、电信公司将人户区分为数个群体 D、以上均不是 正确答案: B
9.数据正规化 (Data Normalization) 是在知识发掘处理 (Knowledge Discovery Process)中的哪一个阶段进行?
A、数据清洗 B、数据选择 C、数据编码 D、数据扩充 正确答案: C
10.已知事件 A 的概率 P(A)= 0.6, U 为必然事件,则 P(A+U) = 1,P(AU )= _______
A、0.4 B、 0.6 C、 0 D、1
正确答案: B
11.当时间序列数据点的一阶差分近似为一常数 ,可配合以下哪种预测模型(
)
A、直线
B、二次抛物线 C、三次抛物线 D、指数曲线 正确答案: A
12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响( )
A、方差分析 B、回归分析 C、聚类分析 D、主成分分析 正确答案: C
.
精品文档
13.若数据量较大 ,下面哪种方式比较适合( A、系统聚类
B、快速聚类( k-means ) C、 A 和 B 都可以 D、A 和 B 都不可以 正确答案: B
)
14.在建立线性回归 (Linear Regression) 之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?
A、皮尔森相关系数 B、卡方检定 C、 T- 检定 D、Z-Score 正确答案: A
15.ROC 曲线凸向哪个角,代表模型越理想? A、左上角 B、右上角 C、左下角 D、右下角 正确答案: A
16.决策树中的 Information Gain 的计算是用来? A、剪枝 B、使树成长
C、处理缺失值和异常值 D、砍树
正确答案: B
17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
A、分类 B、聚类 C、关联分析
.