附录:教材各章习题答案
第1章 统计与统计数据
1.1 (1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2 (1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年
人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3 (1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;
(5)推断统计方法。 1.5 (略)。 1.6 (略)。
第2章 数据的图表展示
2.1
(1) 属于顺序数据。
(2)频数分布表如下
服务质量等级评价的频数分布
服务质量等级 A B C D E 合计 (3)条形图(略) (4)帕累托图(略)。 2.2
(1)频数分布表如下
40个企业按产品销售收入分组表 按销售收入分组 企业数 /万元 100以下 100~110 110~120 120~130 130~140 140以上 合计 /个 5 9 12 7 4 3 40 频率 /% 12.5 22.5 30.0 17.5 10.0 7.5 100.0 向上累积 企业数 5 14 26 33 37 40 — 频率 12.5 35.0 65.0 82.5 92.5 100.0 — 频率/% 27.5 27.5 22.5 22.5 100.0 向下累积 企业数 40 35 26 14 7 3 — 频率 100.0 87.5 65.0 35.0 17.5 家庭数/频率 14 21 32 18 15 100 频率/% 14 21 32 18 15 100 7.5 — (2)某管理局下属40个企分组表 按销售收入分组/万元 先进企业 良好企业 一般企业 落后企业 合计 2.3
频数分布表如下
某百货公司日商品销售额分组表
企业数/个 11 11 9 9 40 按销售额分组/万元 25~30 30~35 35~40 40~45 45~50 合计 直方图(略)。 2.4 茎 1 2 3 4 5 2.5
8 8 9 茎叶图如下 叶 频数/天 4 6 15 9 6 40 频率/% 10.0 15.0 37.5 22.5 15.0 100.0 数据个数 3 12 5 6 4 0 1 1 3 3 6 8 8 8 9 9 9 1 3 5 6 9 0 1 2 7 1 2 3 6 6 7 箱线图(略)。
(1)排序略。
(2)频数分布表如下
100只灯泡使用寿命非频数分布
按使用寿命分组/小时 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计 (3)直方图(略)。
(4)茎叶图如下 茎 叶 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 2.6
(1)频数分布表如下
灯泡个数/只 2 5 6 14 26 18 13 10 3 3 100 频率/% 2 5 6 14 26 18 13 10 3 3 100 按重量分组 40~42 42~44 44~46 46~48 48~50 52~52 52~54 54~56 56~58 58~60 60~62 合计 (2)直方图(略)。
频率/包 2 3 7 16 17 10 20 8 10 4 3 100 (3)食品重量的分布基本上是对称的。 2.7
(1)频数分布表如下 按重量误差分组 10~20 20~30 30~40 40~50 50~60 60~70 70~80 80~90 合计 (2)直方图(略)。 2.8
(1)属于数值型数据。
(2)分组结果如下
频数/个 0 5 7 8 13 9 6 2 50 分组 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计 (3)直方图(略)。 2.9 2.10
(1)直方图(略)。
天数/天 6 8 10 13 12 4 7 60 (2)自学考试人员年龄的分布为右偏。
(1)茎叶图如下 A班 数据个数 树 叶 树茎 B班 树叶 数据个数 0 3 59 2 1 2 11 23 7 6 0 4 97 4 5 6 7 0448 00113449 123345 011456 000 4 12 9 8 6 6 3 6655200 632220 8 9 10 (2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.11 2.12 2.13 2.14 2.15
(略)。 (略)。 (略)。 (略)。
箱线图如下:(特征请读者自己分析)
第3章 数据的概括性度量
3.1
(1)M0?10;Me?10;x(2)QL?5.5;QU?12。 (3)s?9.6。
?4.2。
M0?19Me?23(4)左偏分布。 3.2
(1)
;
。
(2)QL?5.5;QU?12。 (3)x?24;s?6.65。
(4)SK?1.08;K?0.77。
(5)略。 3.3
(2)x(1)略。
?7;s?0.71。
(3)v1?0.102;v2?0.274。 (4)选方法一,因为离散程度小。 3.4
(1)x=274.1(万元);Me=272.5 。
(3)s?21.17(万元)。 3.5
甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位
成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6
(2)SK3.7
(1)x=426.67(万元);s(2)QL=260.25;QU=291.25。
?116.48(万元)。
?0.203;K??0.688。
(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大
小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8
(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:x=27.27(磅),s (3)68%;
(4)95%。 3.9
?2.27(磅);
女生:x=22.73(磅),s?2.27(磅);
通过计算标准化值来判断,
zA?1,zB?0.5,说明在A项测试中该应试者比平均分数高
出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。 3.10
日期 标准化值Z
3.11
通过标准化值来判断,各天的标准化值如下表
周一 3
周二 -0.6
周三 -0.2
周四 0.4
周五 -1.8
周六 -2.2
周日 0
周一和周六两天失去了控制。
(1)离散系数,因为它消除了不同组数据水平高地的影响。
4.2?0.024;
172.12.3 幼儿组身高的离散系数:vs??0.032;
71.3 (2)成年组身高的离散系数:vs? 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 3.12
下表给出了一些主要描述统计量,请读者自己分析。 方法A 平均 中位数 众数 标准偏差 极差 最小值 最大值 3.13
165.6 165 164 2.13 8 162 170 方法B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132 方法C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128 (1)方差或标准差;(2)商业类股票;(3)(略)。
第4章 抽样与参数估计
4.1 (1)200。(2)5。(3)正态分布。(4)?(100?1)。 4.2 (1)32。(2)0.91。 4.3 0.79。
4.4 (1)x25~N(17,2)。(2)x100~N(17,1)。 4.5 (1)1.41。(2)1.41,1.41,1.34。 4.6 (1)0.4。(2)0.024 。(3)正态分布。
4.7 (1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。 4.8 (1)?x?2.14;(2)E=4.2;(3)(115.8,124.2)。 4.9 (87819,121301)。
4.10 (1)81±1.97;(2)81±2.35;(3)81±3.10。
4.11 (1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702)
4.12 (1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。 4.13 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
22