4. 1 一家汽车零售店的 10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2
4
7
10
10
10
12
12
14
15
要求:(1)计算汽车销售量的众数、中位数和平均数。
⑶计算销售量的标准差。
解:
Statistics
汽车销售数量
N
(2)根据定义公式计算四分位数。
(4)说明汽车销售量分布的特征。
Valid Missing
10 0 9.60
Mean
Median
10.00 10
Mode
Std. Deviation Percentiles
4.169
25 50
6.25 10.00 12.50
75
Histogram
Mean =9.6 Std. Dev. =4.169
N =10
19 23 30 23 41
4. 2 随机抽取25个网络用户,得到他们的年龄数据如下:
15 29
21 20 27 20
要求;(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
38 19 22 31
25 22 19 34 17
24 18 16 24 23
网络用户的年龄
Frequency 15 16 17 Valid 18 19 20 Percent 1 1 1 1 3 2 1 4.0 4.0 4.0 4.0 12.0 8.0 4.0 Cumulative Frequency 1 2 3 4 7 9 10 Cumulative Percent 4.0 8.0 12.0 16.0 28.0 36.0 40.0 21
22 23 24 25 27 29 30 31 34 38 41
2 3 2 1 1 1 1 1 1 1 1 25 8.0 12.0 8.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 12 15 17 18 19 20 21 22 23 24 25 48.0 60.0 68.0 72.0 76.0 80.0 84.0 88.0 92.0 96.0 100.0 Total 100.0 Me=23。
从频数看出,众数 Mo有两个:19、23;从累计频数看,中位数 ⑵根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q仁19 , Q3位置=3 X 25/4=18.75,因此Q3=27,或者,由于25
和27都只有一个,因此 Q3也可等于25+0.75 X 2=26.5。 (3) 计算平均数和标准差; (4) 计算偏态系数和峰态系数:
Mean=24.00 ; Std. Deviation=6.652 Skewness=1.080 Kurtosis=0.773
需要进行分组。
(5) 对网民年龄的分布特征进行综合分析: 分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态, 为分组情况下的直方图:
2 -
1
0
------------- 1 ------ 1------ 1 ------1 ----- Q ----- ■ ----- 1 ----- ■ ----- ■ ------ 1 ------ 1 ----- 1 ------ ■ ----- ■ ----- ■ ----- II ------ ir
15
16
17
18
19
20
21
22
23
24
25
27
29
30
31
34
38 41
I
网络用户的年龄
为分组情况下的概率密度曲线:
3.0
分组:
才1g^
1、确定组数:
tnuoc 15
16
17
18
19
20
21
22
23
24
25
27
29
30
31
34
38
41
网络用户的年龄
ig(2)
.Ig 25 二 1 . 1.398 二 5.64,取 k=6
Ig 2 0.30103
2、 确定组距:组距=(最大值-最小值)-组数=(41-15)- 6=4.3,取5 3、 分组频数表
网络用户的年龄 (Binned) Frequency <=15 16 - 20 21 - 25 26 - 30 Valid 31 - 35 36 - 40 41 + Total 分组后的均值与方差:
Percent 4.0 32.0 36.0 12.0 8.0 4.0 4.0 Cumulative Frequency 1 9 18 21 23 24 25 Cumulative Percent 4.0 36.0 72.0 84.0 92.0 96.0 100.0 1 8 9 3 2 1 1 25 100.0 Mean Std. Deviation Variance Skewness
23.3000 7.02377 49.333 1.163 1.302 Kurtosis 分组后的直方图:
Mean =23.30
Std. Dev. =7.024
N =25
4. 6在某地区抽取120家企业,按利润额进行分组,结果如下: 按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合 计 企业数(个) 19 30 42 18 11 120 (2)计算分布的偏态系数和峰态系数。
要求:(1)计算120家企业利润额的平均数和标准差。
解:
Statistics
企业利润组中值 Mi (万元) N
Valid Missing
120 0
426.6667
Mean
Std. Deviation Skewness
116.48445
0.208
Std. Error of Skewness Kurtosis
Std. Error of Kurtosis
4. 9 一家公司在招收职员时, 首先要通过两项能力测试。
Histogram
0.221 -0.625 0.438
Mean =426.67 Std. Dev. =116.484
N =120
Cases weighted by 企业个数
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,
其平均分数是400分,标准差是50分。一位应试者在 A项测试中得了 115分,在B项测试中得了 425分。与平均分数相比,该应 试者哪一项测试更为理想 ?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
x -x 115 -100
ZA=
=
x - x 425 - 400
=1 ; ZB=
=
=0.5
因此,A项测试结果理想。
s 15 s 50
4. 11 对10名成年人和 10名幼儿的身高进行抽样调查,结果如下:
166 169 172 177 180 170 172 174 168 173 成年组 幼儿组
68 69 68 70 71 73 72 73 74 75 要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量
均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大 ?
成年组 平均 标准差 172.1 平均 4.20 佃51 标准差 0.024415 离散系数 ?为什么?
幼儿组 71.3 2.496664 0.035016
离散系数 幼儿组的身高差异大。
7.3从一个总体中随机抽取 n=100的随机样本,得到 x=104560,假定总体标准差 b =86414,构建总体均值 瓦的95%的置信区间。 解: 已知 n =100,x =104560, 卢 85414,1-:■= 95%
由于是正态总体,且总体标准差已知。总体均值
」在1<置信水平下的置信区间为
104560 ± 1.96 X 85414-V 100= 104560 ± 16741.144
7.4 从总体中抽取一个 n=100 的简单随机样本,得到 x =81,s=12o
样本均值服从正态分布: 讥
N
或X
L N i.g ''置信区间为:
「n丿 I’ n丿
(1)构建岂的 90%的置信区间。
12
= =1.2
100
ZG2 = z),05 =1.645,置信区间为:(81-1.645X 1.2,81+1.645X 1.2) = ( 79.03,82.97)
⑵构建「的95%的置信区间。 Z住2 = ZJ.025 =1.96,置信区间为:(81-1.96 X 1.2,81+1.96 X 1.2) = ( 78.65,83.35) (3)构建」的99%的置信区间。
Z(y2 = Z0.005 =2.576,置信区间为: (81-2.576 X 1.2,81+2.576 X 1.2) = ( 77.91,84.09)
7.5利用下面的信息,构建总体均值的置信区间