22 23 24 25 27 29 30 31 34 38 41 Total 2 3 2 1 1 1 1 1 1 1 1 25 8.0 12.0 8.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 100.0 12 15 17 18 19 20 21 22 23 24 25 48.0 60.0 68.0 72.0 76.0 80.0 84.0 88.0 92.0 96.0 100.0 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;
Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图:
32Count10151617181920212223242527293031343841网络用户的年龄
为分组情况下的概率密度曲线:
3.02.5Count2.01.51.0151617181920212223242527293031343841网络用户的年龄 分组:
1、确定组数: K?1?lg?25?lg(n)1.398?1??1??5.64,取k=6 lg(2)lg20.301032、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
<= 15 16 - 20 21 - 25 Valid 26 - 30 31 - 35 36 - 40 41+ Total Frequency 1 8 9 3 2 1 1 25 Percent 4.0 32.0 36.0 12.0 8.0 4.0 4.0 100.0 Cumulative Frequency 1 9 18 21 23 24 25 Cumulative Percent 4.0 36.0 72.0 84.0 92.0 96.0 100.0 23.3000 7.02377 49.333 1.163 分组后的均值与方差:
Mean Std. Deviation Variance Skewness
Kurtosis 1.302
分组后的直方图:
108Frequency642Mean =23.30 Std. Dev. =7.024 N =25010.0015.0020.0025.0030.0035.0040.0045.0050.00组中值 4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一
种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf 1.00 Extremes (=<5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88
Stem width: 1.00 Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
Mean Std. Deviation Variance
7 0.714143
0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 271 272
276 292 284
297 261 268
252 281 303
238 301 273
310 274 263
240 267 322
236 280 249
265 291 269
278 258 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。 (2)按定义公式计算四分位数。 (3)计算日销售额的标准差。 解:
Statistics
百货公司每天的销售额(万元) N
Valid Missing
Mean Median Std. Deviation Percentiles
25 50 75
30 0
274.1000 272.5000 21.17472 260.2500 272.5000 291.2500
4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 名称 A B C 单位成本 (元) 15 20 30 甲企业 总成本(元) 2100 3000 1500 140 150 50 甲企业 2 100 3 000 1 500 乙企业 产品数 217 75 50 3255 1500 1500 总成本(元) 乙企业 3 255 1 500 1 500 要求:比较两个企业的总平均成本,哪个高,并分析其原因。 产品名称 A B C 单位成本(元) 15 20 30 产品数 总成本(元) 平均成本(元) 19.41176471 18.28947368 调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下: 按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合 计 要求:
(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解:
Statistics
企业利润组中值Mi(万元) N
Valid Missing
Mean Std. Deviation Skewness
Std. Error of Skewness Kurtosis
Std. Error of Kurtosis
120 0
426.6667 116.48445
0.208 0.221 -0.625 0.438
企业数(个) 19 30 42 18 11 120