华南理工大学网络教育学院 《 统计学原理 》作业
1、某快餐店某天随机抽取 49名顾客对其的平均花费进行抽样调查。调查结果为: 平均花费 8.6元,标准差 2.8元。试以 95.45%的置信度估计:
( 1)该快餐店顾客总体平均花费的置信区间及这天营业额的置信区间(假定当天顾 客有 2000 人);
( 2)若其他条件不变,要将置信度提高到 99.73%,至少应该抽取多少顾客进行调 查?
(提示: z0.0455 1.69, z0.0455 / 2 2; z0.0027 / 2 3, z0.0027 2.78) 解:
( 1)、
2.8
x
49
0.4,
x
2 0.4 0.8
总体均值的置信区间:( 8.6-0.8, 8.6+0.8)即( 7.8, 9.4)元
营业总额的置信区间:( 2000*7.8, 2000*9.4)即( 15600,18800 )元。 ( 2)必要的样本容量: n
9* 2.82 0.82
110.25 111
2、一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施 的看法,分别抽取了 150名男学生和 120名女学生进行调查,得到的结果如下:
男学生
赞成 反对 合计
45 105 150
女学生 42 78 120
合计 87 183 270
请检验男女学生对上网收费的看法是否相同。已知:显著性水平 =0.05, 2 2
(2) 5.992, 02.05(4) 9.487。 0.05 (1) 3.842, 0.05 解: H0: μ1 =μ2 H1: μ1μ2 不相等 = 0.05 决策:
在 = 0.05的水平上不能拒绝 H0, 结论:
可以认为男女学生对上网收费的看法相同
Df=(2-1)(2-1)=1
3、一家管理咨询公司为不同的客户举办人力资源管理讲座。每次讲座的内容基本上 是一样的,但讲座的听课者,有时是中级管理者,有时是低级管理者。该咨询公司 认为,不同层次的管理者对讲座的满意度是不同的,对听完讲座后随机抽取的不同 层次管理者的满意度评分如下(评分标准从 1—— 10, 10代表非常满意):
高级管理者
7 7 8 7 9
中级管理者
8 9 8 10 9 10 8
经计算得到下面的方差分析表: 差异源 组间 组内 总计
18.9 48.5
17
1.26
SS
df
MS
F
P-value 0.0008
F crit 3.68
低级管理者
5 6 5 7 4 8
( 1) 请计算方差分析表中的 F值。( 10分) ( 2)请用 = 0.05的显著性水平进行方差分析。
( 15分) ( 1)
H0 : 1 = 2 = 3,H1 : 1, 2 , 3 不相等
1
2 3提出假设:
( 2)解: P=0.0008< = 0.05(或发 F=11.76>F =3.68),拒绝原假设,表明不同层 次的管理者的平均满意度评分之间有显著差异。
《统计学原理 》 第 2页(共 页)
4、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为 100克。现从某天 生产的一批产品中按重复抽样随机抽取 50包进行检查,测得样本均值为:
x 101.32
克,样本标准差为: s 1.634克。假定食品包重服从正态分布, 0.05 2 1.96, zz0.05
1.64,
0.05 ,要求:
( 1) ( 2)
确定该种食品平均重量95%的置信区间。(10分)
采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检验的
具体步骤)。( 15分)
50, z0.05 2 1.96。 解: ( 1 )已知:n
k
M i f i
样本均值为: x
i 1
n
k
5066
101.32克,
50
(M i x) 2 f i
n 1
1.634 50
样本标准差为:
s
i 1
130.88 49
1.634克。
由于是大样本,所以食品平均重量 95%的置信区间为:
x z
s
2
n
101.32 1.96 101.32 0.453
即( 100.867,101.773)。 ( 2)提出假设: H 0 : 计算检验的统计量:
100, H1 : x
0
100
5.712
1.634 50 s n
由于 z 5.712 z0.05 2 1.96,所以拒绝原假设,该批食品的重量不符合标准要求。
z
101.32 100
5、一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常 行驶条件下大于 40000公里,对一个由 20个轮胎组成的随机样本作了试验,测得平 均值为 41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,制 造商能否根据这些数据作出验证,产品同他所说的标准相符? 7291)
解: H0: m 40000 H1: m < 40000 a = 0.05 df = 20 - 1 = 19 临界值:
( = 0.05,t (19)=1.
《统计学原理 》 第 3页(共 页)
检验统计量 :
x 0 t
s n
41000 40000 5000 20
0.894
决策 :在 a = 0.05的水平上不能拒绝 H0
结论:有证据表明轮胎使用寿命显著地大于 40000公里
6、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为 86分,标准差为 12分。 乙班考试成绩的分布如下:
考试成绩 (分 ) 60以下 60— 70 70— 80 80— 90 90— 100 合计
学生人数 (人 )
2 7 9 7 5 30
( 1)画出乙班考试成绩的直方图。( 5分)
( 2)计算乙班考试成绩的平均数及标准差。( 5分)
( 3)比较甲乙两个班哪个班考试成绩的离散程度大 ?( 5分)
解:(1)乙班考试成绩的直方图如下:
《统计学原理 》 第 4页(共 页)
10 8
数 人
6 4 2 0
考试成绩
乙班考试成绩分布的直方图
k
M i f i
( 2) x
i 1
n
k
55 2 65 7 75 9 85 7 95 5 2310
30 30
(M i x) 2 f i
i 1
77分
s
n 1
(55 77) 2 2 (65 77)2 7 (75 77) 2 9 (85 77)2 7 (95 77) 2
30 1 4080
11.86分 29
5
( 3)甲班考试分数的离散系数为: v甲 乙班考试分数的离散系数为: v乙
s 12
x 86 s 11.86
0.1540。 77 x
0.1395。
由于 v甲 v乙,所以甲班考试成绩的离散程度小于乙班。
7、一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。假如市场上有两 种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽 取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下:
灯泡寿命(小时) 700~ 900
900~ 1100 1100~ 1300 1300~ 1500
合计
供应商甲
12
14 24 10 60
供应商乙
4 34 19 3 60
( 1) 请用直方图直观地比较这两个样本,你能得到什么结论?
(3分) ( 2) 你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命
的一般水平?请简要说明理由。 (3分 )
( 3) 哪个供应商的灯泡具有更长的寿命? (4分)
《统计学原理
》
第 5页(共
页)
( 4) 哪个供应商的灯泡寿命更稳定? (5分 )
解:( 1)两个供应商灯泡使用寿命的直方图如下:
30
40 30
20 数 频 10 0
使用寿命
数 频 20
10 0
使用寿命
供应商甲
供应商乙
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在 1100小时~ 1300小时 之间,供应商乙的灯泡的使用寿命多数集中 900小时~ 1100小时之间。从离散程 度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
( 2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供 应商灯泡使用寿命的分布基本上是对称分布的。 ( 3)计算两个供应商灯泡使用寿命的平均数如下:
k
M i f i
x甲
i 1
800 12 1000 14 1200 24 1400 10 66400
60
60
n
k
1106.67
小时。
M i fi
x乙
i 1
n
800 4 1000 34 1200 19 1400 3 64200
1070 小时。
60 60
甲供应商灯泡使用寿命更长。
( 4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
k
(M i x )2 fi
s甲 v甲
i 1
s甲 x甲
k
n 1 199.89 1106.67 (M i x )2 fi
2357333.34
199.89 小时。
59
0.18
s甲 v乙
i 1
s乙 x乙
n 1 136.92 1070
1106000
136.92 小时。
59
0.13
《统计学原理
》
第 6页(共
页)
由于 v乙
v甲,说明供应商乙的灯泡寿命更稳定。
8、为估计每个网络用户每天上网的平均时间是多少,随机抽取了 225个网络用户的 简单随机样本,得样本均值为 6.5小时,样本标准差为 2.5 小时。
( 1)试以 95%的置信水平,建立网络用户每天平均上网时间的区间估计。( 8分) ( 2)在所调查的 225个网络用户中,年龄在 20岁以下的用户为 90个。以95%的置 信水平,建立年龄在 20岁以下的网络用户比例的置信区间? z0.05 1.645)( 7分)
解:(1)、已知 N=225, 1-α =95%, Zα /2=1.96, -x =6.5,ó=2.5 网络用户每天平均上网时间的 95%的置信区间为:
x za / 2
s n
6.5 1.96
2.5 225
6.5 0.33
(注:z0.025 1.96,
=( 6.17, 6.83)
( 2)、样本比例:P=90/225=0.4;年龄20岁以下的网络用户比例的置信区间为: P Za /2
p(1 p)
n
0.4 (1 0.4)
0.4 1.96 0.4 0.064
225
即( 33.6%, 46.4%)
《统计学原理 》 第 7页(共 页)