2.28 衿(1)离散系数,因为它消除了不同组数据水平高地的影响。
莄(2)成年组身高的离散系数:vs?4.2?0.024; 172.1
薃幼儿组身高的离散系数:vs?2.3?0.032; 71.3
螈由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.29
2.30 蚈下表给出了一些主要描述统计量,请读者自己分析。 方法A 平均 中位数 众数 标准偏差 极差 最小值 最大值 165.6 165 164 2.13 8 162 170 方法B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132 方法C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128 2.31 (1)方差或标准差;(2)商业类股票;(3)(略)。 2.32 (略)。 第3章概率与概率分布 3.1设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 3.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)。 考虑逆事件A?“任取一个零件为正品”,表示通过三道工序都合格。据题意,有: 于是P(A)?1?P(A)?1?0.648?0.352 3.3设A表示“合格”,B表示“优秀”。由于B=AB,于是 P(B)=P(A)P(B|A)=0.8×0.15=0.12 3.4设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。
=0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 3.5设A=活到55岁,B=活到70岁。所求概率为: 3.6这是一个计算后验概率的问题。
设A=优质率达95%,A=优质率为80%,B=试验所生产的5件全部优质。 P(A)=0.4,P(A)=0.6,P(B|A)=0.955,P(B|A)=0.85,所求概率为: 决策者会倾向于采用新的生产管理流程。
5
3.7令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:
(1)P(B)=P(A1)P(B|A1)?P(A2)P(B|A2)?P(A3)P(B|A3) =0.25×0.04+0.30×0.05+0.45×0.03=0.0385 (2)P(A3|B)=0.45?0.030.0135==0.3506
0.25?0.04+0.30?0.05+0.45?0.030.03853.8据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:
xi P(X=xi) 0 0.216 1 0.432 2 0.288 3 0.064 期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次) 3.9设被保险人死亡数=X,X~B(20000,0.0005)。 (1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X>20)=1-P(X≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E(X) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X) =50000×(20000×0.0005×0.9995)1/2=158074(元) 3.10(1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ=np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。 (2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X~N(10,9.995)。相应的概率为: P(X≤10.5)=0.51995,P(X≤20.5)=0.853262。 可见误差比较大(这是由于P太小,二项分布偏斜太严重)。 【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。 3.11(1)P(X?150)?P(Z?150?200)=P(Z??1.6667)=0.04779 30合格率为1-0.04779=0.95221或95.221%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
即:P{Z?K}?0.95,K/30≥1.64485,故K≥49.3456。 303.12设X=同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1(取整数) (2)P(X?2)?1?P(X?2)?1?=1-0.9011=0.0989
2k?0?C6k0.2k0.86?k
6
第4章抽样与抽样分布
4.1a.20,2b.近似正态c.-2.25d.1.50
4.2a.0.0228b.0.0668c.0.0062d.0.8185e.0.0013 4.3a.0.8944b.0.0228c.0.1292d.0.9699 4.4a.101,99b.1c.不必 4.5趋向正态
4.6.a.正态分布,213,4.5918b.0.5,0.031,0.938
4.7.a.406,1.68,正态分布b.0.001c.是,因为小概率出现了 4.8.a.增加b.减少
4.9.a.正态b.约等于0c.不正常d.正态,0.06 4.10a.0.015b.0.0026c.0.1587 4.11.a.(0.012,0.028)b.0.6553,0.7278 4.12.a.0.05b.1c.0.000625 第5章参数估计 5.1 (1)?x?0.79。(2)E=1.55。 5.2 (1)?x?2.14。(2)E=4.2。(3)(115.8,124.2)。 5.3 5.4 5.5 5.6 5.7 5.8 5.9
(2.88,3.76);(2.80,3.84);(2.63,4.01)。 (7.1,12.9)。 (7.18,11.57)。 (18.11%,27.89%);(17.17%,22.835)。 (1)(51.37%,76.63%);(2)36。 (1.86,17.74);(0.19,19.41)。 (1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 5.10 (1)d?1.75,sd?2.63;(2)1.75±4.27。 5.11 (1)10%±6.98%;(2)10%±8.32%。 5.12 (4.06,14.35)。 5.13 48。 5.14 139。 5.15 57。 5.16 769。 第6章假设检验 6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择
假设应为:H0:??1035,H1:??1035。 6.2 ?=“某一品种的小鸡因为同类相残而导致的死亡率”,H0:??0.04,H1:??0.04。 6.3 H0:??65,H1:??65。
6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据
支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
7
6.5 (1)检验统计量z?x??s/n,在大样本情形下近似服从标准正态分布;
(2)如果z?z0.05,就拒绝H0;
(3)检验统计量z=2.94>1.645,所以应该拒绝H0。 6.6 z=3.11,拒绝H0。 6.7 z=1.93,不拒绝H0。 6.8 z=7.48,拒绝H0。 6.9 ?2=206.22,拒绝H0。 6.10 z=-5.145,拒绝H0。 6.11 t=1.36,不拒绝H0。 6.12 z=-4.05,拒绝H0。 6.13 F=8.28,拒绝H0。 6.14 (1)检验结果如下: t-检验:双样本等方差假设 变量1 变量2 平均 100.7 109.9 方差 观测值 20 20 合并方差 假设平均差 0 df 38 tStat P(T<=t)单尾 1.73712E-06 t单尾临界 P(T<=t)双尾 3.47424E-06 t双尾临界 t-检验:双样本异方差假设 变量1 变量2 平均 100.7 109.9 方差 观测值 20 20 假设平均差 0 df 37 tStat
P(T<=t)单尾 1.87355E-06
t单尾临界
P(T<=t)双尾 3.74709E-06
t双尾临界
(2)方差检验结果如下:
F-检验双样本方差分析
变量1
变量2
平均 100.7
109.9 方差
观测值
20
20
8
df F
P(F<=f)单尾 F单尾临界
19
19
第7章方差分析与试验设计
7.1 F?4.6574?F0.01?8.0215(或P?value?0.0409???0.01),不能拒绝原假设。 7.2 F?17.0684?F0.05?3.8853(或P?value?0.0003???0.05),拒绝原假设。
xA?xB?44.4?30?14.4?LSD?5.85,拒绝原假设; xA?xC?44.4?42.6?1.8?LSD?5.85,不能拒绝原假设; xB?xC?30?42.6?12.6?LSD?5.85,拒绝原假设。 7.3 方差分析表中所缺的数值如下表: 差异源 组间 组内 总计 SS 420 3836 4256 df 2 27 29 MS 210 142.07 — F 1.478 — — P-value 0.245946 — — Fcrit 3.354131 — F?1.478?F0.05?3.554131(或P?value?0.245946??— ?0.05),不能拒绝原假设。 7.4 有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用5种种子和4种施肥
方案搭配进行试验,取得的收获量数据如下表: F种子?7.2397?F0.05?3.2592(或P?value?0.0033???0.05),拒绝原假设。 F施肥方案?9.2047?F0.05?3.4903(或P?value?0.0019???0.05),拒绝原假设。 7.5 F地区?0.0727?F0.05?6.9443(或P?value?0.9311???0.05),不能拒绝原假设。F包装方法?3.1273?F0.05?6.9443(或P?value?0.1522???0.05),不能拒绝原假设。 7.6 F广告方案?10.75?F0.05?5.1432(或P?value?0.0104???0.05),拒绝原假设。 F广告媒体?3?F0.05?5.9874(或P?value?0.1340???0.05),不能拒绝原假设。 F交互作用?1.75?F0.05?5.1432(或P?value?0.2519???0.05),不能拒绝原假设。 第8章相关与回归分析 8.1(1)利用Excel计算结果可知,相关系数为rXY?0.948138,说明相关程度较高。 (2)计算t统计量 给定显着性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值t?2为2.306, 显然t?t?2,表明相关系数r在统计上是显着的。
8.2利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数为:-0.34239,这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二者负相关程度并不大。 相关系数检验:
在总体相关系数??0的原假设下,计算t统计量:
查t分布表,自由度为31-2=29,当显着性水平取??0.05时,t?2=2.045;当显着性水平取??0.1时,
t?2=1.699。
由于计算的t统计量的绝对值1.9624小于t?2=2.045,所以在??0.05的显着性水平下,不能拒绝相关系数??0的原假设。即是说,在??0.05的显着性水平下不能认为人均GDP与第一产业中就业比例有显着的线
9