第一章 绪论 一、填空
1、统计数据按测定层次分,可以分为分类数据 、 顺序数据和 数值型数据 ;如果按时间状况分,可以分为 截面数据 和 时间序列数据 。
2、由一组频数2,5,6,7得到的一组频率依次是 0.1 、 0.25 、 0.3 和 0.35 ,如果这组频数各增加20%,则所得到的频率 不变 。
3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为 640,其组中值为620 。
4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。
5、中位数Me可反映总体的 集中 趋势,四分位差Q.D可反映总体的 离散 程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大 2 倍,而频数都减少为原来的 1/3 ,那么算术平均数 扩大为原来的2倍 。 四、计算题
1、某班的经济学成绩如下表所示: 43 77 84
55 77 86
56 78 87
56 79 88
59 80 88
60 81 89
67 82 90
69 83 90
73 83 95
75 83 97
(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数 (2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间?
4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组 按身高分组(cm) 150~155 155~160 160~165 165~170 人数(人) 22 108 95 43 青少年组 按身高分组(cm) 70~75 75~80 80~85 85~90 人数(人) 26 83 39 28 170以上 32 90以上 24 合计 300 合计 200 要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?为什么? 6、设甲、乙两单位职工的工资资料如下: 甲单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 2 4 10 7 6 4 30 乙单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 1 2 4 12 6 5 30 要求:试比较哪个单位的职工工资差异程度小。
8、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是 100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想? KEY: 1、(1)77, 80.5,68.5,87.25 (2)83,18.75,0.173
(3)中位数,是数据分布明显左偏又是顺序数据。 (4)左偏 组中值y yf y^2 身高(cm) 频数f x 22 152.5 -2 -44 4 150~155 108 157.5 -1 -108 1 155~160 95 162.5 0 0 0 160~165 43 167.5 1 43 1 165~170 32 172.5 2 64 4 170以上 300 -45 合 计 (y^2)f 88 108 0 43 128 367 令y?y?x?ax?162.5 ?b5?yf45????0.15 ?f300x?a?by?162.5?5*(?0.15)?161.75
?y2f367y???1.223
?f3002标准差: ?y?y2?y2?1.0957
575. ?x?b?y?5?1.09? 4标准差变异系数:
?5.4784C????0.03387
X161.75成人组的平均身高为161.75cm,标准差为5.4784cm,标准差系数为0.03387。 青少年组 身高频率f 组中值 y yf y^2 (y^2)f (cm) 26 72.5 -2 -52 4 104 70~75 83 77.5 -1 -83 1 83 75~80 39 82.5 0 0 0 0 80~85 28 87.5 1 28 1 28 85~90 24 92.5 2 48 4 96 90以上 合 200 -59 311 计 令y?y?x?ax?82.5 ?b5?yf59????0.295 ?f200x?a?by?82.5?5*(?0.295)?81.025
?y2f311y???1.555
?f2002标准差: ?y?y2?y2?1.2116
57 ?x?b?y?5?1.09?6 .标准差变异系数: ?6.058C????0.074767
X81.025成人组的平均身高为81.025cm,标准差为6.058cm,标准差系数为0.074767。 (2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。
xf2705026000???819.70(元); x乙??866.67(元) 6、解:x甲?f3330??甲=138.14(元); ?乙=124.05(元)
138.14124.05?16.85%; V乙=?14.31%
819.70866.67? V甲?V乙,所以乙单位职工工资差异程度小 V甲=第二章 统计量及其分布 习题 一、填空题
1、简单随机抽样样本均值X的方差取决于 样本量 和总体方差_,要使X的标准差降低到原来的50%,则样本容量需要扩大到原来的 4 倍。 2、设X1,X2,,X17是总体N(?,4)的样本,S2是样本方差,若P(S2?a)?0.01,则
222?0.995(17)?35.7, ?0.99(16)?32.0, ?0.995(16)?34.2)
a?__32。
2 (注:?0.99(17)?33.4,
3、若Xt(5),则X2服从_F(1,5)______分布。
4、已知F0.95(10,5)?4.74,则F0.05(5,10)等于____0.21_______。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 样本量 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 正态分布 。 四、计算题
1、从正态总体N(52,6.32)中随机抽取容量为36的样本,要求: (1)求样本均值x的分布;
(2)求x落在区间(50.8,53.8)内的概率;
(3)若要以99%的概率保证|x?52|?2,试问样本量至少应取多少?
这个简答题,我到时候发照片给你们吧!
第三章 参数估计 习题
一、填空题
1、无偏性、 有效性 和 一致性 是对估计量最基本的要求。
2、总体X~N(?,?2),(X1,X2,X3)是来自X的一个容量为3的样本,三个?的
11132111无偏估X1?X2?X3,X1?X2,X1?X2?X3计量中,最有效的一个是
33355236111X1?X2?X3。 3333、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为 (0.088,0.232)。
4、若总体X的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为 0.5 ,总体方差的矩估计值为 0.25 。 5、小样本,方差?2未知,总体均值的区间估计为 x?t四、计算题
1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米。请确定该苗圃中树苗平均高度的置信区间,置信水平95%。 1、解:x?z1??/2sn?62?1.96?8.264?62?2.01
?21?S。 n该苗圃中树苗平均高度的置信水平为95%的置信区间为(59.99,64.01)厘米。 第四章 假设检验
填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、
填空
1、在做假设检验时容易犯的两类错误是 拒真错误 和 纳伪错误 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 双侧检验 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 单侧检验
3、假设检验有两类错误,分别是 拒真错误也叫第一类错误,它是指原假设H0是 真实的,却由于样本缘故做出了 拒绝 H0的错误;和 纳伪错误 叫第二类错误,它是指原假设H0是 假 的, 却由于样本缘故做出 接受 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 显著性水平 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 小概率原理。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,在显著性水平α下,否定域为 下面有答案
7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为H0:t≥1000 H1:t<1000(用H0,H1表示)
8、一般在样本的容量被确定后,犯第一类错误的概率为?,犯第二类错误的概