答:1)拟合回归方程 的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显著相关以上;3)找到全适的参数a,b使所确定的回归方程达到使实际的y值与对应的理论估计值yc的离差平方和为最小。 2)a的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示x=0时y常项。
参数b 称为回归系数,表示自变量增加一个单位时因变量y的平均增加值,回归系数b 正负号可以判断相关方向,当b>0时,表示正相关,当b<0表示负相关。
五、计算题
1、某企业生产一批零件,随机重复抽取400只做使用寿命试验。测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。(学习指导书P177第2题) 解:1)平均数的抽样平均误差:
?300????15小时 xn400
2)成数的抽样平均误差: p(1?p)25%*75&%?x???0.78% n 400
2、外贸公司出口一种食品, 规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下:
每包重量(克) 148-149 149-150 150-151 151-152 —— 包 数 10 20 50 20 100 要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求; (2)以同样的概率保证估计这批食品合格率范围。 解:
组中值 148.5 149.5 150.5 151.5 合计 100??f包数f 10 20 50 20 ?xfXf 1485 1990 7525 3030 (x?x)2f 32.4 12.8 2 28.8 76= ??f 15030= ?xf ?xf?15030?150.30(x?x)2f76?x?? ? ? ? f 100 (克) ? 0 .872 (克) 100?f ?0.872?x???0.0872?x?t?x?3?0.0872?0.26
n100 x??x?X?x??x
0.26?150.30?X?150.30?0.26
?(x?x)2f150.04?X?150.562)已知:n?100;n1?70;t?3
p?n170??100%?70%;?p?n100P(1?P)?n0.7(1?0.7)?4.580 ?p?t? p?3?4.58?13.74
p??p?P??p??p?13.74%?70%?P?70%?13.74%
56.26%?P?83.74% 答:1)以99.73%的概率估计这批食品平均每包重量的范围为150.04---150.56克,大于150克,所以平均重量是达到规格要求 2) 以99.73%的概率保证估计这批食品合格率范围为56.26%--83.74。
3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工? 解:1)分配数列 成绩 60以下 60——70 70——80 80——90 90—100 工人数(频数)f 3 6 15 12 4 各组企业数所占比重(频率)% 7.5 15 37.5 30 10 f?f合计 40 100 2)全体职工业务考试成绩的区间范围 成绩组中值 55 65 75 85 95 合计 ??f工人数f 3 6 15 12 4 40?xfXf 165 390 1125 1020 380 3080= (x?x)2f 1452 864 60 768 1296 4440=
????10.52?1.67xn40
??t??2?1.67?3.34xxxf?f
x ??x?X?x??x?77?3.34?X?77?3.34 .66?X?80.373
?xf?3080?77x??f40???(x?x)?f2f?444???(x?x)2f3)已知:?x2?13.34?x??1.67 (分)t = 2 22t2?222?10.542 n 2 ? 2 ? 160 (人) 2 ?1.67?x2
答:(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围73.66---80.3;(3)若其
它条件不变,将允许误差范围缩小一半,应抽取160名职工
4、采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。要求: (1)计算样本的抽样平均误差
(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(t=2) 解:已知:1)n?200;n1?195;
p(1?p)97.5(1?97.5)??1.1%n200 n1195p?? ?100%?97.5%;?p?n200
2)已知t=2 ?p?t?p?2?1.104%?2.2% ??P?p???97.5%?2.2%?P?97.5%?2.2%?p?pp
95.3%?P?99.7%答: 1)样本的抽样平均误差为1.1%
(2)以95.45%的概率保证程度对该产品的合格品率区间为95.3%--99.70% 5、某企业上半年产品产量与单位成本资料如下:
━━━━━┯━━━━━━━┯━━━━━━━━━━━━ 月 份 │产 量(千件)│ 单位成本(元)
─────┼───────┼─────────── 1 │ 2 │ 73 2 │ 3 │ 72 3 │ 4 │ 71 4 │ 3 │ 73 5 │ 4 │ 69 6 │ 5 │ 68
━━━━━┷━━━━━━━┷━━━━━━━━━━━ 要求:(1)计算相关系数,说明两个变量相关的密切程度。
(2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? (3)假定产量为6000件时,单位成本为多少元?
解:设产品产量为x与单位成本为y
月份 1 2 3 4 5 6 合计 产量(千件)单位成本(元/件) x2x y 2 3 4 3 4 5 21 73 72 71 73 69 68 4 9 16 9 16 25 x2y2y2 xy 146 216 284 219 276 340 5329 5184 5041 5329 4761 4624 2?x426 ?y79 ?x1)相关系数 n?xy??x?y6?1481?21?426?????0.9091222222 n?x?(?x)n?y?(?y)6?79?216?30268?4261
?xy?n?x?y1481?1/6?21?426 b????1.8128179?1/6?212222) ?x?n(?x)
?y?b?x?426/6?(?1.8128)?21/6?77.3637a?y?bx? nn30268 ?y2?xy1481 ???????? yc?a?bx?77.3637?1.8128xyc ?77.3637?1.8128x?77.3637?1.8128?6?66.4869x?6时,3) (元)
答:(1)相关系数为09091,说明两个变量相关的密切程度为高度负相关。 (2)回归方程为yc ?77.3637?1.8128x产量每增加1000件时,单位成本平均减少1.8128元 (3)假定产量为6000件时,单位成本为66.4869元
6、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: (x 代表人均收入,y 代表销售额) n=9
?x=546 ?y=260 ?x2=34362
?xy=16918
计算: (1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义;
(2)若2002年人均收为14000元,试推算该年商品销售额 。
1解:(1)
?xy?n?x?y16918?1/9?546?260 b???0.92462134362?1/9?54622 ?x?n(?x)
yx a?y?bx??b?260/9?0.9246?546/9??27.2035nn
yc?a?bx??27.2035?0.9246x
y 27? ?.19652) x=14000 ? .2035 ? 0 . 9246 x 27 . 2035 ? 0 . 9246 ? 14000 ? 12917 (万元) c ?
yc??27答:(1)建立以商品销售额为因变量的直线回归方程, .2035?0.9246x??回归系数的含义:当人均收入每增加1 元,商品销售额平均增加0.9246万元;
(2)若2002年人均收为14000元,该年商品销售额为12917.1965万元 。
7、某地区家计调查资料得到,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差为60元,支出对于收入的回归系数为0.8,
要求: (1)计算收入与支出的相关系数; (2)拟合支出对于收入的回归方程; (3)收入每增加1元,支出平均增加多少元。
解:1)已知: x?8800;y?6000;?x2?4500;?x?67.08;?y?60;b?0.8
b?x0.8?67.08????0.89
?y602)
a?y?bx?6000?0.8?8800??1040yc?a?bx??1040?0.8x
yc??1040?答:(1)收入与支出的相关系数为0.89; (2)支出对于收入的回归方程; 0.8x(3)收入每增加1元,支出平均增加0.8元
作业四(第8—9章)
《统计学原理》作业(四) (第八~第九章) 一、判断题
1、数量指标作为同度量因素,时期一般固定在基期( × )。
2、平均指数也是编制总指数的一种重要形式,有它的独立应用意义。( √ ) 3、因素分析内容包括相对数和平均数分析。( × )
4、发展水平就是动态数列中的每一项具体指标数值,它只能表现为绝对数。( × )
5、若将2000~2005年末国有企业固定资产净值按时间先后顺序排列,此种动态数列称为时点数列。 ( √ ) 6、定基发展速度等于相应各个环比发展速度的连乘积,所以定基增长速度也等于相应各个环比增长速度乘积。(×) 7、发展速度是以相对数形式表示的速度分析指标,增长量是以绝对数形式表示的速度分析指标。(√ ) 二、单项选择题
1、统计指数划分为个体指数和总指数的依据是 ( A ) 。
A、反映的对象范围不同 B、指标性质不同 C、采用的基期不同 D、编制指数的方法不同 2、数量指标指数和质量指标指数的划分依据是 ( A )。
A指数化指标的性质不同 B所反映的对象范围不同 C所比较的现象特征不同 D编制指数的方法不同 3、编制总指数的两种形式是( B )。
A、数量指标指数和质量指标指数 B、综合指数和平均数指数 C、算术平均数指数和调和平均数指数 D、定基指数和环比指数 4、销售价格综合指数
?qp?qp11110表示( C )。
A、综合反映多种商品销售量变动程度 B、综合反映多种商品销售额变动程度 C、报告期销售的商品,其价格综合变动的程度 D、基期销售的商品,其价格综合变动程度
q?5、在销售量综合指数
?qp00p0中,
?qp??q100p0表示 ( B )。
A、商品价格变动引起销售额变动的绝对额
B、价格不变的情况下,销售量变动引起销售额变动的绝对额
C、价格不变的情况下,销售量变动的绝对额 D、销售量和价格变动引起销售额变动的绝对额 6、加权算术平均数指数变形为综合指数时,其特定的权数是( D )。
A、q1p1 B、q0p1 C、q1p0 D、q0p0
7、加权调和平均数指数变形为综合指数时,其特定的权数是( A )。 A、q1p1 B、q0p1 C、q1p0 D、q0p0
8、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长 ( B )。
A、10% B、7.1% C、7% D、11% 9、根据时期数列计算序时平均数应采用( C )。
A、几何平均法 B、加权算术平均法 C、简单算术平均法 D、首末折半法 10、间隔相等的时点数列计算序时平均数应采用( D )。
A、几何平均法 B、加权算术平均法 C、简单算术平均法 D、首末折半法
11、已知某企业1月、2月、3月、4月的平均职工人数分别为190人、195人、193人和201人。则该企业一季度的平均职工人数的计算方法为( B )。
A、(190+195+193+201)/4 B、 (190+195+193)/3
C、﹛(190/2)+195+193+(201/2)﹜/(4-1) D、 ﹛(190/2)+195+193+(201/2)﹜/4 12、说明现象在较长时期内发展的总速度的指标是( C )。
A、环比发展速度 B、平均发展速度 C、定基发展速度 D、定基增长速度 三、多项选择题
1、指数的作用是 ( ABE )。
A、综合反映复杂现象总体数量上的变动情况 B、分析现象总体变动中受各个因素变动的影响 C、反映现象总体各单位变量分布的集中趋势 D、反映现象总体的总规模水平 E、利用指数数列分析现象的发展趋势 2、下列属于质量指标指数的是( CDE ) 。
A、 商品零售量指数 B、商品零售额指数
C、商品零售价格指数 D、职工劳动生产率指数 E、单位成本指数 3、下列属于数量指标指数的有( ACD )。
A、工业总产值指数 B、劳动生产率指数C、职工人数指数 D产品总成本指数 E产品单位成本指数 4、编制总指数的方法有( AB ) 。
A、综合指数 B、平均指数 C、质量指标指数 D、数量指标指数 E、平均指标指数 5、加权算术平均数指数是一种( BCD )。
A、综合指数 B、总指数 C、平均指数 D、个体指数加权平均数 E、质量指标指数 6、下面哪几项是时期数列( BC ) 。
A、我国近几年来的耕地总面积 B、我国历年新增人口数
C、我国历年图书出版量 D、我国历年黄金储备 E、某地区国有企业历年资金利税率 7、 计算平均发展水平可采用的公式有( ABCD )。
11a?a?a???an123a22A、 B、
nn?1?a?a3a?ana1?a2f1?2f2???n?1fn?1aa222C、 D、c? E、nn a0bf?8、计算平均发展速度可采用的公式有( ABC )。 A、n?x B、 naana C、 nR D、 E、c? a0nb?