.-
应用回归分析
课程设计报告
课 程: 应用回归分析 题 目: 人均可支配收入的分析 年 级: 11金统 专 业: 金融统计 学 号: 姓 名: 指导教师:
徐州师范大学 数学科学学院
.-
基于多元线性回归模型对我国城镇居民家
庭人均可支配收入的分析
摘要:收入分配和消费结构都是国民经济的重要课题居民消费的主要来源
是居民收入而消费又是拉动经济增长的重要因素。本文将通过多远统计分析方法对我国各地区城镇居民收入的现状进行分析。通过分析找出我国城镇居民收入特点及其中存在的不足。城镇居民可支配收入是检验我国社会主义现代化进程的一个标准。本文根据我国城镇居民家庭人均可支配收入为研究对象,选取可能影响我国城镇居民家庭人均可支配收入的城乡居民储蓄存款年底余额、城乡居民储蓄存款年增加额、国民总收入、职工基本就业情况、城镇居民家庭恩格尔系数(%)5个因素,运用多元线性回归分析建立模型,先运用普通最小二乘估计求回归系数再对方程进行异方差、自相关、和多重共线性诊断,用迭代法消除了自变量之间的自相关。对于多重共线性问题,先是用逐步回归和剔除变量的方法,最终转变为用方差扩大因子法城乡居民储蓄存款年增加额剔除城镇居民家庭恩格尔系数(%)
?解决多重共线性,建立最终回归方程
y??5305.470?0.012x2?0.039x3?0.108x4
标准化回归方程
**y?0.031x2?0.863x3?0.108x* 4?以其探究最后进入回归方程的几个变量在影响城镇居民收入孰轻孰重,达到学习与生活结合的效果。分析出影响城镇居民收入的主要原因,并对模型联系实际进行分析,以供国家进行决策做参考。
关键词:多元线性回归 异方差 自相关 多重共线性 逐步回归 方差扩
大因子
(一)引言:
改革开放以来我国的国民经济增长迅速居民的收入水平也大幅提高但居
.-
民收入分配差距也在不断扩大。2008年的金融危机为我国带来的后遗症还在继续影响着居民正常生活物价上涨和通货膨胀的压力仍然困扰着老百姓收入和消费支出体系的健康发展至关重要。消费是拉动国民经济增长的一架重要马车收入又是决定居民消费的最主要因素。我国人口基数大消费群体众多但由于居民收入分配差距大直接影响到居民消费需求的降低从而影响经济增长。而且随着中国特色的市场经济体制的建立各种收入分配问题也愈发明显。因此鉴于篇幅限制本文就只针对城镇居民的收入进行分析。中国网北京7月13日讯 国家统计局今日发布数据显示,我国城乡居民收入稳定增长,农村居民收入增长较快。上半年,城镇居民家庭人均总收入12076元。其中,城镇居民人均可支配收入11041元,同比增长13.2%,扣除价格因素,实际增长7.6%。在城镇居民家庭人均总收入中,工资性收入同比名义增长11.5%,转移性收入增长9.9%,经营净收入增长31.2%,财产性收入增长20.4%。农村居民人均现金收入3706元,同比增长20.4%,扣除价格因素,实际增长13.7%。其中,工资性收入同比名义增长20.1%,家庭经营收入增长21.0%,财产性收入增长7.5%,转移性收入增长23.2%。财政部副部眨楼继伟就调整城镇中低收入居民收 入政策符记者问中说:“由于城乡居民收入增长趋缓,居民对未来支出增加的预期增强, 消费意愿减弱,导致消费需求不旺。针对有效需求不足这一突出问题,党中央利国务院 决定, 积极调整收入分配政策,通过提高国有企业下岗职工等低收入者的生活保障水平 和增加机关事业单位职工工资等措施,逐步改变居民收入预期下降、支出预期I:列、高 收入者消费意愿不强、低收入者消费能力不足的状况,旨在刺激消费需求,健进国民经 济持续快速健康发展。”
下面通过统计数据对我国城镇居民家庭人均可支配收入的总体现状和发展态势进行分析了解我国居民收入分配情况。
(二)问题重述
以1991年-2011年的城镇居民家庭人均可支配收入y为因变量,选取城乡居民储蓄存款年底余额x1、城乡居民储蓄存款年增加额x2、国民总收入x3、职工基本就业情况x4、城镇居民家庭恩格尔系数(%)x5为自变量。
(三)模型分析与建立
①多元线性回归模型
1.多元线性回归模型的一般形式
设随机变量y与一般变量x1,x2,?,xp 的线性回归模型为
y??0??1x1??2x2????pxp?? (4.1)
其中,?0,?1,?,?p是p?1个未知参数,?0称为回归常数,?1,?,?p称为回归系
.-
数。y称为被解释变量(因变量),x1,x2,?,xp是p个可以精确测量并控制的一般变量,称为解释变量(自变量)。 ?是随机误差,与一元线性回归一样,对随机误差项我们常假定
?E(?)?0 ? (4.2) 2?var(?)??
称
E(y)??0??1x1??2x2????pxp?? (4.3) 为理论回归方程。
对一个实际问题,如果我们获得n组观测数据
(x1i,xi2?,xip;yi),(i?1,2,?,n),则线性回归模型(4.1)式可表示为
?y1??0??1x11??2x12????px1p??1?y????x??x????x???20121222p2p2 (4.4) ?????yn??0??1xn1??2xn2????pxnp??n写成矩阵形式为
y?X??? (4.5)
其中
?1?y1????1?y2? y??? X?????????y??1?n??(4.6)
x11x21?xn1x12?xn2???x22???0???0?x1p????????1???1?x2p? ????2? ????2? ?????????????xnp???????n???p?? X是一个n?(p?1)阶矩阵,称为回归设计矩阵或资料矩阵。 2.多元线性回归模型的基本假定
为了方便地进行模型的参数估计,对回归方程(4.4)式有如下一些基本假定:
(1)解释变量x1,x2,?,xp是确定性变量,不是随机变量,且要求
rank(X)?p?1?n。这里的rank(X)?p?1?n,表明设计矩阵X中的自变量列
.-
之间不相关,样本量的个数应大于解释变量的个数,X是一满秩矩阵。
(2)随机误差项具有零均值和等方差,即
?E(?i)?0,i?1,2,?,n? (4.7) ??2,i?j?cov(?,?)?,i,j?1,2,?,n?ij??0,i?j?E(?i)?0, 这个假定常称为高斯—马尔柯夫条件。假设观测值没有系统错误,
随机误差项?i的平均值为0。随机误差项?i的协方差为0,表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。
(3)正态分布的假定条件为
??i~N(0,?2),i?1,2,?,n (4.8) ???1,?2,?,?n相互独立 对于多元线性回归的矩阵模型(4.5)式, 这个条件便可表示为
?~N(0,?2In) (4.9)
由上述假定和多元正态分布的性质可知,随机变量y服从n维正态分布,回归模型(4.5)式的期望向量
E(y)?X? (4.10)
var(y)??2In (4.11)
因此 y~N(X?,?2In) (4.12) ②回归参数的普通最小二乘估计
线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各个参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则,在该准则下得到的回归参数的估计称为回归参数的普通最小二乘估计。
对于(4.5)式表示的回归模型y?X???,所谓最小二乘法,就是寻找参
?,??,??,?,??,使离差平方和数?0,?1,?2,?,?p的估计值?012pQ(?0,?1,?2,?,?p)??(yi??0??1xi1??2xi2????pxip)2达到极小,即寻找
i?1n