应用数理统计
第一次大作业
学号: 姓名: ? 班级: B11班
2015年12月
民航客运量的多元线性回归分析
摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996
年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显着性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的结果达到预期,证明该模型建立是较为成功的。
关键词:多元线性回归,逐步回归法,民航客运量
0.符号说明
变量 民用航空客运量 国民生产总值 铁路客运量 民航航线里程 入境过夜旅游人数 城镇居民人均可支配收入
符号 Y X1 X2 X3 X4 X5
1.引言
随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安排班机数量。科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。采用逐步回归法建立线性模型,选出较优的线性回归模型。
2.数据的统计与分析
本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2014》以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量因素的数据,分析它们之间的联系。整理如表1所示。
表1:
年份 民航客运量(万人) 5555 5630 5755 6094 6722 7524 8594 8759 12123 13827 15968 18576 19251 23052 26769 29316 31896 35397 国内生产总值(亿元) 78973 473104 铁路客运量(万人) 94797 93308 95085 100164 105073 105155 105606 97260 111764 115583 125656 135670 146193 152451 168145 146192 189337 210597 民航航线入境过夜城镇居民里程(万旅游人数可支配收公里) (万人) 入(元) 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 模型的建立
以民航客运量y为因变量,以上5种影响因素为自变量Xi ,构建回归方程: 其中为常数项,为误差项。
先观察自变量与因变量的关系,用SPSS得到各个自变量与因变量的散点图:
图1 民航客运量与国内生产总值散点图
图2 民航客运量与铁路客运量散点图