一、前言国内生产总值与第一产业增加值
的回归分析
姓名:XX 学号:XXX
班级:数学与应用数学XX
国内生产总值(Gross Domestic Product,简称GDP)是指按市场价格计算
的一个国家或地区所有常住单位在一定时期内生产活动最终产品和劳务的价值,是目前用于反映一个国家或地区的经济增长的最重要指标,也是最重要的宏观经济统计指标之一,它是人们了解和把握一个国家(或地区)的宏观经济运行状况的有效工具,是制定经济政策的重要依据,也能够多方面地满足人民生活的需要,提供广阔的就业门路。 由第一产业、第二产业、第三产业组成,第一产业是指提供生产资料的产业,包括农业、林业、牧业、副业和渔业等直接以自然物为对象的生产部门。第二产业是指加工产业,利用基本的生产资料进行加工并出售,包括制造业、采掘业、建筑业和公共工程、上下水道、煤气、卫生部门。第三产业又称服务业,它是指第一、第二产业以外的其他行业,第三产业行业广泛,包括交通运输业、通讯业、商业、餐饮业、金融保险业、行政、家庭服务等非物质生产部门。而我国是一个农业大国,农业作为我国的第一产业,始终是国民经济不可动摇的基础,农业不仅为市场创造巨大需求和提供生产要素,而且为市场提供重要产品。大量的农产品既要满足国内市场,也要出口到国外,成为创汇和对外贸易的主渠道。因此,我们有必要研究和分析国内生产总值与第一产业增加值的关系,通过研究、分析得出结论,为我们今后的决策和行为提供理论基础,确保第一产业的发展。
二、数据的收集与录用
本文选取数据为1987—2011年25年国内生产总值和第一产业增加值,数据均来源于国家统计局网站中国统计年鉴2011.见下表
表1、1987—2011年第一产业增加值和国内生产总值
单位:亿元
年份 1987 1988 1989 1990 1991 1992 第一产业增加值X 3233.04 3,865.36 4,265.92 5,062.00 5,342.20 5,866.60 国内生产总值Y 12058.62 15,042.82 16,992.32 18,667.82 21,781.50 26,923.48 年份 2000 2001 2002 2003 2004 2005 第一产业增加值X 14,944.72 15,781.27 16,537.02 17,381.72 21,412.73 22,420.00 国内生产总值Y 99,214.55 109,655.17 120,332.69 135,822.76 159,878.34 184,937.37 1993 1994 1995 1996 1997 1998 1999 6,963.76 9,572.69 12,135.81 14,015.39 14,441.89 14,441.89 14,770.03 35,333.92 48,197.86 60,793.73 71,176.59 78,973.03 84,402.28 89,677.05 2006 2007 2008 2009 2010 2011 22,420.00 28,627.00 33,702.00 35,226.00 40,533.60 47,486.21 216,314.43 265,810.31 314,045.43 340,902.81 401,512.80 473,104.05 三、模型的建立
3.1 理论分析
国内生产总值由第一产业、第二产业、第三产业组成,当第一产业增加值增加时,国内生产总值也会随之增加。由表1数据可以看出,从1987年到2011年,我国第一产业增加值是逐年增加的,我国国内生产总值是随着第一产增加值的增大而增大。我们可以初步判断,国内生产总值与第一产业增加值是成正比关系的。为了更好地了解它们两者之间的关系,故依据1987年到2011年的国内生产总值与第一产业增加值的数据作出其散点图,如下:
500,000.00国内生产总值国内生产总值与第一产业增加值的散点图 10,000.0020,000.0030,000.0040,000.0050,000.00系列1400,000.00300,000.00200,000.00100,000.000.000.00 第一产业增加值图1、国内生产总值与第一产业增加值的散点图
由图1,可以看出国内生产总值与第一产业增加值是成线性关系的,当第一产业增加值增加时,国内生产总值也会随之增加。虽然国内生产总值还会受其他因素影响,但是本文主要是研究国内生产总值与第一产业增加值的关系,所以可建立一个一元线性回归模型。 3.2 模型设定
建立回归模型如下:
Yi??0??1Xi??i
其中,各变量所代表的含义为:Yi—国内生产总值,Xi—第一产业增加值。
各参数所代表的含义为:?0—常数项,?1—当第一产业增加值增加一个单位时,国内生产总值增加的单位数,?i—随机干扰项。
四.参数估计(OLS法)
在线性回归模型中,对参数进行估计的最普遍方法就是最小二乘法(OLS法),利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。我们通过利用最小二乘法的公式可对?1、?0两个参数进行估计,其中n=25,利用附件1中数据,可计算出结果如下:
?1???n?XiYi?(?Xi)(?Yi)n?Xi?(?Xi)22?10.7446?0?Y??1X??48938.467????求得一元线性回归预测模型为:Yi?—48938.467?10.7446Xi
五、模型的检验
5 .1 经济意义检验
国内生产总值包含了第一产业、第二产业和第三产业。一般认为,当第一产业增加值增加时,国内生产总值也会随之增加,因此,第一产业增加值对国内生产总值的影响为正的。
在回归模型中,第一产业增加值的斜率系数符号为正的,即第一产业增加值每增加一个单位,国内生产总值增加10.7446个单位,显示实证结果与上述理论预期一致。该系数符合经济意义,可以顺利通过经济意义检验。 5 .2 统计检验 5.2.1 拟合优度检验
拟合优度检验主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。R的取值范围是[0,1]。R的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R的值越接近0,说明回归直线对观测值的拟合程度越差。利用附件1中数据可计算出
?R2??12?x?y22ii?0.982由R2?0.982>0.8,接近1,回归直线对观测值的拟合程度比较好。 5.2.2 显著性检验
通过参数估计量的t检验对回归方程进行显著性检验,利用附件1中的数据计算?、 S?、 S?;
?0?1?2
??2?e?2in?2?2y??2i???12?x2in?2?313234933S???0??Xn?xi2i2?6283.20241S???1??22?xi?0.3015H0:?0?0,H1:?0?0
2t1??0??0S??0??-48938.467??7.7896283.20241在??0.05时,t?(23)?2.069,因为t?7.789?2.069,所以在95%的置信度下拒绝原假设,说明截距项在回归方程显著不为零。
H0:?1?0,H1:?1?0
10.7446?35.637S0.3015 ?
t2???1?1??1?在??0.05时,t?(23)?2.069,因为t?35.637?2.069,所以在95%的置信
2度下拒绝原假设,说明X变量显著地影响Y变量。
下面来计算?0、?1的置信区间,在??0.05时,t?(23)?2.069,
2?0的置信区间为: ? 0 - t ? S ? ? ? 0 ? t ? S ,计算得:? 61938.412??0??35938.5220 ?
?2???0?2?0??1的置信区间为: ? 1 - t ?S ? ? 1 ? ? 1 ? t ? S ,计算得: 10.1208??1?11.36842??1?2?1?
六、模型的预测(检验)