数据分析期末试题及答案
数据分析期末试题及答案
一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解:
1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系
上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出
表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系
1 / 20
数据分析期末试题及答案
上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。
上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系
。
3上图是以疫苗接种率(x3)的三次方(x3)为横轴,地区平均寿命(y)为纵轴的散点图,
由图可知,他们之间呈正线性关系
所以可以采用如下的线性回归方法分析。
2 / 20
数据分析期末试题及答案
2.线性回归
先用强行进入的方式建立如下线性方程
设Y=β0+β1*(Xi1)+β2*Xi2+β3*Xi3+εi i=1.2……24
其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差
模型汇总b 标准 估计的误模型 1 R .952a R 方 .907 调整 R 方 .891 差 3.332 a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y 上表是线性回归模型下的拟合优度结果,由上表知,R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。
建立总体性的假设检验
提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表
Anovab 模型 1 回归 残差 总计 平方和 1937.704 199.796 2137.500 df 3 18 21 均方 645.901 11.100 F 58.190 Sig. .000a a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。
3 / 20