好文档 - 专业文书写作范文服务资料分享网站

数据分析期末试题与答案

天下 分享 时间: 加入收藏 我要投稿 点赞

数据分析期末试题及答案

一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解:

1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系

上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出

表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。

上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系

3上图是以疫苗接种率(x3)的三次方(x3)为横轴,地区平均寿命(y)为纵轴的散点图,

由图可知,他们之间呈正线性关系

所以可以采用如下的线性回归方法分析。

2.线性回归

先用强行进入的方式建立如下线性方程

设Y=β0+β1*(Xi1)+β2*Xi2+β3*Xi3+εi i=1.2……24

其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差

模型汇总 标准 估计的误模型 1 R .952 abR 方 .907 调整 R 方 .891 差 3.332 a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y 上表是线性回归模型下的拟合优度结果,由上表知,R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。

建立总体性的假设检验

提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表

Anova 模型 1 回归 残差 总计 平方和 1937.704 199.796 2137.500 df 3 18 21 均方 645.901 11.100 F 58.190 Sig. .000 ab a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

做独立性的假设检验得出参数估计表

系数 非标准化系数 模型 1 (常量) x1 x2 x3 a. 因变量: y B 33.014 .072 .169 .178 标准 误差 3.137 .015 .040 .049 标准系数 试用版 t 10.523 4.865 4.245 3.654 Sig. .000 .000 .000 .002 a .404 .431 .339 上表是有关参数估计的信息,同样是上面的检验假设,H0:β1=β2=β3=0: H1:β1、β2、β3不全为零 由表知,

β1=33.014,β1=0.072,β2=0.169,β3=0.178,以β1=0.072为例,表示当成人识字率(x2),一岁儿童疫苗接种率(x3)不变时,,人均GDP(x1)每增加一个单位,平均寿命(y)就增加0.072个单位。

基于以上结果得出年平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有显著性的线性关系有回归方程 Y=33.014+0.072*X1+ 0.169*X2+ 0.178*X3

β1、β2、β3对应得p值分别为0.000,0.000,0.002,对应的概率p值都小于0.05,表示它们的单独性的假设检验没通过,即该模型是最优的,所以不用采用逐步回归的方式分析。

对原始数据进行残差分析 未标准化的残差RES_1 -7.53964 -3.57019 -3.42221 -2.89835 -2.30455 -2.17263 -2.05862 -1.37142 -1.17048 -.43890

-.17260 -.03190 .94655 1.42896 1.61252 1.61590 2.10139 3.01856 3.02571 3.49808 4.60737 5.29645

以X1为横轴,RES_1为纵轴画出如下散点图

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

同理可以得出RES_1与X2、X3的散点图,

数据分析期末试题与答案

数据分析期末试题及答案一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分)解:1.通过分别绘制地区平均寿命(y)、按购买力计算的人
推荐度:
点击下载文档文档为doc格式
3lrxi2ze421wxgu8k8be9y6ym8c7oz00mu8
领取福利

微信扫码领取福利

微信扫码分享