数据分析方法及软件应用课程作业
一、第4题方差分析
1.1 建立数据文件
由题意可知,在同一浓度和温度下各做两次实验,将每一次的实验结果看作一个样本量,共3?4?2=24个样本量。
(1) 在“变量视图”下,名称分别输入“factor1”、“factor1”、“result”,类型设为“数值”,小数均为“0”,标签分别为“浓度”、“温度”、“收率”,factor1的值“1=A1,2=A2,3=A3”,factor2的值“1=B1,2=B2,3=B3,4=B4”,对齐选择“居中”。
(2) 在“数据视图”下,根据表中数据输入对应的数据。
数据文件如图1所示,其中“factor1”表示浓度,“factor2”表示温度,“result”表示收率。三种不同浓度分别用1、2、3表示,四种不同温度分别用1、2、3、4表示。
图1.1 SPSS数据文件格式
1.2基本思路
(1) 设“浓度对收率的影响不显著”为零假设H0,利用单因素方差分析,对该假设进行判定。
(2) 设“它们间的交互作用对收率没有显著影响”分别依次为假设H0,则可以通过多因素方差分析工具,利用得出的结果即能证明假设H0是否成立。 1.3 操作步骤
(1)单因素的方差分析操作
①分析—比较均值—单因素;因变量列表:收率;因子:浓度;
②两两比较:选中“LSD”复选框,定义用LSD法进行多重比较检验;显著性水平:0.05,单击“继续”;
③选项:选中“方差齐次性检验”,单击“继续”; ④单击“确定”。
(2)有交互作用的两因素方差分析操作
1
数据分析方法及软件应用课程作业
①分析—一般线性模型—单变量;因变量:收率;固定因子:温度、浓度; ②绘制。水平轴:factor1,选择浓度作为均值曲线的横坐标,单图:factor2,选择温度作为曲线的分组变量;单击添加—继续。
③选项。显示均值:factor1,定义估计因素1的均值;显著性水平:0.05;单击“继续”;
④单击“确定”。 1.4结果分析
(1)“浓度对收率有无显著影响”结果分析 执行上述操作后,生成下表。
表1.1 方差齐性检验
收率 Levene统计量 .352 df1 2 df2 21 显著性 .708 表1中Levene统计量的取值为0.352,Sig.的值为0.708,大于0.05,所以认为各组的方差齐次。
表1.2 单因素方差分析
收率 组间 组内 总数 平方和 39.083 80.875 119.958 df 2 21 23 均方 19.542 3.851 F 5.074 显著性 .016 从表2可以看出,观测变量收率的总离差平方和为119.58;如果仅考虑浓度单因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,它们的方差分别为19.542、3.851,相除所得的F统计量的观测值为5.074,对应的概率P值为0.016,小于显著性水平0.05,则应拒绝原假设,认为不同浓度对收率产生了显著影响,它对收率的影响效应不全为0。
2
数据分析方法及软件应用课程作业
表1.3 多重比较
因变量: 收率 LSD (I) 浓度 (J) 浓度 A2 A3 A1 A3 A1 A2 均值差 (I-J) 2.500* -.375 -2.500* -2.875* .375 2.875* 标准误 .981 .981 .981 .981 .981 .981 显著性 .019 .706 .019 .008 .706 .008 95% 置信区间 下限 .46 -2.42 -4.54 -4.92 -1.67 .83 上限 4.54 1.67 -.46 -.83 2.42 4.92 A1 A2 A3 *. 均值差的显著性水平为 0.05。 表3是各种浓度之间显著性差异两两比较的结果。从表3可以看出,浓度A2同其他任意两种浓度比较,其Sig.值都小于0.05,所以认为浓度A2与其他浓度在收率上有显著差异。而其他两种浓度,可以认为其浓度的不同对收率的影响不大。
(2)“浓度、温度及其相互作用对收率的影响”结果分析 执行上述操作后,生成下表。
表1.4 两因素方差分析表
因变量: 收率 源 校正模型 截距 factor1 factor2 factor1 * factor2 误差 总计 校正的总计 III 型平方和 70.458a 2667.042 39.083 13.792 17.583 49.500 2787.000 119.958 df 11 1 2 3 6 12 24 23 均方 6.405 2667.042 19.542 4.597 2.931 4.125 F 1.553 646.556 4.737 1.114 .710 Sig. .230 .000 .030 .382 .648 a. R 方 = .587(调整 R 方 = .209) 表4为两因素方差分析表,表中第一行“校正模型”代表对方差分析模型的检验,Sig值为0.23>0.05,说明模型不适用。观测变量的总方差119.958,它被分解为五个部分,分别由浓度不同引起的变差39.083,由温度差异引起的变差
3
数据分析方法及软件应用课程作业
13.792,由浓度和温度的交互作用引起的变差17.583,由随机因素引起的变差为49.500。这些变差除以各自的自由度后,得到各自的均方,并可计算出F统计量的观测值和对应的概率p值。Ffactor1、Ffactor2、Ffactor1,factor2的概率p值分别为0、0.382、0.648。由于Ffactor1的概率p值小于显著性水平0.05,则应拒绝零假设,认为不同浓度对收率有显著影响。而Ffactor2、Ffactor1,factor2的概率p值均大于0.05,因此不应拒绝原假设,可以认为不同温度对收率的影响没有显著差异,浓度和温度的交互作用对收率的影响也不显著。表5代表浓度在各水平下的均值、标准误均值及95%的置信区间。
表1.5 浓度的均值
因变量: 收率 浓度 A1 A2 A3 均值 11.250 8.750 11.625 标准误差 .718 .718 .718 95% 置信区间 下限 9.685 7.185 10.060 上限 12.815 10.315 13.190
图1.2 两因素交互影响的均值图
上图为两因素交互影响的均值图,横坐标代表浓度,纵坐标代表收率均值,且按温度绘制不同的折线。从图形上看,这些折线近似平行,可以认为两因素的交互作用不显著。
4
数据分析方法及软件应用课程作业
1.5 结论
综上,不同浓度对收率有显著影响,而不同温度对收率的影响没有显著差异,浓度和温度的交互作用对收率的影响也不显著。
二、第9题回归分析4
2.1 基本思路
本例中被解释变量为课题总数X5,解释变量为投入人年数X2、投入科研事业费X4、论文数X7、获奖数X8。建立多元回归模型,利用回归方程的统计检验对建立的多元回归模型进行检验,首先对解释变量采取强行进入策略,分析他们之间的线性关系以及多重共线性;然后对解释变量采用向前筛选策略,做方差齐性和残差的自相关性检验。 2.2 操作步骤
(1) 分析—回归—线性;因变量:课题总数X5;自变量:投入人年数X2、投入科研事业费X4、论文数X7、获奖数X8;方法:进入;
(2) 统计量:选中回归系数“估计”、模型拟合度、共线性诊断、残差Durbin-Watson;
(3) 单击“确定”,生成表2.1、表2.2、表2.3、表2.4; (4) 同步骤(1);
(5) 点击“绘制”,X坐标为标准化预测值ZPRED,Y坐标为DRESID,在标准化残差图中选“正态概率图”,点击“继续”按钮,进行残差均值和方差齐性检验;点击“保存”中选择保存标准化预测值、标准化残差;
(6) 菜单—分析—相关—双变量,在变量框选择标准化残差、标准化预测值—相关系数—Spearman;
(7) 点击“确定”按钮。 2.3 结果分析
表2.1 模型汇总
b
模型 1 R .968a R 方 .937 调整 R 方 .927 标准估计的误差 226.5820 Durbin-Watson 1.776 a. 预测变量: (常量), 获奖数, 投入科研事业费(百元), 论文数, 投入人年数。 b. 因变量: 课题总数
5