百度文库 - 让每个人平等地提升自我
研究生《生物统计学》课程 第六讲 相关分析与回归分析
主要内容: 一、线性相关分析
1、 两变量相关分析 2、 多变量相关分析 二、回归分析
1、 一元线性回归分析 2、 多元线性回归分析 3、 曲线回归分析
一、线性相关分析:用于研究变量之间密切程度的统计方法 使用SPSS中Correlate模块
相关系数是以数值的方式精确地反映两个变量之间线性关系的强弱程度,利用相关系数进行变量间线性关系的分析,即相关分析。包括两个步骤:①计算样本的相关系数r;②对两样本来自的总体是否存在显著的线性关系进行推断。
Pearson简单相关系数:计算连续变量或等间距测度的变量之间的相关系数(系统默认); Kendall τ相关系数:等级相关系数,只能在两变量均属于有序分类时使用; Spearman等级相关系数:度量定序型变量间的线性相关关系,非参数相关分析。
(一)两变量相关分析
1、案例分析:有人研究黏虫孵化历期平均温度(x, ℃ )与历期天数(y, d)之间的关系,求出平均温度与历期天数的线性相关系数 x,平均温度(℃) y, 历期天数(d) 1
百度文库 - 让每个人平等地提升自我
(1) 建立数据文件,在Variable Vew中定义变量“平均温度”、“历期天数”,小数位
数均为1,输入数据;
(2) 相关分析:[Analyze]=>[Correlate]=>[Bivariate](两变量相关分析),打开[Bivariate
Correlation]主对话,将“平均温度”、“历期天数”引进[Variables](变量)框; (3) 在[Correlation Coefficients]复选框中选择“Pearson”(系统默认),选中[Flag
significant correlations],将对显著的相关系数加“*”标志(若为1个星号*,表示P<,差异显著;若为2个星号**,表示P<,差异极显著);
(4) 单击[Options]进入“选项”对话框,选择[Means and standard deviations]计算各变
量的平均值与标准差,[Continue]返回; (5) 单击[OK],运行相关分析。 SPSS分析结果
Correlations平均温度Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N平均温度1历期天数-.968**.00088-.968**1.00088历期天数**. Correlation is significant at the 0.01 level (2-tailed).
(相关系数肩标**表示在概率为(双侧)水平上具有显著性意义)
2、练习:研究小白鼠体内丧失水分与温度变化之间的关系,随机抽取一群小白鼠,在一系列温度下,规定时间内测定这群小白鼠散发出来的水分,得到如下数据,试分析温度与散发出来的水分之间的相关性是否显著。
X(温度,℃) Y(水分蒸发量,g)
(二)多个变量间相关分析:
1、案例:测定13块某品种水稻每亩的穗数(x1,万)、每穗粒数(x2)、每亩稻谷产量(y,kg),结果如下表,试进行相关分析。
编号 1 2 3 4 2
15 20 25 30 35 穗数x1 粒数x2 产量y 504 480 526 511 百度文库 - 让每个人平等地提升自我
5 6 7 8 9 10 11 12 13
549 552 496 473 537 515 502 498 523 操作与两变量间相关分析基本相同,将“穗数x1”、“粒数x2”、“产量y”引进[Variables](变量)框
SPSS相关分析结果如下:
Correlations穗数x1Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N穗数x1113-.719**.00613.627*.02213粒数x2-.719**.00613113.013.96613产量y.627*.02213.013.96613113粒数x2产量y**. Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed).
(结果表明:穗数与粒数之间存在极显著的线性负相关关系,穗数与产量之间存在显著的正相关关系。)
二、回归分析:用一个或多个变量去估计另一个变量,SPSS中”Regression”模块 (一)一元线性回归
1、案例分析:有人研究黏虫孵化历期平均温度(x, ℃ )与历期天数(y, d)之间的关系,求出平均温度与历期天数的线性回归方程。 x,平均温度(℃) y, 历期天数(d)
(1) 建立数据文件,在Variable Vew中定义变量“平均温度”、“历期天数”,小数位
数均为1,输入数据;
3