有关SAS统计检验的模型

由天下分享时间：2024/11/20 10:34:10 加入收藏我要投稿点赞

第4章 SAS基本统计分析功能

教学要求： ? ?

了解几种假设检验、线性回归、方差分析、拟合优度检验、列联表检验的原理背景掌握SAS语言进行均值假设检验

? 掌握SAS语言进行线性回归与方差分析

? 掌握SAS语言进行拟合优度检验与列联表检验

引言：前面介绍SAS的编程来进行初步的统计分析、报表、绘图。本章我们讲述用SAS进行统计检验、线性回归、方差分析、拟合优度检验和列联表检验。

4.1 假设检验

4.1.1 正态性检验（univariate过程）

1.背景原理：正态分布是一种最常见的分布，也是一种最重要的连续型分布，它以均值为对称轴呈对称的钟型分布。检验的零假设Ho：数据资料服从正态分布。备择假设H1：数据资料不服从正态分布。

当样本量W?n≤2000

2时，应选用

2shapiro-wilk检验法，检验统计量为

?a(Xi(x?i?1)?Xi)/?(Xi?X)

W值越接近于1，P值越大，表明资料越服从正态分布，反之W越偏离1，P值越小，表明资料越不服从正态分布。

当

D?m1?i?nn>2000

a?fxXni时，应用

?(Fx)fKolmogorov-smirnov 检验法，检验统计量为

)X(n?1)?F,xi? ()(D值越大，P值越小，表明资料越不服从正态分布，反之，D值越小，P值越大，表明资料越服从正态分

布。

2.举例

在proc univariate语句中加上normal选项可以进行正态性检验。【例1】检验数据集sasuser.gpa中变量gpa是否服从正态分布?

输出结果中正态检验部分为：

分析：检验的零假设为Ho：gpa变量服从正态分布，其中shapiro-wilk检验的统计量为w=0.966294，检验的p值小于0.0001，当然小于给定的显著性水平α=0.05，故应拒绝零假设，即有95%把握认为gpa非正态。

说明：使用SAS软件中的“分析家”，打开数据集后，利用菜单“统计”→ “描述性统计”→“分布”，除了可以检验变量是否服从正态分布外，还可以检验对数正态、指数和韦布尔分布。

4.1.2 单样本均值的T检验（univariate过程）

1.原理背景

设总体X~N(μ,σ2)，μ、σ2未知，给定检验水平α，对常数μ0要检验

H0:???0?H1:???0

设X1,X2,…Xn为X的简单随机样本，在H0成立时有

t?X??0S/n~t(n?1)

其中S为变量的标准差，n为样本量。检验的拒绝域为：W??t?t?(n?1)? 补充P值检验法：

p/2

α/2

t0 t1-α/2(n-1)

分位数t1-α/2(n-1)满足 Pr{|t|> t1-α/2(n-1)}= α

设由已经得到的样本具体计算得到的t值为t0，若|t0|> t1-α/2(n-1)，则拒绝H0，否则接受H0。对

大量重复试验而言，t是随机变量，且服从t分布t (n-1)。当|t0|< t1-α/2(n-1)时，有

Pr{|t|> t0}>Pr{|t|> t1-α/2(n-1)}= α

反之亦然。令p= Pr{|t|> t0},则|t0|α

所以，假设检验的p值方法为：对给定的显著水平α，当p<α时，拒绝H0，当p>α时，接受H0

此例介绍的p值检验法对其他统计检验也使用，一般说来，检验的p值是检验统计量取其观测值及

更极端值得概率，统计软件对假设检验都会计算检验的p值。

2.应用举例

在SAS中用univariate过程默认进行某个变量均值为零（μ0=0）的t检验，若要检验μ=μ0，则需进行变量代换。

例2：检验数据集sasuser.class中学生的身高均值与63有无显著性差异。

程序：

输出结果为：

分析:先作正态性检验。Ho：变量y服从正态分布，其中shapiro-wilk检验的统计量为w=0.979083，检验的p值=0.9312>α=0.05，故应接受零假设，即有95%把握认为变量y正态。

故采用单样本均值T检验。对变量y的零假设为Ho: μ0=0。由输出结果知T检验的统计量t=-0.5638，双边检验的p值为0.5798>α=0.05，故接受原假设，即有95%的把握接受学生的平均身高为63。说明：

当变量服从正态分布时，优先采用t检验，当变量服从非正态时，可以采用符号秩（signed Rank）检验，符号检验（sign）的检验功效较差，一般不常用它。

对同一问题不同的检验方法一般是一致的，但有时也有互相矛盾的结果。

使用SAS软件中的分析家，打开数据集后，利用菜单“统计”→ “假设检验”→“均值的单样本T检验”可以进行双边和单边检验。

4.1.3 两独立样本均值检验（TTest过程、npar1way过程）

1.原理背景

假设两组样本来自两个独立总体，需要检验两个总体的均值或中心位置是否一样。如果两个总体都服

从正态分布，则可使用两独立样本均值的T检验。有关公式如下：

设两个样本的均值为X1,X2，方差为S1,S2，观测量为n1,n2。两个样本方差相等与不相等时使用的检验统计量是不一样的，所以应该先对方差的齐性进行检验。

? 方差齐性检验的零假设为Ｈ0：两个独立样本的来自方差相等的总体，即?12??22，检验统计量为

F?Max(S1,S2)Min(S1,S2)?F(n1?1,n2?1)

? 方差齐时，检验两样本的均值是否相同的零假设为H0：两个独立样本的来自均值相等的总体，即

?1??2，检验统计量为t?ScX1?X21n1?1n2?t(n1?n2?2)

其中Sc??

(n1?1)S1?(n2?1)S2n1?n2?2?1??222为合并方差。

方差不齐时，检验两样本的均值是否相同，用校正t检验。检验零假设为H0：两个独立样本的来自均值相等的总体，即

，检验统计量为

t?X1?X2S1n1?S2n2?t(n1?n2?2)

2.Ttest过程

格式：PROC TTEST [选项]; CLASS 变量名； VAR 变量名； BY 变量名； RUN; 说明：

（1）proc语句中的“选项”有： Data=数据集，指明要分析的数据集；

Cochran 要求在方差不齐时用Cochran和Cox法计算t’检验的概率水平；

（2）Class语句中的变量必须是一个两水平的分组变量，系统会把数据集中的观测按这个变量的两个水平分成比较的两组。

（3）by 语句和var语句作用同前。

【例3】某克山病区测得11例克山病人与13名健康人的血磷值（mmol/L）如表，据此判断该地急性克山病人与健康人的血磷值是否相同？患者组健康组程序为：

0.84 0.54

1.05 0.64

1.2 0.64

1.39 0.76

1.53 0.81

1.67 1.8 1.16 1.2

1.87 1.34

2.07 1.35

2.11

1.48 1.58 1.87

输出为：

有关SAS统计检验的模型

第4章SAS基本统计分析功能教学要求：??了解几种假设检验、线性回归、方差分析、拟合优度检验、列联表检验的原理背景掌握SAS语言进行均值假设检验?掌握SAS语言进行线性回归与方差分析?掌握SAS语言进行拟合优度检验与列联表检验引言：前面介绍SAS的编程来进行初步的统计分析、报表、绘图。本章我们讲述用

推荐度：

点击下载文档文档为doc格式

有关SAS统计检验的模型

有关SAS统计检验的模型

相关推荐文档

精选图文

热门排序

推荐文章

热门标签

相关文章列表