3.标准分数
(1)定义
标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数
离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。
Z?X?Xs
(2)性质
①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量 ②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零 ③原始数据的Z分数的标准差为1
④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布
(3)优点
①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较 ②可加性——不同性质的原始数据具有相同的参照点,因此可相加 ③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级 ④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样
(4)应用
①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低 ②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置
③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数(如韦氏成人智力量表) (五)相关量数
由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系。相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论。
相关系数:两列变量间相关程度的数字表现形式
作为样本的统计量用r表示,作为总体参数一般用ρ表示。 正相关:两列变量变动方向相同
负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相
6
反的变动
零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化 1.积差相关
也就是Pearson相关。
(1)前提
①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立
②两列变量各自总体的分布都是正态的,至少接近正态 ③两个相关的变量是连续变量,也即两列数据都是测量数据 ④两列变量之间的关系应是直线性的
(2)公式
SPSSXSSYr????2xy2???X2XYXN??X?Y
2Nx??y????2??Y???Y?N2r也就等于X和Y共同变化的程度除以X和Y各自变化的程度。 2.等级相关
也就是Spearman相关
(1)适用范围
①当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据 ②当研究考察的变量为非线性数据时
(2)公式
将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可。
3.肯德尔等级相关
(1)肯德尔W系数
也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。
7
W??112Ri?K22??3Ri?N2
?N?N?Ri代表评价对象获得的K个等级之和 N代表等级评定的对象的树木 K代表等级评定者的数目
(2)肯德尔U系数#
其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较
8U???r?Kij2?rij?N(n?1)?K(K?1)?1
rij为对偶比较记录表中i>j格中的择优分数 4.点二列相关与二列相关
(1)点二列相关
适用于一列数据为等距正态变量,另一列为离散型二分变量。
rpb?Xp?Xqst?pq
Xp是与二分称名变量的一个值对应的连续变量的平均数
Xq是与二分称名变量的另一个值对应的连续变量的平均数
p与q是二分称名变量两个值各自所占的比率 st是连续变量的标准差
(2)二列相关
适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。
rb?Xp?Xqst?pqy
8
y为标准正态曲线中p值对应的高度,查正态分布表能得到 5.Ф相关
适用于两个变量都是只有两个点值或只表示某些质的属性。
r??ad?bc?a?b??a?c??b?d??c?d?
其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据
二、推断统计
推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体。进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体。 (一)推断统计的数学基础
1.概率
概率:表明随即时间出现可能性大小的客观指标
概率的定义包含以下两种,当观测次数够多时他们是相等的。
后验概率:对随机事件进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p
先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数 2.正态分布
当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说。
(1)特点
①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值
②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少 ③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交
9
④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定
(2)用法
①依据Z分数求概率,即已知标准分数求面积 ②从概率求Z分数,即从面积求标准分数值
③已知概率或Z值,求概率密度,即正态曲线的高 3.二项分布
二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布
二项分布的均值为??pn 方差公式为?2?npq
标准差的公式为??
4.抽样原理与抽样方法
npq (1)抽样原理
抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。
(2)抽样方法 ①简单随机取样法 ②系统随机取样法 ③分层随机取样法 ④多段随机取样法 5.抽样分布
样本分布:样本统计量的分布,是统计推论的重要依据
(1)正态分布及渐近正态分布
样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论。
10