《心理统计学》重要知识点
第二章统计图表
简单次数分布表的编制:
Excel数据透视表
Excel数据透视表
Excel图表向导的柱形图来绘制
列联表(交叉表):两个类别变量或等级变量的交叉次数分布, 直方图(histogram ):直观描述连续变量分组次数分布情况,可用
散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别
(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;
第三章集中量数
集中趋势和离中趋势是数据分布的两个基本特征。
集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 集中量数:描述数据分布集中趋势的统计量数。 离中趋势:是指数据分布中数据分散的程度。
差异量数:描述数据分布离中趋势(离散程度)的统计量数 常用的集中量数有:算术平均数、众数( 1算术平均数(简称平均数,
算术平均数的重要特性: (1)
一组数据的离均差(离差)总和为 0,即7 (X. -x) =0 MO )、中位数(Md)
x.
M、X、Y ): X -
n
Excel统计函数 AVERAGE
(2) 如果变量X的平均数为X,将变量X按照公式|y二a bx转换为Y变量后,
那么,变量Y的平均数Y =a FX
2 .中位数(median , Md):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据 出现次数各
占50%。
3. 众数(mode, MO): 一组数据中出现次数最多的数据。
第1页共9页
6.调和平均数(harmonic mean , M H ): 一组数值倒数的平均数的倒数。
MH
J 1 Xi
1
) n 、、
Xi
Excel统计函数HARMEAN
X2
(1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。 (2 )用于描述不同能力水平个体的平均学习速度、平均工作效率。 7.几何平均数(geometric mean , Mg )是指n个观察值连乘积的 (1) 一组数据中少部分偏大 数
据的集中趋势。
n次方根
(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映
Excel统计函数GEOMEAN
计算平均学习进步速度、平均发展速度(平均发展倍数) ,即环比的几何平均
数。
(2)用于
M g =?』仝x冬X乞…X( X1> x2、…、xn为各个时间段的成果数据)
X1 X2 X3 Xn 二 ,X1
平均增长率:
Mg -
1
第四章差异量数
差异量数:描述一组数据离散程度(离中趋势)的统计量数。差异量数较大,说明数据分布得比 较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。
差异量数还能反映平均数对一组数据的代表性。差异量数越小,平均数的代表性越好;差异量数 越大,平均数的代表性越差。
常用的差异量数是标准差、方差、差异系数
x标准差s: s =
(Xi -X)2 Excel统计函数STDEVP (给定样本总体的标准偏差)
x
标准差Sn-1 :
x
(Xi -X)2
n -1
Excel统计函数STDEV (给定样本的标准偏差)
方差s2: s2
2
(Xi -X)2
Excel统计函数VARP (给定样本总体的方差)
x
(Xi -X)2
n -1
Sn1
Excel统计函数VAR (给定样本的方差)
:CV =鱼
差异系数(又称变异系数、离散系数、相对标准差)
X
(1) 用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还 是体重
离散程度大? (2)
较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:
儿童和13组岁儿童的体重离散程度,哪个较大?
标准差的重要特性: 如果变量X的标准差为SX ,将变量X按照公式|y = a ? bx转换为Y变量后, 那么,变
量 Y的标准差SY = bSx
用于比7岁组
第2页共9页
相对位置量数:反映个体(数据)在团体中相对位置的统计量数。 主要有标准分数及其线性转换分数( 1 ?标准分数的计算与应用: Z -
T =10Z
50 , CEEB =100Z
Z分数、T分数)、百分等级(PR)、正态化标准分数等。
Xi -X S
500
J
或:Z亠
Xi -k G
Z分数的特点:Z分数的平均数为 0,即Z =0,标准差为1,即匚Z =1
T分数的平均数 7=50,标准差为 6=10
CEEB分数的平均数 = ___________ ?,标准差= ____________ ? (1) 可用于比较个体各方面水平高低(横向比较,个体内差异评价)
。
(2) 对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。 (3) 可用于对个体或样组某方面水平进行前后比较(纵向比较)
了,还是没有变化。
2 ?原始分数X的百分等级的含义与计算
根据简单次数分布表计算:
,判断其水平是提高了,退 步
PRX 二
0.5 f Fb N
100
X -Lb
Fb
100
根据分组次数分布表计算:
PRX 二
第五章相关关系
相关关系的描述方法
(1) 相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。
可用Excel图表向导中的
“XY散点图”绘制。
(2) 双向次数分布表 (交叉表、列联表):适用于描述两个等级变量 (或称名变量、类别变量 ) 之间
的关系。可用 Excel数据透视表编制列联表)。 (3) 相关系数(相关关系的特征值)。 相关系数:描述两个变量相关关系的统计量数,在
-1.00~1.00之间取值,绝对值越大,越接近
0,说明两个变量的关系程度越低。
1,
说明两个变量之间的关系程度越密切;绝对值越小,越接近 常用的相关系数: 1. 积差相关:r = (Xi ~X)(Yin SxSy
~y) Excel 统计函数 CORREL
;
适用条件:(1) X、Y两个变量都是连续性变量(等距数据或比率数据)
(2) X、Y两个变量总体上为正态分布或接近正态分布。
2 ?斯皮尔曼等级相关: 是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。
(1 )等级积差相关法(名次积差相关法) 。
. (
R
R
X _X
R
)(
R
Y _RY
)
Excel 统计函数 CORREL
NSRX SRY
公式中的RX和RY是分别代表两变量中每个数据在变量中的名次。
第3页共9页
(2)等级差数法(名次差数法)
如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算: 等级差数法简化公式:
「
R
6R2 N(N2 -1)
T
如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算:
等级差数法校正公式:
x
2 2 2
T
y
Sc -
D ——2 — 2
—二,Yx、龙y计算方法参见教材
125页
3 ?肯德尔 W系数(肯德尔和谐系数) :描述多个名次变量一致性程度的统计量数。
适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名 次)的一致性程度,在心理测量与教育评价中称为
评分信度。例如,5位阅卷老师对10篇论文评分
(或等第、符号),可先将其转换
排名的一致性。如果评价者给出的不是个体的水平名次,而是分数 成名次,然后再计算 W系数。
、校正公式:W
N
3
R
2 丿
R)2
2
1
捫
4.
2
(N3
1 2 3
K2(N3 -N) -' T
-------- 、T「卫
12 12
_N)
点二歹U相关 (point-biserialcorrelation ):
公式中: n为每个名次变量中相同名次的数目。
用于描述一列续性变量和一列真正二分变量
(或非正态二分变量)之间的相关。
真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。
rpb
Xp -Xq
s
t
pq Excel 统计函数 CORREL
5. 二列相关(biserial correlation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个 正态连
续变量之间的相关。或者说,用于描述一正态二分变量与一正态连续变量之间的相关。
例如,将测验或考试分数区分为及格和不 人为二分变量?是指由连续变量转换而来的二分变量,
及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、 未录取。 正
态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。
rb :
X p —Xq pq
st
y
p、q两部分的纵线的高度。
y为将正态分布面积画分为
y的计算方法:利用 Excel统计函数计算 标准正态分布区间点函数
NORMSINV( p值) T区间点Z值
正态分布函数 NORMDIST(区间点Z值,0,1,0 ) F 值的概率密度 y 6.①相关(①系数)
|ad —bc|
「:.:?:
寸(a +b)(c + d)(a +c)(b +d)
用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。
注①相关计算公式是由皮尔逊积差相关计算公式转换来的。 因此,如果两列二分变量转换 意:
为0、1 (或1、2)的数值变量时,可以用 Excel统计函数 CORREL计算①系数。
第4页共9页
第六章概率分布
1正态分布的特征(见教材)
2. Excel软件中正态分布函数和正态分布区间点函数的应用
?标准正态分布函数 NORMSDIST的应用:
(1) (2)
P(Z V 1.96)= ? =NORMSDIST(1.96)=0.9750
P(Z > 1.96)= ? =1-NORMSDIST(1.96)=0.0250
(3) P(-1.5 V X V 2.5)= ? =NORMSDIST(2.5)-NORMSDIST(-1.5)=O.927O
?正态分布函数 NORMDIST的应用
例如:已知某次测验的分数呈正态分布,平均分为 (1) (2)
75分,标准差为10分,试计算:
低于80分的考生占多大比例, P(X V 80分)=? 80分以上的考生占多大比例, P(X > 80分)=?
(3) 80分以上,低于 90分的考生占多大比例, P(80< X V 90)= ? P(X V 80 分):“ =NORMDIST (79.5,75,10,1) P(X 为0 分):“ =1-NORMDIST (79.5,75,10,1)
” =0.6736
” =0.3264
” =0.2528
P(80 WXV 90) :“ =NORMDIST (89.5,75,10,1)- NORMDIST (79.5,75,10,1)
?标准正态分布区间点函数
根据给定的向上累积概率
NORMSINV的应用
P(Z a=? a=NORMSINV( p值) 例如:P(Z 1.28)=0.10 ?正态分布区间点函数 NORMINV的应用