C斯皮尔曼-布朗公式:r=2r/(1+r)
第五章 心理测量学知识
hhxxhh
4
r为一半分数的相关系数, r为测验在原长度时的信度估计值。 (2)同质性信度:A主要表
hh
xx
示测验内部所有题目间的一致性。
B库德-理查逊公式:K-R20和K-R21,只适用于是非题
4、评分者信度:(1)一般要求在成对的受过训练的评分者之间平均一致性达0.9以上。 (2)方法是随机抽取若干份测验卷,由两位评分者按评分标准分别,再根据每份试卷组成的两列分数计算相关系数。
(3)所有题目看起来好象测量同一特质,但相关很低,或为负相关时,则测验为异质的 (4)人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化
(5)不同的信度反应误差的不同来源 三、信度与测验的解释
r=0 极端情况 当r<0.70 测验不能用于对个人作出评价或预测,而且不能作团体比较;
xx
xx
0.70≤r<可用于团体比较 0.85
xx
r≥0.85 才能用来鉴别或预测个人成绩或作为 r=1 极端情况 信度系数r解释个人分数的意
xx
xx
义:1、估计真实分数的范围; 2、了解实得分数再测时可能的变化情形。
xx
测量标准误:SE= S1-r
x
xx
大约有95%的可能性真实在所得分数±1.96SE的范围内,或有5%的可能性落在范围之外。 置信区间:X-1.96SE<X≤X+1.96SE
T
比较不同测验分数的差异:@甲被试在韦氏成人智力测验中言语智商为102,操作智商为110,
已知两个分数都是以100为平均数,15为标准差的标准分数,假设言语测验和操作测验的分半信度分别为0.87和0.88,那么假被试的操作智商不显著高于言语智商。
四、影响信度的因素:1、标本特征:(1)样本团体异质性的影响:一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度
(2)样本团体平均能力水平的影响:对于不同水平的团体,题目难度会影响信度相关系数受样本是否异质性及样本团体平均能力水平的影响。
2、测验长度:(1)在一个测验中增加同质的题目,可以使信度提高。 (2)测验越长,测验的测题取样或内容取样就越有代表性。 (3)测验越长,被试的猜测因素影响就越小 (4)增加测验长度的效果应遵循报酬递减率原则
(5)测验过长,有时反而会引起被试的疲劳和反感而降低可靠性
@40题目的测验信度为0.80,欲将信度提高到0.9,则需增加60个题目。 3、测验难度:各类选择题平均难度为:(1)五择一测题,0.70; (2)四择一测题,0.74; (3)三择一测题,0.77; (4)是非题,0.85。
4、测验的时间间隔(1)以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界的影响也越大,信度系数便越低。 第四节 测验的效度
一、效度:是指所测量的与所要测量的心理特点之间的符合程度,或者简单地说是指一个心理测验的准确性。
5
第五章 心理测量学知识
(有效方差)与总方差的比率。效度定义公式:在一组测量中,与测量目标有关的真实方差
代表总方差代表有效方差,S2其中r2代表测量的效度系数,S2 目的(1)1、效度具有相对
XVxy
性:在评鉴测验时,必须考虑测验的 效度的性质: 功能(2) 连续性2、效度具有 、效度结果的有效性。3 信度是效度的必要而非充分条件;1)信度和效度的关系:( 效度是受信度制约的2)( 发行的《教育与心理测量之标准》一书中将效度分为三类二、效度的评估方法:按美国心理学会1974指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所测量行为领域的、内容效度:1 代表性取样。)专家判断法:请有关专家对测验题目与原定内容的符合性做出判断,看测1内容效度的评估方法:(
验的题目是否代表规定的内容。则测验具
有内容效度。因此内容效如果专家认为测验题目恰当地代表了所测内容, 逻辑效度。度又称 A定义好测验内容的总体范围专家判断法的步骤: B编制双向细目表制定评定量表来评估测验的整个效C 度, D由每位评分者在评定量表上做出判断 A计算两个评分者一致性。(2)统计分析法: B复本相关 再测法C )经验推测法(3 不是普遍适用的。内容效度的特性:A 内容效度有时间上的特定性。B在编制测验时,表面效度是一个必须考虑的特性。最高行为的测验要求有较高C 的表面效度 )也叫构思效度,或结构效度。(12、构想效度: )主要涉及的是心理学的理论概念问题(2 )指测验能够测量到理论上的构想或特质的程度(3 4)测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。( A用测验的内容效度可以作为构想效度的证据。构想效度的估计方法:1、对测验本身的分析法 B测验的内部一致性指标可以作为构想效度的证据分析被试者对题目的反应特点可以作为构想效度C 的证据相容效度:计算两种测验之间得分的相关,其中一种测验是待研A2、测验间相互比较法:究效度的,是一种是已有效度证据的成熟测验。但相者测量的是同一种心理特质,假如相关高,说明新测 验所测量的特质确实是老测验所反映的特质或行为。 区分效度:B 因素分析法:C 、效标效度的研究证明法3 =经验推测法)4、实验和观察法证实法(实验法=再测法;观察证实法 同时效度:是测验预测个体在某种情境下行为表现的有效性程度。分为:A3、效标效度(实证效度) B预测效度 效标必须能最有效地反映测验的目标。A一个好的效标必须具备的条件:效标测量本身必须有效。 B
效标必须具有较高的信度,稳定可靠。 效标是可以测量的,即可用数字和等级表示。C6
第五章 心理测量学知识
D效标测量的过程要是方法简单,节省实用。
效标效度的评估方法:1、相关法:相关法是求分数与效标资料间的相关,结果称为效度系数。 最常用的方法: A积差相关 B二列相关公式 C点二列相关公式
D贾斯朋多系列相关公式。
2、区分法:是检验测验分数能否有效地区分由效标所定义的团体的一种方法
3、命中率法:是指当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。 命中的情况是指:(1)预测成功而且实际也成功 (2)预测失败而且实际也失败 三、效度的功能
预测误差:1、效度系数的实际意义常常以决定系数来表示,如测验的效度是0.80,则测验的总
方差中数;2、r
yxy
64%的方差是测验分数的方差。有 S代表效标成绩的标准差2代表效度系数的平方,即决定系
是纵轴的截距,b是斜率的回归方程:X 其中Y是预测的效标分数,a预测效标分数:Y对
1-K)(预测效率指数:E=100
的大小说明使用测验比盲目猜测能减少多少误差。预测效率指数E,这表明由于该测验的使用,使得我们在估计被试的效标分数时,如一个测验的效度系数为0.80E=40 减少了40%的误差。 四、影响效度的因素:(一)测验本身的因素:1、测验材料必须对整个内容具有代表性。 2、测题设计时避免误差题型的使用。(如事非题) 3、测题难度适中,有区分度。 4、测验长度要恰当。 5、测题的排列按先易后难的顺序。 、主试的影响因素。(二)测验实施中的干扰因素:1 、被试的影响因素。2)团体越同质,分数分布范围越小,测验效1、样本团体的异质性:(1(三)样本团体的性质:度起低,团体越异质,分数分布 范围越大,测验效度越高、干涉变量:团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和2任何有关的特征,使得测验对于不同团体具有不同的 。预测能力,故测量学上称这些特征为干涉变量 找出干涉变量的方法(美国心理学家吉赛利):、用回归方程求得每个人的预测效标分数,将该分数与与实际效标分数相比1的绝对值很大,说明测验中可能存在干涉变DD较,获得差异分数,如果 量7
第五章 心理测量学知识
2、根据样本团体的组成分析,找出对照组,分别计算效度,从而找出干涉变量。
3、对于欲测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低两个亚团体,对于预测性高的团体,获得的测验效度会有所提高。
效标的性质:(1)使用皮尔逊积差相关系数的的前提条件是:假设两个变量的关系呈线性分布。 (2)效标测量本身的可靠性如何亦是值得考虑的一个问题,效标测量的可靠性即效标测量的信度。
第五节 项目分析:项目分析:1、定性分析:包括内容效度,题目编写的恰当性和有效性等。 2、定量分析:包括题目难度和区分度的分析。 一、项目的难度
难度:1、是指项目的难易程度。
2、难度的指标通常以通过率表示,即答对或通过该题的人数百分比来表示:
P=(R/N) ×100%,P代表难度,R代表通过的人数,N代表总人数,P值越大,难度越低 3、通俗性:在非能力测验中与难度类似的指标,
难度的计算(1)定义公式 P=(R/N) ×100%〖200学生,答对某项目120人,则该项目难度120/200=0.6〗
(2)二分法公式::P=(Ph+Pl)/2〖370名被试,高分低分组各100人,高分组70人答对1题,低分组40人答对1题,则1题难度(0.7+0.4)/2=0.55〗
(3)非二分公式::P=(X/X)X100%〖某题满分15,考生平均分9.6分,则该题难度9.6/15
平
max
=0.64〗
排除猜测对结果的影响的矫正公式:Cp=(KP-1)/(K-1),Cp为较正后通过率,P为实际通率,K为备选答案题目
难度水平的确定1、难度P值越接近0或1,越无法区分被试之间能力的差异, 2、P值越接近0.5,区别力越高
3、为了使测验具有更大区别力,应选择平均难度在0.50左右的试题比较合适 4、各题的难度在0.30-0.70之间。 5、
对于选择题,其难度应该大于概率水平,如是非题为0.75,四选一题为0.63左右
二、项目的区分度:项目的区分度也叫鉴别力,是指测验项目对被试的心理特性的区分能力。 鉴别指数的计算步骤: (1)按测验总分高低排列答 (2)确定高分组、低分组,每一组取答卷总数的27%, (3)分别计算高分组和低分组在该项目上的通过率或得分率 (4)按下列公式估计出项目的鉴别指数: D=Ph-PL,D为鉴别指数,
Ph为高分组在该项目上的通过率或得分率, PL低分组在该项目上的通过率或得分率
1965年美伊贝尔鉴别指数的标准:其中鉴别指数D在0.19以下,说明该项目差,必须淘汰。
鉴别指数项目评 0.4以很
0.30-0.39 良好,修改后会更佳 0.20-0.29 尚可,但需修改 0.19以下 差,必须淘汰
相关法: 1、点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量。 2、二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。 3、ф相关:两个变量都为二分称名变量时。
区分度与难度的关系: 1、较难的项目水平对高水平的被试者区分度高 2、中等难度的项目对中等水平的被试区分度高
3、项目的难度分布以常态为好,并平均P为0.50,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。 第六节 测验编制的一般程序
8
第五章 心理测量学知识
一、测验的目标分析:1、测验的对象:即施用团体。必须掌握施测者的:(1)年龄 (2)受教育水平 (3)社会经济水平 (4)阅读水平
2、测验的用途:(1)编制测验前应明确:①诊断 ②选拔 ③预测。
(2)测验用途分类:①显示性测验:A样本测验