心理测量与测验 期末复习整理
第一章 心理测量的历史
1.中国古代心理测量方法:观察法、访谈法、自然实验法 2.冯特1879年在莱比锡大学建立第一所心理实验室。
最先倡导测验运动的是优生学创始人高尔顿。他开创了个别差异心理学研究,并采用定量研究方法。 卡特尔1890年在《心理》杂志上发表的论文《心理测验与测量》,这是心理测量第一次出现在心理学文献上。 艾宾浩斯1885年发表《记忆》,开了用实验方法研究记忆的先河,使他成为第一位对记忆这种高级心理过程进行科学定量研究的心理学家。 比奈是发明智力测验常模量表的第一人。1905年,比奈与西蒙合作,编制世界上第一个智力测验——比奈-西蒙量表。 美国斯坦福大学的推孟教授1906年修订了斯坦福-比奈量表,首次采用智商(IQ)概念。 美国心理学家桑代克1904年出版《心理与社会测量导论》,是关于测验理论的第一部著作。 人格测验的先驱是克雷佩林,于1892年最早使用自有联想测验诊断精神病人。 3.心理测验的发展,主要受了发面影响:心理学理论的发展、统计学方法的进步。
第二章 心理测量概述
1、测量就是根据一定的法则用数字对事物加以确定。 2、测量的三要素:事物、数字、法则。
3、测量的两个要素:参照点、单位 (参照点是确定事物的量时计算的起点,参照点有两种,绝对零点和相对零点。“0°C”属于相对零点,并不意味着没有温度。//好的单位要有确定的意义(即对同一单位),还要有相等的价值。但心理、教育测量所用单位不等值) 4、量表:要测量某个事物,必须有一个定有参照点和单位的连续体,将要测量的每个事物放在这个连续体的适当位置上,看它距离参照点的远近,以此得到一个测量值,这个连续体就叫量表。
※ 根据测量的精确程度(测量单位的理想/不理想),量表分为四类:
(1)命名量表:只能按照事物的某种属性对其进行分类或分组。如性别(男、女)、学历、企业性质、职业、地区等。
(2)顺序量表:是对事物之间等级差别或顺序差别的一种测度。它不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。如: 1考试成绩:优、良、中、及格、不及格。 2教育水平:小学及以下、初中、高中、大学及以上。 3具有“>和<”、“=和≠”数学特性,但不能进行加、减、乘、除运算。
(3)等距量表:不仅能将事物分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少,表现为数值。如考试成绩百分制、温度等。
等距量表中没有绝对“零点”。“0”表示一个数值,即“0”水平,而不表示“没有”或“不存在”。如“0”度表示一种温度水平,并不是没有温度。
具有类别量表和顺序量表的数学特性外,其结果还可以进行“加、减”运算。 (4)比率量表:它具有上述三种尺度的全部特性外,还可以计算两个测度值之间的比值。既有绝对零点,又有相等单位。如长度米、重量千克、收入元等。
比率量表中“0”表示“没有”或“不存在”。
※ 等距量表只能进行加、减运算,而等比量表可进行加、减、乘、除运算。
5、心理测量a:根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
6、心理测验b:通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。a是b的一种工具,是根据一定法则对人的行为用数字加以确定的方法。 7、心理测量的性质:3个
间接性:无法直接测人的心理,只能测量人的外显行为,如通过对测验题目的反应来推断他的心理特质。
相对性:P28 客观性:实际上就是测量的标准化问题。标准化程度越高,其测量结果的客观性也越高。(补:测验的客观性包括测验的刺激、对反应的量化、对结果的推论是客观的)
8、心理测量的基本功能是测量个体间的差异或同一个体在不同场合下的反应。测验在实际工作中 a 和理论研究中 b 有着广泛的应用。a:选拔人才、人员安置、诊断、预测、评价、咨询 b:搜集资料、建立和检验假说、实验分组。
第三章 心理测量的误差 1、测量误差:指在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确或不一致的测量效应。
可分1.随机误差2.系统误差。1.指那些与测量目的无关的偶然因素引起的误差。既影响测验的一致性、准确性 2.指…引起的一种恒定而有规律的效应。不影响一致性,只影响准确性。
要想使测量准确可靠,就必须减少误差;而要控制误差,就必须了解误差的来源。同物理测量一样,心理测量误差主要来自:1测量工具,2测量对象,3测量过程。(1造成的误差主要来自测验的编制过程,其中项目取样的影响最大。2即被试本身引起的误差最复杂最难控制。3的误差最容易控制和检验。) 要想控制误差,就必须使测验标准化,即测验的编制、施测、评分、解释都必须标准化→控制导致误差的因素,减少误差,使测验分数更可信、有效。
2、测量理论一般分经典测量理论、概化理论和项目反应理论三大类。将以真分数为核心假设的测量理论及其方法体系,统称为经典测验理论(CTT),或真分数理论。~是最早实现数字形式化的测量理论。
真分数的操作定义:无数次测量结果的平均值。
CTT的基本思想:把任何一个测验成绩都看作是真分数和测量误差的和。即CTT假定,观察分数(X)与真分数(T)之间是一种线性关系,并且只相差一个测量误差(E).公式:X=T+E,这就是CTT数字模型。(注:此处误差指引起测量不一致的因素产生的效应,即指随机误差,不包括系统误差,后者不引起分数改变,因此包含在真值中。) 3、CTT不足、局限性:
⑴统计量的样本依赖性,抽样变动大⑵能力与难度量表的不一致性,测量误差大⑶信度估计的不准确性,复本编制难⑷测验结果拓宽的有限性,预测力缺乏⑸测量分数的测验依赖性,分数难比较。
第四章 心理测量的信度
1.信度:指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得测量结果的稳定性与一致性程度。(书上只是划线部分)在测量理论中,信度定义:一组测量分数的真变异数与总变异数(实得变异数)的比率,即 rXX = ST2
→
真值方差 SX2 → 观测值方差
2.信度作用:⑴…是测量过程中随机误差大小的反映(注:信度并不反映系统误差)⑵…可以帮助在不同测验分数之间进行比较⑶…可以用来解释个体测验分数的意义 3.
信度系 不同的信度反映测验误 备注 数 差的不同来源 误差来源 重测=稳定同一量表、同一组被试,两次测验,优:提供测量结果是否随时间而改变时间取样 信度 性系数 所得结果的一致性程度。 (跨时间) 的资料,可作预测受测者将来行为的依据 人的多数心理特征具有相对稳定性、缺:易受练习、记忆影响,前后两次内容取样 间隔一段时间,不会有很大变化。 施测间隔长短务必适宜 复本信=等值性两个平行测验测量同一批被试……局限:虽然比再测信度应用广泛许(连续施度 系数 等值、但题目不同、同一群体 (跨多,但1.受练习、记忆影响更大2.测:内容形式) 测量难度会由于重复而有所改变3.-) (间隔-:时间&内容-) 反映测验在内容上的等值性,系数大编制真正的等值测验困难重重 小反映两个复本题目的差别。 分半与复本指将一个测验分成对等两半后,所有误差来自题目本身,与时间因素无内容取样 信度很信度 相似 被试在这两半上所得分数的相关。同关;不适用于速度测验;分半方法多等条件下,测验越长,信度越高。 →同一测验会有多个分半信度值 =内部测验内部所有题目间的一致性 同质一致性所有题目看起来像测量同一特质,但样2.所研究行为的一致性。所研究性信系数 相关很低或负相关时,测验为异质 行为的同质性越高,项目间一致性越度 高。 评分定义:多个评随机抽取若干份测验卷,由两成对受过训练的评分者之间平均一评分者之者信分者给同一批位评分者按评分标准分别给度 致性达到0.90以上,评分才是客观间的差异 质性 题目内部一致性影响因素:1.内容取内容的异人的答卷评分分,然后根据每份测验卷的两的 的一致性程度 个分数计算相关 只能说在特定条件下,用于特定的团体,采用特定方法所得的信度系数是多少。即总述 信度总是与特定情境相关 4.影响信度的因素:…是测量过程中随机误差大小的反映。随机误差大,信度就低。所以引起随机误差的因素一般都影响信度。主要有:⑴被试因素⑵主试-⑶施测情境-⑷测量工具-⑸两次施测的间隔时间
5.提高信用的常见方法:⑴适当增加测验项目的长度⑵因素分析和鉴别力分析⑶弱势矫正⑷控制测验项目的难度⑸选取适当的被试群体,提高测验在各同质性较强的亚团体上的信度。