第五讲 心理学研究的信、效度 长江大学教育科学系 严磊
研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。
一 心理测量的信度和效度 射击打靶 1.真分数假设
假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。
假设二:误差是完全随机的。这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。 假设三:观察分数是真分数与误差分数的和。 2.测量的信度
信度(reliability)是指测量结果的稳定性和可靠性程度。
重测信度、复本信度、分半信度、评分者一致性信度
3.测量的效度
1
一 研究的信度 二 研究的信度 1.研究信度的概念
研究的信度指研究所的事实、数据的一致性和稳定性程度。一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。
根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。稳定性指研究结果跨时间、跨情境的一致性。同质性指研究工具本身各项目内容的一致性。
举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。
2.判定研究信度的方法 重复运用重复测量、重复研究的方法,在相同条件下用相同方重测信度 法 法进行两次以上的研究,然后考察它们是否取得相同结果。 相似通过比较同质或类似研究工作、或同类研究的结果的一致复本信度 法 性程度,来判断研究工具或研究结果的可靠性。 独立即两个或两个以上的研究者同时对一组被试的行为、操作评分者一评判水平等各种表现进行独立判断或评价,然后比较它们之间致信度 法 的一致性,此法可以判定研究者之间一致性的程度。 举例:
相似法:将某一特定研究的结果与国内外同类研究的结果进行比较,是判定研究的信度的常用方法。新编智力量表与韦克斯勒智力量表的比较。
独立评定法:采用观察法、问卷法、访谈法、测验法、实验法等方法进行的研究中,日益注重观察者、评定者和计分者之间的信度。攻击性行为,助人行为。
二 研究的效度
2
研究中的自变量与因变量之间的关系属于内部效度问题。 在变量之间判定因果关系,这是统计结论效度的问题。 因果关系的构思性质,涉及到研究的构思效度。 变量之间关系的普遍意义,则是研究的外部效度问题。 可见研究效度在研究的设计、实施与评价等活动中的关键意义。
(1)所研究的两个或多个变量之间是否存在一定的关系?尤其是,研究的自变量与因变量之间是否有关系?
(2)如果所研究的变量之间存在一定关系,这种关系是否因果关系? (3)如果变量之间可能存在因果关系,它所包含的具体的因果关系构思是什么?
(4)如果变量之间的因果关系构思明确,这种因果关系对于其他的成员、背景条件和时间的普遍意义如何?
以上四类问题相互关联,都涉及到研究的有效性,即研究的效度。1957年,社会心理学家坎贝尔,第一次明确的提出研究的效度问题。研究的自变量与因变量之间的关系属于内部效度的问题;在变量之间判断因果关系,这是统计结论效度的问题;因果关系的构思性质,涉及到研究的构思效度;变量之间关系的普遍意义,则是研究的外部效度问题。在一项心理学研究中,一般都设计研究的理论构思、设计、实施和统计推论环节。
1.构思效度 皮亚杰认知发展理论
(1)构思效度的定义和条件:研究的构思效度涉及到研究方案和测量指标的理论构思及其操作化的问题,即理论构思及其转换的有效性。为了使研究具有较高的构思效度:
步骤 要求研究的理论构思结构严谨、层次分明,形成某种构思网络,并对研究中的自变量和因变量作出严格的定义(抽象定义)。 举例 研究自我意识发展,理论上将自我意识分为自我认识、自我体验和自我控制三方面,然后再将自我认识区分为对生理自我的认识、对心理我自我的认识和自我控制三方面。 针对研究构思的特点,给予明确的操作定义,研究“发散思维”和“集中思维”的关系,并确定相应的测量指标。 给变量下明确的操作定义,并指定相应的、客观的测量指标。 首先要明确这两个概念、变量的内涵。 3
消除或控制影响构思效度的其他因素。 首先,其次,
(2)影响构思效度的因素 A 对于研究构思的解释。
B 单一操作的偏向:心理特征具有系统与层次的特点,因此,心理学研究的构思一般都具有多维性,当研究中只用一种尺度和样本来表示这种多为复杂构思时,就会产生--。
C 单一方法的偏向。理论构思的多维性,要求一种复合的测量。比如分别用访谈法、问题卷法和观察法研究群体心理结构,就容易取得比较理想的结果。
D 实验者期望和被试猜测。E 构思水平之间的混淆。F 不同实验处理的交互作用。
2.内部效度 气温与犯罪率的关系
(1)内部效度:效度常常是指一项测验测到所要测量的东西或达到某种目的的程度,也有人叫作真实性。研究的内部效度是指在研究的自变量和因变量之间存在关系的明确程度。
研究中的自变量与因变量之间是否真正存在关系? 因变量的变化是否一定是否自变量的变化引起的?
(2)内部效度的条件:首先是由于正确的选择了研究的自变量和因变量;内部效度的另一个重要条件是周密的实验和研究设计。
(3)影响内部效度的因素:
A 历史因素,包括前摄历史因素(被试固有或习得的差异,如性别、态度、个性)和后摄历史因素(研究测量之外可能影响自变量和因变量之间差异的因素)。
举例:检验某项工作丰富化方案对于提高职工积极性的作用研究。在方案试行期间,一部分职工增加了工资,因此混淆了工作丰富化方案对于工作积极性的影响。
B 选择因素。 C 未随机取样和随机分配。 D 成熟因素。E研究被试的更换和淘汰。 F测量和测试手段。 G 统计回归效应。H实验处理和程序。 I多种研究条件和因素的交互作用。
上述8种主要因素,都是在研究中应特别注意控制的,最有效的途径是采用随机化程序。在心理学研究中具有较高内部效度的设计之一,是著名的“所罗门
4
四组设计”。
3.外部效度
(1)外部效度:是指实验和研究的结果能够一般化和普遍化到其他的总体、变量条件、时间和背景中去的程度,即研究结果和实验效果的普遍性和可应用性。一般认为,内部效度是外部效度的必要条件,但不是充分条件。
总体效度:指研究结果能够使用于被时所来自的总体的程度和能力。 生态效度:指研究结果能够概括化和适用于其他研究条件和情境的程度能力。
(2)外部效度的条件:外部效度的要求是使研究能够代表真实世界的情况。这种多重实验手段,是获得外部效度、提高研究结果可应用性的重要条件。
(3)影响外部效度的因素:
A总体效度,这是指研究结果对于研究者最终感兴趣的总体的普遍意义。B 自变量和因变量的定义和测试方式。C对测量的敏感化。D 多重实验的干扰E 特异性效应。F 试验者效应。G 研究与实际情景的相似性。H 被试选择和实验处理的交互作用。
4.统计结论效度
(1)统计结论效度的定义和条件:统计结论效度是有关决定实验处理效应的数据分析程序的效度检验,它并不涉及系统性偏向的来源的问题,而是研究差误变异源和如何适当运用统计显著性检验的问题。研究的统计结论效度取决于两个方面的条件:
一是数据的质量,数据分析程度的效度是以数据的质量作为基础的。二是统计检验的假设,数据分析中所采用的各种统计方法,都有其明确的统计检验假设。
举例:当研究样本较小时,由于样本成分与测量的波动性较大,具有不稳定性,此时若依赖于统计显著性水平做结论是不可靠的。在这种情况下,就应该运用功效分析,看看一定的样本大小、变异程度和α水平上能够检验出多大的效应。
大学新生SCL-90中三因子分析讨论,27742,1200,性别比率对统计结果的影响。
(2)影响统计结论效度的因素: A 统计功效低。B 违反统计检验的假设。C 测量信度低。D 实验处理实施的可靠性。E 研究背景中随机的无关因素。F 被试的随机异质性。
四种研究效度之间的关
5
研究的内部效度、外部效度、统计结论效度和构思效度,是相互联系和相互影响的。统计结论效度实际上是内部效度的特例,它们都涉及研究本身的因果关系和统计检验的可靠性。构思效度则与外部效度有一致之处,即它们的基本点都在于作出概括性和结果的普遍性。构思效度与外部效度之间的主要差异是:前者所指的目标总体较难具体确定,而后者则往往要求一般化到实际上存在的特定总体、背景和时间等条件。影响研究效度的因素多种多样,但大致可以分成四类 (1)与被试有关的因素;
(2)测量与具体研究方法方面的因素; (3)研究构思与程序设计因素; (4)实验条件与不同因素的交互作用。
6
第五讲 心理学研究的信度和效度



