《教育测量与评价》期末考试指导(带答案)

由天下分享时间：2025/1/22 6:21:06 加入收藏我要投稿点赞

《教育测量与评价》期末考试指导（带答案）

二、复习重点内容

第一章教育测量与评价的学科发展

1. 测量的含义

所谓测量，就是根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程测量的要素

测量的量具、测量的单位和测量的参照点，是测量的三个基本要素或三个基本条件。 2. 教育测量和教育评价

教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统收集资料信息，对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。

3.“行为目标评价模式”和“当代教育评价之父”

桑代克的论著《精神与社会测量导论》一书标志着教育测量理论的诞生。泰勒在1940年的“八年研究”报告书中，首次提出“教育评价”的概念，被称为“当代教育评价之父”。他认为：教育评价在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程，并提出“行为目标评价模式”。

第二章教育测量与评价的类型和功能

1. 教育测量与评价的类型

（1）按测评在教学中运用的时机分类：形成性测量与评价、诊断性测量与评价、终结性测量与评价。（2）按解释测评结果时的参照点分类：常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。

（3）按测量与评价的内容分类：智力测量与评价、能力倾向测量与评价、成就测量与评价、人格测量与评价。

（4）按照测量与评价被试行为表现的性质分类：最佳行为测量与评价、典型行为测量与评价。

（5）其它分类：按测量对象可分为个别测量与评价和团体测量与评价；按测验材料可分为文字测验和非文字测验；按量具的标准化程度可分为标准化测验和非标准化测验。

标准化测验是指由测量专家严格按照测验编制程序而编成的一种测验。

第三章教育测量与评价的质量特性

1. 衡量测验质量的四个指标

从教育测量的理论上来讲，一个良好的测验应该具备恰当的难度和区分度，具备较高的信度和效度，也就是说，测验的信度、效度、难度和区分度是衡量测验质量的基本指标。其中，前两个指标主要是对整个测验而言，后来两个指标主要是对测量的项目而言。

信度(reliability) 简单地说就是测量结果的可信程度，指的是测量结果的稳定性程度，记为rxx。具体地说，测验的信度是指同一组学生用同一测验实施两次后所得分数的一致性，或者同一组学生经过一次测验后，用另一个同质的测验再测一次，这两次测验所得分数的一致性。估算测验的信度有三种方法：重测信度、复本信度、同质性信度。

效度是指测量结果的准确性和有效性的程度，亦即测量是否达到了预期的目的。效度分为三大类：内容效度、效标关联效度和结构效度。难度是指测验的难易程度。在教育测量中，某测验的难度一般是用正确解答该测验题的人数与参与测验的学生数的比值来刻画的。用公式表示即：P=R/N，其中，P表示某测验题的难度，R表示答案对该测验题的人数，N表示参加测验的人数。测验题目的难度必须根据测验的目的确定和评价。难度是试题对学生知识和

能力水平的适合程度的指标，是由参与测量的被试群体的整体水平决定的。

区分度，又叫鉴别力，是指测验对考生实际水平的区分程度，用符号D表示。具有良好区分度的测验，实际水平高的应该得高分，实际水平低的应得低分。它是评价试题质量，筛选试题的主要指标与依据。

2. 信度的估算方法

根据统计学的基本原理，估算测验的信度有三种方法：重测信度、复本信度和同质性信度。重测信度也叫稳定性系数，它指的就是用同一量表（测验或评价表）对同一组被试施测两次所得结果的一致程度，其大小等于同一组被试在两次测验上所得分数的相关系数。复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的相关系数。同质性信度也叫内部一致性信度，它是指测验内部所有题目间的一致性程度。这里题目间的一致性含有两层意思：其一是指所有题目测的是同一种心理特质；其二是指所有题目得分之间都具有较高的正相关。也就是说，同质性信度就是一个测验所测内容或特质的相同程度。

3. 提高测验信度的方法

（1）适当增加测验题目的数量；

（2）测验的难度要适中（测验的难度适中，能使测验的信度达到最大，也能使测验的区分度达到最大，所以，必须使测验的难度适中）；

（3）测验的内容应尽量同质；（4）测验的程序应统一；

（5）测验的时间要充分；（6）评分要尽量做到客观化、减少评分误差；

（7）应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数，从而影响信度。引起应试者参加测验的强烈动机，提高其积极性，使其保持旺盛的精力，都对提高测验信度有一定作用。

4. 信度和效度的关系

在效度和信度之间，首先要重点保证是高效度，因为，高效度必然高信度；反之，则不然。特别是对于教育测量而言，效度问题显得更为重要。在处理信度与效度的关系问题上，首先要保证高的效度。

信度是效度的必要条件。虽然信度高的测验效度不一定高，但效度高的测验，信度却一定比较高。效度和信度的关系是：效度的最大值等于信度的平方根。但是，既要有高效度，同时又要有高信度，是不大可能的。例如，同质性测验(量表的所有题目测验相同的因素)信度较高，但对预测来说，效度却很低。非同质性测验(其测验内容测量不同因素)预测效度高，但是信度却比较低。所以，要提高预测效度的一个重要方法，是增加非同质性，即增加新因素。

5.难度

（1）难度对测验的影响：影响测验分数的分布状态、影响测验的鉴别能力。

难度值过大或过小，都会造成测验分数的偏态分布。难度值越接近0，测验的难度就越大，正确回答试题的人数就越少，测验分数就越是集中在低分段，其分数分布呈正偏态。测验难度直接影响测验分数的离散程度，因为难度过大或过小，测验分数的分布都呈偏态分布，亦即测验分数都分布在高分段或低分段，这样，测验分数的离散程度就变小了。适中的难度可使试题的区分度达到最大。

（2）影响题目难度的因素：考查知识点的多少、考查能力的复杂程度或层次的高低、考生对题目的熟悉程度、命题的技巧、利用经验判断或者通过预测调整难度。

6. 区分度与测验信度、难度的关系

（1）区分度与信度的关系：提高区分度可以达到理想的测验信度。

（2）区分度与难度的关系：难度适中，可使区分度达到最大值。难度为1时，区分度为0。 7. 提高区分度的方法

（1）使题目的难度适中，使整个考试难度适中；（2）着重考察复杂的学习结果

第四章编制教育测验的一般原理与方法

1. 布卢姆的认知领域的目标分类

布卢姆将认知领域的目标分为六个类别，按照由低级到高级的难易程度形成一种递进的等级关系，前一类别是后一类别的基础，后一类别又涵盖了前面的类别。

(1) 知识/知道。这是最低等级的认知目标。此处的知识是指对具体事物和普遍原理的回忆，对方法和

过程的回忆，或者对一种模式、结构或框架的回忆。

（2）领会。这是最低层次的理解，指个人把某种材料与其他材料联系起来，也不必弄清它的最充分的含义，便知道正在交流什么，并能够运用正在交流的这种材料和观点。

（3）运用。运用是指将抽象概念用于特定、具体的情境。这些抽象的概念，可能是以一般的观念、程序的规则或概括化的方法等形式表现出来的，也可能是那些必须记住、能够专门运用的原理、观念和理论。

(4) 分析。分析是指把材料分解成各个组成部分，弄清各部分之间的相互关系及其构成的方式，以指出那些用来传递意义或确定交流结果的技术和手段。

(5) 综合。综合是指将各种要素和组成部分组合起来，以形成一个整体。它是对各种要素和组成部分等进行加工的过程，是一个用这种方式将它们组合起来，以构成一种原先不那么清楚的模式或结构的过程。

(6) 评价。评价是指为了某种目的，对观念、作品、答案、方法和资料的价值及符合准则的程度作定量和定性的判断。准则既可以是内在证据，如逻辑上的准确性、一致性等，也可以是外部准则，如根据挑选或回忆出来的相应领域的最高标准等。

2. 测验题目基本上分为两大类：选择型和供答型。前者一般要求被试在几个选项中选择正确的答案，如是非题、匹配题、选择题等，后者要求被试自己提供答案，如论文题、简答题、填空题等。

第五章教育测验的常模及其建立方法

1. 一个与被试同类的团体在相同测验上得分的分布状况与结构模式，成为常模。所谓年级常模，就是不同年级学生在某种测验上的正常的一般的表现水平。教育测量数据的特点

教育测量的数据，本质上不同于物理测量的数据，不能直接套用相应于物理测量数据的方法：（1）教育科学研究中绝大部分数据属于等级变量，可以比较大小，不能加减更不能乘除；（2）教育测量的多数数据从本质上说是主观的；（3）教育测量的数据还具有随机性；（4）教育测量的数据也具有模糊性。

2. 常模参照测验与标准参照测验

在教育与心理测验中，可依据解释测验分数的参照点不同，把测验分成常模参照测验和标准参照测验。即参照测验的常模，对测验的分数进行解释与评价的测验，称为常模参照测验；

参照测验的“标准”，对测验的分数进行解释与评价的测验，称为标准参照测验。标准分数的使用是基于常模数据服从正态分布的假设。标准分数是以标准差为单位表示测验成绩与平均分数之间的距离。标准分数本身是关于原始分数的一种线性变换，因此，标准分数不改变原始分数的分布形态。标准分数Z分数具有较好的可比性和可加性。

3. 教育测量量表分类

按照测量的精确程度，将测量量表从低到高分为称名量表、顺序量表、区间量表/等距量表和比率量表。 4.等距变量

等距变量具有等级变量的特征，还要求连续数量之间的差距相等，亦即具有相等的单位。因此，等距变量可以作加减运算，不能作乘除运算(因为等距变量并没有绝对零点)。

5. 测验蓝图的设计一般采取的步骤

测测验的蓝图一般用反映测验内容和学习水平的命题双向细目表表示。设计测验蓝图主要采用以下步骤：（1）确定测验内容要目。如何确定测验内容要目，必须依据课程标准或教学大纲、教学目标和学生的实际而定。（2）确定该科目应考查的目标层次。把这些目标层次从低级到高级依次安排在表中顶端第一行的有关格上。（3）确定各项测验内容要目下的权重。根据课程标准或教学大纲所规定的教学时间和分配比例，以及测验性质和其他因素，对列入测验范围的内容要目或内容点，赋以合适的相对比重即权重。该比重是测验试题数量、测验时间、分数分配的依据。（4）形成命题双向细目表。把每一项考试内容的分数比重逐一分配到若干必要的测验目标层次上去，形成网格状的分数分配方案，即命题双向细目表。

第六章教育测验的标准及其建立方法

1. 教育测验标准的含义

教育测验的“标准”指的是教育测验的成就标准，它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。

第七章制定教育评价表的一般方法和步骤

1. 教育评价表

教育评价表是根据教育教学的特性编制而成的，它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具，为了使评价的结果更为可靠，需要对教育评价表进行更深入的研究。

2. 教育评价表的构成要素

（1）评价指标：就是根据评价的目标，由评价指标的设计者分解出来的，能够反映评价对象某方面本质特征的具体化、行为化的主要因素，是对评价对象进行价值判断的依据。

（2）指标权重：就是表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这个数值就叫做对应指标的权数，或叫做权重。

（3）评价标准：衡量评价对象达到评价指标要求的尺度，是由强度和频率、标号、标度三个要素构成。 3. 常见的指标权重分配方法常见的指标权重分配方法有 (1)关键特征调查法

关键特征调查法是先请被调查者从所提供的备择指标中找出最关键、最有特征的指标，再对指标进行筛选并求出其权重的方法。

其操作步骤包括：①提出备择指标。②请被调查者从备择指标中找出一定数量的关键指标。③计算人数和百分比。④按一定的规则选取指标。⑤计算各指标的权重系数：

(2)两两比较法

为了确定各指标的权重，可对指标进行逐对比较，并加以评分，重要者记为1分，次重要者记为0分；然后分别计算各指标得分之和，再除以所有指标得分之总和。这种方法叫两两比较法。

(3)专家评判平均法

对于已经确定的指标，分别请专家评判其权重，然后以专家评判结果的平均数作为各指标权重。这种方法叫专家评判平均法。这种方法的特点是简便易行，能够充分交流意见。不足之处是：主观随意性较大，容易受专家的素质、水平等因素的影响。因此，要保证权重确定的合理性和准确性，使确定的权重具有一定的信度和效度，关键在于专家的素质和水平。

(4)倍数比较法

对已确定的指标，以每一级指标中重要性程度最小的指标为基础，记为1，然后将其他指标与它相比，作出重要性程度是它多少倍的判断，再经归一化处理，即获得该级各指标权重。这种方法称倍数比较法。

(5) Q分类法

Q分类法是一种确定指标优先顺序及其权重的方法。总的方法是将写有指标名称的一套卡片交给被调查者，请他们按指标重要性程度分组。优点：简便易行，在指标数目较多的情况下，更为适用准确性较低。缺点：准确性较低。

4. 制定教育评价表需要遵循的原则

教育评价表是根据教育教学的特性编制而成的，它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具，制定教育评价表应遵循以下的原则：

（1）科学性与导向性原则（2）完备性与独立性原则（3）发展性与整体性原则（4）操作性与可测性原则（5）可行性与可比性原则（6）超前性和持续性原则

第八章学生评价

1. 学生评价概述 ? 学生评价的类型

（1）定位性评价：又称安置性评价、预备性评价，主要是在特定的教学活动之前，判断学生的前期准备。在这种评价里面要解决的问题是学生是否已经掌握了参加预定活动所需要的知识和技能，在多大程度上已经达到教学目标，学生的兴趣等基本情况等等。

（2）形成性评价：主要是指不断地反映学生学习成功或者是失败的信息，特别注重强化学生学习的成功之处，显示学生学习过程中需要改进的具体的错误。

（3）诊断性评价：诊断性评价对学生的学习进行进一步的评价，对于学习中错误的深层诊断。

（4）总结性评价：在某个期末教师对学生的测验和评价。对教学目标达到程度的判断，同时也提供教学目标适当性和教学策略有效性的信息。

2. 现代学生评价的特点

（1）强调了评价功能的形成性

现代教育评价的目的中强调参与和推动教育的发展。现代的学生评价，主要是用来诊断问题，改进教育，其目的则是创造适合儿童的教育。对评价形成性功能的重视又反过来是现代教育评价发展的一个重要动因。

（2）重视评价内容的全面性

教育工作者要求评价须全面地反映教育目标，对学生认知、情感以及动作技能的发展做出全面的评价，以促进学生的全面发展。因而，评价活动对教育活动能提供更大的帮助。

（3）重视评价类型的多样性

根据现代教育的需要，现代教育评价注意为教育提供全方位的服务，逐步地发展了包括定位性评价、形成性评价、诊断性评价在内的多种评价。这种多样性的评价，在学校教育的不同阶段提供不同的评价服务，使得评价在推动教育的发展中能起到越来越大的作用。

3. 学生课业发展的内容框架（评价学生的方面）从综合的角度出发，提出学生课业发展的内容框架。这个内容框架，除了学生的健康与体能发展目标外，还可包括如下九个方面：

（1）学生个体一般性发展

这主要是指学生的“个人一社会性”方面的发展，它是学生在学校教育背景下社会化的发展成果，也是教育具有社会性的体现。一般性发展目标涉及到公民素质、社会责任、环保意识、学会学习、学会生活、学会做事、学会做人、学会合作、学会思考等等。

（2）学科理论知识和学科能力或技能的发展

对学科的理论知识，我们可以从四个层面加以把握：体现学科基础性的理论知识、体现学科发展性的理论知识、体现学科一般性或苛刻性的理论知识、学科理论知识应用能力的发展。课业考评必须树立新的知识观和价值观，对知识理论的应用可从三个水平来把握：理论知识的简单应用、综合应用和创造性应用。常见的学科能力或技能有：听说技能、阅读技能、写作技能、创作技能、观察技能、操作技能、交流技能等。

（3）思维技能与品质的发展

学生思维技能的发展，既是学校各门课程共同的教学目标之一，又是影响各门课程教育目标达成的因素之一。在评价学生的思维技能的发展时，除了解学生的不同思维方法之外，还要评价学生的思维品质。

（4）研究与学习技能

研究技能主要包括：搜集、获取、整理、处理与利用信息的能力；提出问题或提出有条理的假说的能力；获取研究资料的能力；设计实验与验证假说的能力；统整资料与分析研究资料的能力等。学习技能主要包括学习过程中的认知技能和学习策略应用两个方面。

（5）创新精神与实践能力的发展

在教育教学中，重视培养学生的创新精神与实践能力，这是实施素质教育的重点。重视对学生创新精神与实践能力发展的评价，具有导向性和体现时代精神的重要意义。

（6）态度、观念与兴趣的发展

态度主要包括对学习、社会、社会道德伦理、科学、生活、人生、人际关系、自然界的态度等许多方面。观念包括知识观、科学观、人生观、世界观、审美观、道德观、职业观、幸福观等许多方面。学生兴趣的发展也表现出多样性，诸如对研究的兴趣、提出与众不同问题的兴趣、探索某领域问题的兴趣、对人际交流的兴趣、对对公益活动的兴趣、对某种学科或某种艺术活动的兴趣、对某种职业的兴趣等。

《教育测量与评价》期末考试指导(带答案)

《教育测量与评价》期末考试指导（带答案）二、复习重点内容第一章教育测量与评价的学科发展1.测量的含义所谓测量，就是根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程测量的要素测量的量具、测量的单位和测量的参照点，是测量的三个基本要素或三个基本条件。2.教育测量和教育评价

推荐度：

点击下载文档文档为doc格式

《教育测量与评价》期末考试指导(带答案)

《教育测量与评价》期末考试指导(带答案)

相关推荐文档

精选图文

热门排序

推荐文章

热门标签

相关文章列表