免师教育硕士学科英语教育测量与评价课程作业

由天下分享时间：2025/3/4 10:24:42 加入收藏我要投稿点赞

精心整理

西南大学研究生课程考试

答卷纸

考试科目院、所、中心专业或专业领域研究方向级别学年学期姓名学号类别（①全日制博士②全日制硕士③教育硕士④高师硕士 ⑤工程硕士⑥农推硕士⑦兽医硕士⑧进修) 年月日研究生院(筹)制课程类别课程考试方式题号一二得分教师评价 -来源网络

精心整理

三四五六七八九十总分任课教师签名：备注：成绩评定以百分制或等级制评分，每份试卷均应标明课程类别（①必修课②选修课③同等学力补修课）与考核方式（①闭卷笔试②口试③开卷笔试④课程论文）。课程论文应给出评语。西南大学外国语学院免师教育硕士 “学科（英语）教育测量与评价”课程作业要求：保留原题题干及数据，然后在其下面插入空白来呈现答案。不得篡改问题或者数据。在编

辑将要提交的作业的Word文件时，需确保欲呈现的内容能被打印出来。

一、简答题（50分）

1. 测量的基本要素有哪些？（1分）

-来源网络

精心整理

单位（如米、克，教育测量的单位不能直接加减乘除）；参照点（计算的起点，有绝对零点和相零点）；量表（测量工具）。 2. 什么是教育测量？（1分）

教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。它主要包括对学生的内在精神属性的测量，教育测量主要是一种间接的测量。 3. 教育测量有哪些量表类型？（1分）

类别量表，顺序量表，等距量表，等比量表 4. 什么是教育评价？（1分）教育评价是指根据一定的教育价值观或教育目标，运用可行的科学手段，通过系统地收集信息、分析解释，对教育要素，过程和效果进行价值判断的活动。 5. 教育测量与教育评价有什么不同？（1分）两者着眼点不同：教育测量是为了取得数据；教育评价是要分析解释，对教育价值作出判断。两者特点不同：教育测量是一种纯客观的过程，具有客观性特点；教育评价具有客观性与主体性相结合特点。两者复杂程度不同：教育测量是对教育数量化的描述，关心量的获得，活动较为单一；教育评价着眼于事物质的判定，含定性与定量分析，活动是多重的。 6. 教育评价与教育评估有什么异同？（1分）区别：评估有估价的含义，模糊粗略；评价相对是较为精确的价值判断。评估多用于群体或单位的状态及效果的估价；评价则既有对群体和单位的价值判断，又有对个人的判断。 7. 教育测验、考试与教育测量有什么不同？（1分）教育测验和考试是教育测量的一部分。 8. 教育测量与评价，按照实施的时间阶段的不同，可以区分为哪几种类型？各自使用的目的是什么？（1分）按照实施的时间阶段的不同可以分为诊断性、形成性和总结性评价。诊断性评价一般在教学前进行，目的是分析学生的起点行为，摸清学生的现有水平及个别差异以便安排教学。

形成性评价通常在教学过程中实施，是教师及时了解学生学习进展情况的重要方式，又称诊断进步评价或进展评价。

总结性评价是对一个完整的教育过程的总体结果进行的评价，又叫终结性评价，通常在一门课程或一项教学活动结束之后进行。 9. 教育测量与评价，按照参照点的不同，区分为哪几种类型？各自适用的情形是什么？（1分）

根据评价参照点的不同，可以把教学评价分为常模参照评价和标准参照评价

-来源网络

精心整理

常模参照评价是以学生所处的团体的平均成绩或团体中的常模作为参照标准，根据个体的相对位置（或名次）报告评价的结果。

标准参照评价是在评价对象群体之外，预定一个客观的或理想的标准，并运用这个固定标准去评价每个对象的评价方式。

10. 教育测量与评价，按照被测量与评价的行为的性质，区分为哪些类型？它们各自适用于什么情

形？（1分）

根据测量与评价的行为的性质，分为最佳行为测量与评价，典型行为测量与评价。其中，最佳行为测量与评价，是以被试者最佳行为表现为目的；典型行为测量与评价，不在测量与评价被试者能力的高低，而是测量与评价其是否具备某种（或某些）典型行为。

11. 按照教育测量与评价的内容，教育测量与评价区分为哪几种类型？它们各自适用于什么情形？（1分）它们被分为标准化测量与评价和非标准化测量与评价。标准化测量与评价是只由测量专家严格按照标准程序而编成的一种测验。 12. 什么是重测信度？（1分）它是指用同一测验试卷，在先后两个不同时间内同一组被试进行测验，两次测验实得分数的相关系数。 13. 什么是复本信度？（1分）复本信度又称等值性系数。它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数。 14. Kappa一致性分析可以用来说明教育测量与评价的哪些类型的信度？（1分）重测信度 15. 肯德尔和谐系数分析的功能是什么？（1分）肯德尔和谐系数是计算多个等级变量相关程度的一种相关量。Spearman等级相关讨论的是两个等级变量的相关程度，用于评价时只适用于两个评分者评价N个人或N件作品，或同一个人先后两次评价N个人或N件作品，而kandall和谐系数则适用于数据资料是多列相关的等级资料，即可是k个评分者评(N)个对象，也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数，可以较为客观地选择好的作品或好的评分者

16. 什么叫分半(half-split)信度?（1分）

分半信度（split-halfreliability）常用信度检验方法之一。反映测验项目内部一致性程度，即表示测验测量相同内容或特质的程度。具体分析是在测验后将测验项目分成相

-来源网络

精心整理

等的两组（两半），通常采用奇偶分组方法，即将测验题目按照序号的奇数和偶数分成两半，然后计算两项项目分之间的相关。相关越高表示信度高，或内部一致性程度高。

17. 什么叫克伦巴赫alpha系数？（1分）

Cronbacha信度系数是一套常用的衡量心理或教育测验可靠性的方法,依一定公式估量测验的内部一致性.作为信度的指标.它克服部分折半法的缺点,是目前社会研究最常使用的信度指标,它是测量一组同义或平行测\总和\的信度.

18. 什么叫效度（validity）？什么叫效度验证（validation）？（1分）

效度是测量结果的准确性和有效性程度，也是指测量是否达到了预期的目的。

19. 什么叫内容效度？什么叫表面效度？什么叫反应效度？（1分）内容效度指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。表面效度指被试或其他未受过专门训练的人员对测量有效性程度的估计。反应效度是指测试者对测试内容的是否感兴趣，测试内容是否满足被测试者需求的估计。 20. 什么叫构念(construct)?什么叫构念效度(constructvalidity)?（1分）构念（construct）是指心理学理论所涉及的抽象而属假设性的概念或特质。构念效度是指一个测量实际测到所要测量的理论结构和特质的程度，或者说测量能够说明测量的理论结构和特质的程度。 21. 什么叫效标(Criterion)？什么叫效标效度（criterion-relatedvalidity）?（1分）

效标是衡量测验有效性的参照标准，它是独立于测验之外，体现测验目的的行为变量。通常指我们所要预测的行为。效标效度是指问卷(量表)测量结果和效度标准(被假设或定义为有效的某种外在标准)之间的一致程度。 22. 什么叫同期效度(concurrentvalidity)和预测效度(predictivevalidity)?（1分）

同时效度(ConcurrentValidity),即同时在研究对象中进行测评和效度标准测量得到的结果之间的相关程度。

预测效度(PredictiveValidity),它是指问卷(量表)测量结果经过一段时间后与未来实际结果予以相关性分析,两者之间的吻合程度。 23. 试题的难度系数可以怎么计算？（1分）

-来源网络