量,具有等级性的变化特征及相成的散点图会环值)的一致性。
1、统计:就是“统和次序性的特互联系 绕在某一条直线它是对测验控制而计之”对所考点。等距变量:9、观测数据不仅附近分布 误差能力的量察事物的量的取除能表明量的相具有离散性的特13、原始分数:度,是反映测验值在其出现的全对大小外,还具点,而且还具有在测量工具上直性能的一个重要部范围内作总体有相等的单位。向某点集中的趋接得到的测值质量指标 的把握,全局性比率变量:除了势,反映次数颁(数字),叫原始16、观察分数:的认识。教育统具有量的大小、分布集中趋势的分数。相对评分如果从测验实施计:对教育领域相等单位外,还量数叫集中量分数:通过被试过程中实际得到各种现象量的取有绝对零点。比数。中位数:位间相互比较而确的被试分数叫观值从总体上的把率变量数据可以于数据分布正中定意义的分数叫察分数。真分数:握与认识,它是进行加、减、乘、间位置上的那个相对评分分数。被试在所测特质名词解释
为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物2 规则给对象在某、测量:按一定种性质的量尺上指定值。教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值3 理测验工具与常、心理量表:心模的结合4 或数字形式表示、数据:用数量的资料事实称为数据。计数数据:是以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所获数据。人工编码数据以人们按一定规则给不同类别的事物指派适当的数字号码后所形成的数据5 说明某一事物与、称名变量:只其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。顺序变量:是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变除运算6 批数据中各个不、次数分布:一同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。相对次数:各组的次数总次数比值N之间的f与7 线:从理论上讲,、次数分布曲如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线8 面直角坐标系上、散点图:用平点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。线形图:以起伏的折线来表示某种事物的发展变化及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可适用于比较不同的人物团体在同一心理或教育现象上数。如果一组数据从小到大排列,则中位数通常是将这批数据个数一分为二,居于中间的那个数。众数:一个次数分布中出现次数最多的那个数,众数不唯一可有一个或多个。用符号表示。离中趋势:数据具有偏离中心位置的趋势,它反映了一组数据本身的离散程度和变异性程度。差异量数:反映一组数据离散程度的量10 算术平均数指的、一批数据的是这批数据总和数除以数据总次数后所得的商数。平均差:各数据与其平均数的离差绝对值的平均值。方差:数据的离差平方数的算术平均数。标准差:方差的算术平方根11 差异量数和集中、差异系数:量数两相对比后所形成的相对差异量数。地位量数:凡反映次数分布中各数据所处地位的量就叫地位量数12变量或现象之间、相关:行为 存在着种种不同模式、不同程度的联系。这种联系叫做相关。直线性相关:两个变量的成对观测数据在平面直角坐标系上描点构1 / 8
绝对评分分数:通过拿被试测值跟应有标准作比较来确定其意义的分数叫绝对评分分数14 常模简称常模即、常模:测验指一定人群在测验所测特性上的普遍水平或水平分布状况。组内常模:解释被试原始分数的参照体系,即被试所属那类群体的人,在所测特性上测验取值的分布状况。标准分数常模:用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模15 对所有要作变换、线性变换:的值,都乘以同一确定值然后再都加上另一确定值。测绘项目的难度:被试完成项目作答任务时所遇到的困难程度。项目的难度指数:定量刻画一个测验项目的被试作答困难程度的量数就叫项目的难度指数。得分率(通过率)目难度指数的求:最通用的项法,就是计算被试在项目上的得分率或者说通过率。项目区分度:就是项目区别被试水平高低的能力的量度。测验信度:测验在测量它所测特质时得到的分数(测
上客观具有的水平值。测量误差:观察分数与真分数的差就是测量误差。信度系数:利用同一测验向同一批被试重测两次所得的两批独立测值,求出其间的相关系数,就可利用这种重测相关系数作为测验信度的估计值。这样的相关系数就叫信度系数。稳定性系数:由于重侧法十分强调特质的稳定性,所以用这种方法求取的信度系数就叫做稳定性系数。等值性系数:用平行形式相关求得的信度系数,因为特别强调两测验形式的等值关系所以又叫等值性系数17
实际测验中所得、测量标准误:测值偏离真分数的程度叫做测量标准误可记为。测验效度:测验实际上测到它打算要测的东西的程度。内容效度:测验项目构成应测行为领域代表性样本的程度。效标关联效度:测验预测个体在类似或某种特定情境下行为表现的有效性。结构效度:测验测得心理学理论所定义的某一心理结构或特质的程度。效度系数:测验分数与效标测量值间的相关变量为随机变命题,一定要含系数叫效度系数 量。概率:通俗有“等于什么”的18、安置性测验:地说,某事件发成分。备择假设学期开始或单元生的概率就是该又称解消假设,教学开始时确定事件发生的可能研究假设等,以学生实有水平以性大小记作为P符号H1表示。备便针对性地做好(A) 择假设作为虚无教学安排而经常23、正态分布是假设的对立假设使用的测验。形连续性随机变量而存在,因此它成性测验:在教中常见的一种概也是一个陈述命学进行过程中实率分布形态也称题,备择假设是施的用于检查学常态分布。总体:对虚无假设的否等单位的线性连
续体系。如身高、 体重等。能加、 减、乘、除 3、测量工作按一 定的规则进行, 体现为三种东西 即:测量工具、 施测和评分的程 序与要求、结果 解释参照系或参 照物
生掌握知识和进步情况的测验,这可为师生双方提供有关学习成败的连续反馈信息。诊断性测验:为探测与确定学习困难原因而施测的一类测验。终结性测验:在课程结束或教学大周期结束时,用于确定教学目标达到程度和学生对预期学习结果掌握程度的一类测验,称为终结性测验19 验:实是参照着、常模参照测常模使用相对位置来描述测验成绩水平的一种测验。标准参照测验:跟一组规定明确的知识能力标准或教学目标内容对比时,对学习者的测验成绩作出解释的一类测验。职业能力倾向测验:测量人的某种潜能,从而预测人在一定职业领域中成功可能性的心理测验20 一个人获得新的、能力倾向:知识、能力和技能的内在潜力21 在相同的条件下、确定性现象:其结果也一定相同的现象。不确定性现象:在相同的条件下其结果却不一定相同的现象,又称随机现象22 我们称记录各种、随机变量:随机试验结果的我们把客观世界中具有某种共同特征的元素的全体称为总体。样本:从总体中抽取的部分个体组成的群体称为样本。统计量:在总体数据基础上求取的各种特征量数我们称其为参数,应用样本数据计算的各种特征量数我们称其为统计量。抽样分布:从一个总体中随机抽取若干个等容量的样本,计算每个样本的某个特征量数,由这些特征量数形成的分布,称为这个特征量数的抽样分布24 在教育统计中常、小概率事件:常把概率取值小于0.010.05或小于称为小概率事的随机事件件。小概率事件原理:认为小概率事件在一次抽样中不可能发生的原理25验的显著性水、统计假设检 平:在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平。记为虚无假设又称为α。原假设、零假设,以符号虚无假设在假设H0表示。检验中将被视作为已知条件而应用,因此虚无假设应是一个相对比较明确的陈述定26
计学中一种独特方差分析:统的假设检验方法,它的最基本功能就是一次性检验多个总体平均数的差异显著性
2 / 8
单选、填空、多选1内容主要包括:、教育统计学的 描述统计与推断统计2 其上取定数值的、测量结果能在量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,4理测量的两点突、心理测量跟物出差异:一间接性;二要抽样进行5从数据来源分成、数据的种类 ①计数数据、测量评估数据和人工编码数据数据所反映的变②根据量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据6 量数据之间虽有、区别;顺序变次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算7
①、数据三个特点②数据的离散性③数据的变异性8数据的规律性 的次数分布两种、统计一批数据方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计9
分布步骤、编制简单次数距组距②定组数①求全③定求组中值④写组限⑤划记⑦登记次数⑥归类
10布表主要能反映、相对次数分各组数据的百分比结构11
布表还分成、累积次数分下布表与”累积次数分“以积次数分布表两“以上”累种。目的在于反映位“以下”累积其于某个分数下共有多少”的累积次数“以12
两种表达方式:、次数分布图次数直方图和次数多边图13线按形状有各种、次数分布曲
不同类型对称分布曲线。①单峰正态分布曲线也是这一类型曲线中的一种称曲线即偏态分②非对布。正偏态:次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,在一些考试中,若题目偏难,多数考分偏低时,可形成正偏态分布。而负偏态的次数分布偏向正好与正偏态相反14 计分析图:散点、几种常用统图、线形图、条形图和圆形图15 独特的功能,特、圆形图有其别适用于描述具有百分比结构的分类数据16
三个作用、集中量数有们提供整个分布①向人中多数数据的集结点位置反映一批数据在②集中整体上的数量大小典型代表值③一批数据的17
多个种类,最常、集中量数有用的是算术平均数、中位数和众数三种。其中算术平均数是使用最普通的一个集中量数。中数在下列情况中有较好的应用价值数据分布中有个①别异常值或极端值出现时,用平均数作分布的代表值倒不如用中数作分布的代表值来得客观合理②某端或两端的数在次数分布的据只有次数而没有确切数量时在一些态度测③验、价值观测验或一般的民意问卷测试中,通常向被调查对象提出一些事项,要求被调查对象对这些事项排序。那么,在这种资料的信息数据整理分析中可应用中数来概括各个事项的总体排序结果18
量数是平均差、、常用的差异标准差和方差等指标19
称为变异系数和、差异系数又变差系数,用符号表示。差异系数是一种反映相对离散程度的系数,即相对差异量数。它消去了单位,因而适合于不同性质数据的研究与比较。数据在次数分布中所处的地位可用百分等级来表示。百分等级也称百分位。用记号表示。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,在之间取值。如百0到100分等级对应的这个百分75,与其位数,读作第百分位数,记作75P75 20
学上用相关系数、相关:统计来定量描述两个变量之间的直线性相关的强度与方向。如相互关联着的两变量,
一个增大另一个也随之增大,一个减小另一个也随之减小,变化方向一致是正相关。如相互关联着的两变量,一个增大另一个反而减小,变化方向相反是负相关。表示,相关系数用r+1 r在-1和关系数之间取值。相值大小,表示两r的绝对个变量之间的相关强度;相关系数示相关的方向,r的正负号,表分别为正相关和负相关;相关系数关,简称零相关;0,称零线性相相关系数表示两个变量是1时,完全相关。当0.7≤相关;当<1,称为高0.7相关;当时,称为中等0.4≤<0.40.2≤<关;时,称为低相称极低相关或接当<0。2时,近零相关21应用最普遍、最、积差相关是 基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析22用的几种情况、等级相关适 两列观测数据都①是顺序变量数据,或一列是顺序变量数据,另一列是连续变量的数据。如对学生的绘画、体育测试成绩排名就属顺序变量数据②的观测数据,其两个连续变量中有一列或两列数据的获得主要依靠非测量方法进行粗略评估得到。如语文基础知识水平可测验加以测量但学生的课文朗读水平却只能根据若干准则由老师给予3 / 8
大体的评估。点双列相关适用于双变量数据中,有一列数据是连续变量数据,如体重、身高以及许多测验与考试的分数;另一列数据是二分类的称名变量数据,如性别23 意义必须要跟一、原始分数的定的参照物(系统)作比较,才能真正明确起来。原始分数意义的参照物大体有两类,一是其他被试的测值,即其他被试在所测特性上的普遍水平或水平分布状态;二是社会在所测特性上的客观要求,即被试在所测特性上发展应该达到程度的标准24 某一具体测验、常模总是指(不能简单地看成是其名称所指特性)上的常模。常模总是特定的、具体的,是就一定人群在具体测验上的表现来说的。常模又可分为发展常模与组内常模两大类。发展常模又有年龄常模与年级常模之别,组内常模又有百分等级常模与标准分数常模之别25 个提出常模这一、历史上第一科学概念的是法国心理学家比纳。他最早建立了智力测验的年龄常模。发展常模就是某类个体正常发展进程各特定阶段的一般水平26 力年龄、智商()=智×27100/生理年龄 可分为百分等级、组内常模又常模与标准分数常模两个类别。一个分数的百分等级,就是该分数在所属分数组中,取值比它小的分数个数占该分数组总个数的百分数。百分等级值只有可比性而无可加性,不能累加求和与进一步求平均;这是百分等级常模的一个局限所在28数的标准分数,、一个测验分 就是以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离29取值越大并不意、难度指数 (p)味着项目越难,而是越易;的数字值与其代指数p表的含义,方向恰好相反30
布:如果一个测、三种偏态分验对某一被试团体来说,难度相对显得大,那么,被试团体中大多数人就会得低分,被试总分分布就会形成正偏态分布;如果一个测验对某一被试团体来说,难度相对显得小,被试团体中就会有很多人得高分,总分分布就会形成负偏态;假定被试团体在某一特定方面,其水平分布事实上是呈正态分布的,若测验项目的难度确能做到对这个被试团体来说是恰当的,那么对这个团体施测这一测验,所得被试测验总分分布自然也会呈正态分布31 求得分率差、“高、低分组办法就是将全体”的被试按总分多寡加以排队,然后取得分最多的27%“高分组的被试作为”,得分最
少的作为后求这两个组上“27%低分组的被试”,最项目得分率(通过率)的差来作为区分度指数的取值31
两个平行形式测、人们就使用验来测查同一批被试,这样也可获得同一批被试的两批独立测值,从而通过求相关系数,估出测验的信度效度验证工作大32、体分为三类即内容效度、效标关联效度和结构效度。效标关联效度又包含效度和“并存”度这两个小类别“预测”效33当有效,效度系、测验即使相 数的取值也很少能超过般取值能达到0.70,一0.40了就相当不错34
学运用测验的一、根据课堂教般顺序来分可把学业成就测验分成安置性测验、形成性测验、诊断性测验和终结性测验。根据解释测验分数的方法不同可把学业成就测验分成常模参照测验和标准参照测验两类。根据成就测验的实施方式与测验载体,我们把成就测验分成口头测验、纸笔测验和操作测验35 点、纸笔测验优效率,即同时可①提高测验的以进行大团体的测验记录学生在题目②便于完整作答上的反应便于施测和评分③过程的规范化和标准化从而提高学业成就测验的信度与效度于对测验中答题④便信息的分析研究
36验特点、课堂成就测②①简易性性灵活性差④测量性能较③随意37 分类的认识:布、对教育目标卢姆认为作为完整的教育目标应当包括三个主要的领域:认知领域、情感领域和动作技能领域。布卢姆把认知领域中的行为目标分为六个不同的层次,它们依次是知识(识记)领会、应用、分、析、综合和评价①辨认某些特定的知识:回忆或事实步理解材料的意②领会:初义运用已学过的材③应用:能够料物整体分解为部④分析:把事分,以便了解整体与部分以及部分与部分之间的关系各个部分有机地⑤综合:把组织成一个整体的能力根据一定的标准⑥评价:对事物的价值作出合乎逻辑的判断,如对小说、诗歌、电影、哲学流派、环保方案、测验设计等作出价值判断的行为与能力38 作者提出目标层、我国教育工次分为识记、理解(领会)应用和综合应用、简单这四个层次39 考试题目类型分、学业测验中为客观题、主观题40 一些考试题目,、客观题:有如果评分规则一旦明确下来,只要依照这些规则,无论谁去评分,都会得出相同的分数,典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。简答题和填空题适合于测量相对简单的学习成就。是非题这种题型的缺陷也是明显的,一是容易猜测,对的可能性有(猜50%于用是非题来测),二是适合量的学习成就其范围有限。多项选择题更适合于测量具有较复杂结构的学习成就41 论述题、证明题、、主观题型如计算题、作图题、作文题等42 要用途、心理测验主拔人事管理②人员安置与①人才选心理学研究③临床校心理服务④学立和检验假设⑤建43国内常见、智力测验在智力测验①福②比纳斯坦验—比纳智力测力测验③韦克斯勒智准推理测验和④瑞文标中小学生团体智⑤力筛选测验44 为,发散思维所、吉尔福特认表现出来的一个人的外在的行为,即代表这个人的创造力45 在行为上表现三、发散性思维种基本特征:流畅性、变通性、独特性46 方法与类型主要、人格测验的有自陈量表法、投射测验法、情境测验法、评定量表法47发生的各种现象、客观世界中 分为两类:确定性现象不确定性现象48定义,概率的取、按照概率的 值范围在区间1]概率为上,如某个事件[0,事件肯定发生,1,表示该4 / 8
这样的事件称为必然事件,在实际研究中更多事件的概率介于与0把发生概率很小1之间,人们的事件,如概率小于0.010.05事件,称为小概率,或49 随机变量的概率、一个离散性分布是指这个随机变量所有取值点的概率的分布情况。一个连续性随机变量的概率分布是指这个随机变量所有取值区间上概率取值的分布情况50正态分布是一条、从形态看, 单峰、对称呈钟形的曲线,其对称轴为过的纵线。曲线在点取得最大值。从点开始,曲线向正负两个方向递减延伸,不断向轴逼近,但永不X与个随机变量服从X轴相交。一正态分布的最大特点是其取值在平均数附近的概率很大,而取值离平均数越远,其概率越小。在这许许多多的正态分布中有平均数为10、标准差为以作为正态分布的正态分布可的一个典型代表,其他各种正态分布都可以通过一定的数学方法与它相互转化51 分布中,夹中间、在标准正态面积Z夹中间面积值分别为90%的两个±的两个为Z值分别99%1.96;52±推断统计的直接、统计学中,2.58
操作对象是总体的一个样本,但其推断的却是总体的各种特征。影响样本对总体代表性的因素主
要有三身的离散性①总体本抽取样本容量的②所大小表性强弱的因素③对总体代是抽样方法53
法、随机抽样方样①分阶段抽样②简单随机抽分层抽样③距抽样④等54
法原则、随机抽样方等简单随机抽样最②相互独立。①机会均常见的形式就是抽签。较严谨的简单随机抽样是借助随机数码表而作的随机抽样55实质就是将总体、分层抽样的 各部分按其容量在总体规模中的比分派到样本结构中去,然后进行抽样。所以分层抽样是分两步进行出各部分入样元①按比例求素数要求的人样数用②各部分按简单随机抽样的方法产生入样元素,最终合成总样本。分阶段抽样实际上进行两次抽样,第一次是以素进行抽样,然“部分”为元后再在人样的这些入样元素。等距“部分”中抽取抽样的第一步也是首先对总体所有元素编号,所编号码应该是连续有序的。第二步计算每相邻两入样元素的间隔距离。第三步是在第一间隔中随机确定第一个入样元素的号码,比如说取定为00003开始抽取入样元。第四步则素56
分布必须学会识、要认识抽样别三种分布:总体分布、子样分布和抽样分布57 和、0.01α值常取两个水
0.05平,偶而也有取0.001检验中,的。在假设越小,称此假设α的取值检验的显著性水平越高58
验中使用的假设、统计假设检有两种,一种称为虚无假设,一种称为备择假设。统计假设检验中冒犯误的概率大小就I型错等于显著性水平α时也是犯值的大小,β同误的概率值符Ⅱ型错号。为ⅡⅡβ错误,影响型错误称小的因素有三型错误概率大个。第一因素是客观的真值与假设的伪值两者之间的差异。第二因素是小。αⅡ就越小,型错误的概率α值越大,值的大犯小,三因素是样本容β就越大。α值越第量。样本容量越大,犯的概率就越小;Ⅱ型错误样本容量越小,犯率就越大Ⅱ型错误的概59
目的是为了判断、如果检验的某个总体参数是否等于某个定值,或者是为了推断某两个总体参数是否相等,则应该使用双侧检验。如果检验的目的是为了推断某个总体参数是否大于或是否小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于的关系60
平均数的抽样分、X1平均数2布形态以及它的各种参数估计公式主要受到四个因素的影响。第一是受到两个总体是否相关的影响,第二是受到两个总体分布是否正态的影响,第三是受到两个总体方差是否已知以及是否相等的影响,第四是受到所抽样本容量的影响61 气质类型统计人、把人按四种数;学习成绩按优、良、中、差分类统计;对某项改革措施按所持赞成、反对以及无所谓态度统计;把一个教师群体同时按职称类别和态度等交叉分类。对于这一类数据的差异显著性检验,最适合的检验方法是算x2检验62、计观测次数x2时①论期待次数完全f0若实际和理相同,表明观测的次数则x2为0,分布与设想的总体的理论次数分布没有差异实际观测次数②当和理论期待次数f0相差越大时,则x2表明观测的次数值也越大,这分布与设想的总体的理论次数分布之间的差异也越大63方)是检验实际、 χ2(读作卡观测次数与理论期待次数之间差异程度的指标,其最一般表达式为观测次数;表示 f0表示实际理论期待次数。χ2最关键的一步是检验最重要的如何从虚无假设出发,确定各类事物的理论期待次数64 拟合良度检验包、总体分布的括非连续变量观测次数分布的拟合良度检验、连续变量观测数据次数分布的拟合良度检验65 次数时,根据、在计算理论χ2统计量的特性,对此要求把理论 次数小于 同相邻的组进行5的组 合并,直至所有 组的理论次数均 不小于 66 与、列联系数5方可 列联表检验中χ2值,在对r×CK (这里 至少有一个大于 r与K 中 2 值大于由预定显),当所得的χ2 著性水平及特定 自由度决定的 临界值时,我们χ2 有理由拒绝虚无 假设并推断说, 两种特征或属性 之间具有相互依 存的连带关系; 但这种相关关系 的程度怎样呢? 在统计学中,人 们用列联系数 来表示这种相关C 的程度。关系式 为: 在 值0与 列联系数1之间取 67
中我们有时需要、在实际工作 同时对多于两个 的总体平均数有 无显著性差异作 出检验,三个或 三个以上用方差 分析 68 验方法:多总体、方差齐性检 方差是否齐性常 采用最大 69F值法 出各总体平均数、方差分析作 有显著差异之 后,还必须作进 一步的分析,目 的以探清到底有 多少对平均数之 间有显著差异, 到底哪些平均数 之间有显著差 异。方差进一步 分析方法有法。
5 / 8