第一章 绪论 1. 名词解释
随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体
次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示
频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组
数据总个数去除。频率通畅用比例或百分数表示
概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,
也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值
参 数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标
观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据
2. 何谓心理与教育统计学?学习它有何意义
心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3. 选用统计方法有哪几个步骤?
首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的
其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要
第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量
随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量
5. 怎样理解总体、样本与个体?
总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定
样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强 ②样本不同,统计方法不同 总体与样本可以相互转化。
个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系?
参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化
参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标
当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别?
8. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么?
17.0千克 89.85厘米 199.2秒 93.5分是测量数据 17人 25本是计数数据 9. 说明下面符号代表的意义
μ反映总体集中情况的统计指标,即总体平均数或期望值
X反映样本平均数
ρ 表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数
σ反映总体分散情况的统计指标标准差 s样本标准差
β表示两个特性中体之间数量关系的回归系数
第三章 集中量数
1. 应用算术平均数表示集中趋势要注意什么问题?
应用算术平均数必须遵循以下几个原则:
① 同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的
数据。
② 平均数与个体数据相结合的原则 ③ 平均数与标准差、方差相结合原则
2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?
中数适用于:① 当一组观测结果中出现两个极端数目时 ② 次数分布表两端数据或个别数据不清楚时 ③ 要快速估计一组数据代表值时
众数适用于:①要快速且粗略的求一组数据代表值时 ②数据不同质时,表示典型情况③次数分布中有两极端的数目时 ④粗略估计次数分布的形态时,用M-Mo作为表示次数分布是否偏态的指标(正态:M=Md=Mo; 正偏:M>Md>Mo; 负偏:M 几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态 ②等距、等比量表实验③平均增长率,按一定比例变化时 调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间 ②学习时间一定,记录一定时间各被试完成的工作量 3. 对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。 ⑴ 4 5 6 6 7 29 中数=6 ⑵ 3 4 5 5 7 5 众数=5 ⑶ 2 3 5 6 7 8 9 平均数=5.71 4. 求下列四个年级的总平均成绩。 年级 一 二 三 四 x n 解:XT90.5 236 91 318 92 215 94 200 ??nX?niii?90.5?236?91?318?92?215?94?200?91.72 236?318?215?200联想词数 13 13 13 时间(分) 2 3 25 词数/分(Xi) 13/2 13/3 - 5. 三个不同被试对某词的联想速度如下表,求平均联想速度 被试 A B C 解:C被试联想时间25分钟为异常数据,删除 调和平均数MH?111?NXi?1123(?)21313?5.2 6. 下面是某校几年来毕业生的人数,问平均增加率是多少?并估计10年后的毕业人数有多少。 年份 1978 1979 1980 1981 1982 1983 1984 1985 毕业人数 542 601 750 760 810 930 1050 1120 解:用几何平均数变式计算: Mg=N-1XN71120??1.10925 所以平均增加率为11% X154210年后毕业人数为1120×1.1092510=3159人 第四章 差异量数 1. 度量离中趋势的差异量数有哪些?为什么要度量离中趋势? 度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。 在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊 情况。这些特殊性常表现为数据的变异性。如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。 各种差异量数各有什么特点? 见课本103页“各种差异量数优缺点比较” 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途? 可以计算差异系数(应用)和标准分数(应用) 应用标准分数求不同质的数据总和时应注意什么问题? 要求不同质的数据的次数分布为正态 计算下列数据的标准差与平均差 11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5 2. 3. 4. 5. X??Xi?11.0?13.0?10.0?9.0?11.5?12.2?13.1?9.7?10.5?11.1 N9Xi-X?A.D.=n?10.7?1.19 96. 7. 今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm, 10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比较其离散程度的大小?并具体比较之。 用差异系数来比较离散程度。 CV1=(s1/X1)×100%=(0.7/1.3)×100%=53.85% CV2=(s2/X2)×100%=(1.2/4.3) ×100%=27.91% 班级 平均数 标准差 1 2 3 4 90.5 91.0 92.0 89.5 6.2 6.5 5.8 5.2 人数 40 51 48 43 di 0.3 -0.2 -1.2 1.3 ?NXTi?40?51?48?43?182 iiNX???Ni?90.5?40?91.0?51?92.0?48?89.5?4316525.5??90.80 1821822222di?XT?Xi 其值见上表 ?Ns?40?6.2?51?6.5?48?5.8?43?5.2?6469.79 ?Nd?40?0.3?51?(?0.2)?48?(?1.2)?43?1.3?147.43 Ns??Nd6469.79?147.43?s???6.03 即各班成绩的总标准差是6.03 N182?2ii22222ii22iiiiTi第五章 相关关系 1. 解释相关系数时应注意什么? (1) 相关系数是两列变量之间相关的数字表现形式,相关程度指标有统计特征数r和总体系数ρ (2) 它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比r小相关密切,不能说r 大=0.8是r小=0.4的两倍(不能用倍数关系来解释) (3) 当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值 (4) -1≤r≤1,正负号表示相关方向,值大小表示相关程度;(0为无相关,1为完全正相关,-1为完全 负相关) (5) 相关系数大的事物间不一定有因果关系 (6) 当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象