、请举例说明什么是称名、顺序、等距、等比数据及它们之间的区别。 答:
根据数据所反映的变量的性质,可把数据分为称名变量数据、顺序变量数 据、等距变量数据和比率变量数据。
1.称名变量。称名变量只说明某一事物与其他事物在名称、类别或属性上的 不同,并不
说明事物与事物之间差异的大小、顺序的先后。例如,人的性别分 成男与女;人对衣服颜色的倾向性选择有红色、黄色、蓝色、白色、黑色等; 人的气质可分为多血质型、胆汁质型、粘液质型和抑郁质型;而人的血型则可 分为A型、B型、0型等。在资料管理与科学研究中,常需要采用一定的规则对 称名变量的观察结果进行人为的赋值与编码,从而得到称名变量数据。如前述 的性别数据,用数字符号 “1表”示男性,用数字符号 “0表”示女性(当然也可以用 其他数字符号表示);以及用 6 位数字组成全国各地的邮政编码等 ,皆是称名变 量数据。这些数据仅是类别符号而已 ,没有在量方面的实质性意义 ,一般不能对这 类数据进行加、减、乘、除运算,但通常可对每一类别计算次数或个数等。
2.
顺序变量。顺序变
量是指可以就事物的某一属性的多少或大小按次序将各 事物加以排列的变量,具有等级性和次序性的特点。例如,对学生的阅读能力 可划分为好、中、差三个等级;态度等级可划分为 “赞成、倾向赞成、中立、倾 向反对、反对 ”这 5个等级;对体育运动会中各个项目上的表现可以用名次 “第 1 名、第2名、第3名……来表示;还有,心理测验结果常用 拾点量表”或玖点 量表”来表示测验得分高低等级顺序 ;学校常采用 “五级记分制 ”来评定学生的学习 成绩等,皆是顺序变量的具体表现。不难看出,顺序变量的观测结果有些是直 接用序数等级来表示事物属性的多少与大小,另外有些观测结果则是用有序的 类别来区分事物属性的差异。在实际应用和研究中,常用有序的整数或自然数 来表示顺序变量的各种观测结果,从而得到顺序变量数据。例如
,可用 “,54,
3, 2, 1”来表示对某个问题所持赞成还是反对态度之间的 5 个不同等级;可用 “3, 2,1 ”或“5, 3, 1”等数字序列来表示阅读能力的 “好、中、差 ”三个等级。值得 指出
的是,顺序变量数据之间虽有次序与等级关系,但这种数据之间不具有相 等的单位,也不具有绝对的数量大小和零点。
因此,只能进行顺序递推运算。如,
因为A优于B, B优于C,所以A优
于C”勺运算结果充其量只是反映位次顺序的关系而已。
1/ 6
3. 等距变量。等距变量除能表明量的相对大小外 ,还具有相等的单位。事实 上,日常
生活或生产中使用的温度计算所测出的气温量值就是等距变量数据。
例如测气温量值,星期一为20C,星期二22C,星期三24C。则我们可以知道 星期三气温高于星期二,星期二气温又高于星期一;而且我们还可以从实质性 的角度说明相邻两天气温之差是相等的。等距变量观测数据的单位是相等的, 但零点却是相对的。如气温0C,并不表示没有冷热,而是特定的相对的冰点温 度,若在华氏温度计或其他类型的温度计测定下,这里的
0C就不再是零。在教
育测量中 ,人们有时用标准分数来反映人的能力相对高低,这种情形下所得到的 测量结果也是一种等距变量数据。由于这类数据的零点是相对的,因此,对这 类数据一般不能用乘、除法运算来反映两个数据(两个个体在某种能力属性) 之间的倍比关系。比如,不能说 20C的气温是10C气温时的 两倍”那么热。
4. 比率变量。比率变量除了具有量的大小、相等单位外 ,还有绝对零点。例 如,学生身
高、体重的测量数据等,皆可以看成是比率变量数据。比率变量数据 可以进行加、减、乘、除运算 ,允许人们用乘、除法处理数据 ,以便对不同个体的 测量结果进行比较,并作比率性(即倍比关系)描述。例如,一位学生在 20岁 时身高 180厘米,而他 3岁时身高是 90厘米,我们可以说, 20岁时的身高是他 3 岁时身高的两倍。反过来可以说,他 3岁时的身高已是 20岁时身高的一半 (倍)。
二、简述如何编制次数分布表(请写出主要步骤)
1)简单次数分布表。
简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等 距区组内的次数分布结构。
① 求全距
所谓全距乃是一批数据中最大值与最小值之间的差距。观察全部数据,找 出其中的最大值(XmaX)和最小值(Xmin),以符号R表示全距,则全距的计算 公式为:
R= Xmax-Xmin ( 1-1)
故,全距在有的书中也称为两极差。 ② 定组数
2/ 6
定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 K表 示,它的大小要看数据的多少而定。一般来说,当一批数据的个数在 200 个以内 时,组数可取8 —18组。
如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:
1-2)
上述公式中的 N 为数据个数。 ③ 定组距i = R/ K
在知道全距R和组数K之后,就可以来确定分组的组距。用符号 i表示, 其一般原则是取奇数或 5 的倍数,如 1, 3, 5, 7, 9, 10 等。具体的取值办 法,可通过全距R与组数K的比值来取整确定。
④ 写出组限
组限是每个组的起止点界限,有表述组限和实际组限之区别。在教育与心 理统计学文献中,组限的表述方法主要有两种。两种组限表述方法意义不尽相 同。
第一种方法以连续的形态表述组限,每一组实际组限是 “左闭右开 ”的区间 范围。如“ 1&15”和“ 1^520”这两组,其实际组限是指[10,15)和[15, 20)的 区间范围。
第二种方法以跳跃的形态表述组限,在相邻组别中形成 缺口 ”例如,“ 10- 14”和“1&19”这两组在相邻处不连续,从14跳跃到15时留下的“ 1个单位缺 口。对于这种表述组限 ,其实际组限分别是指 [9.5, 14.5]和[14.5, 19.5]的区间范 围。
⑤ 求组中值
3/ 6
组中值是各组的组中点在量尺上的数值,其计算公式为: 组中值二(组实上限+组实下限)一2( 1-3)
不同的组距以及不同的组限,必然会产生不同的组中值。如果希望每组的 组中值恰好为整数便于后继运算,那么,组距选择为奇数是最好的。
⑥ 归类划记
完成上述各个步骤后,我们就可以设计一个表的格式来记录上述有关结果 并对数据进行归类划记。
⑦ 登记次数
根据划记结果,点计各组的次数,记入次数栏。
当我们把组别、组中值和次数值拼在一起时,就构成简单次数分布表。
2)相对次数分布表
相对次数就是各组的次数 的计算公式为:
1-3)
与总次数N之间的比值,若以表示相对次数,则相对次数把组别、组中值 和次数值拼在一起时,就构成次数分布表。
相对次数分布表与简单次数发布表各有不同的用途, 又可它们既可单独使用, 联合使用。当我们主要对各组的绝对次数感兴趣时, 布表。 则可编制简单次数分
相对次数分布表主要能反映各组数据的百分比结构, 次数的相对比例结构时 ,通常要编制相对次数分布表。
当我们侧重关心各组
3)累计次数分布表
假如我们希望通过一个统计表,就能较方便地了解到处于某个数值以下的 数据个数有多少时,就可编制一个累积次数分布表。
4/ 6
把组别、组中值和累积次数值拼在一起时,就构成累积次数分布表。
4)累积相对次数分布表和累积百分数分布表
前面介绍的累积次数分布是对简单次数进行累积的结果。与此相对应的 是,还可对相对次数进行累积。
累积相对次数分布和累积百分数分布在心理与教育测量研究中有广泛而又 重要的应用。 值得一提的是 ,累积相对次数分布和累积百分数分布均有 上”分布两种,在应用时,应根据具体情况决定选用其中的一种。
三、请举例说明实际组限和表述组限的区别是什么?
组限是每个组的起止点界限,有表述组限和实际组限之区别。在教育与心 理统计学文献中,组限的表述方法主要有两种。两种组限表述方法意义不尽相 同。
第一种方法以连续的形态表述组限,每一组实际组限是 “左闭右开 ”的区间 范围。女口 “ 1&15”和“恃20”这两组,其实际组限是指[10, 15)和[15, 20)的 区间范围。
第二种方法以跳跃的形态表述组限,在相邻组别中形成 缺口 ”例如,“ 10- 14”和“1&19”这两组在相邻处不连续,从14跳跃到15时留下的“ 1个单位缺 口。对于这种表述组限 ,其实际组限分别是指 [9.5, 14.5]和[14.5, 19.5]的区间范 围。
四、已知某次高考模拟试卷高一的 5 名学生做所用时间分别为
“以下”分布和“以
170、120、
110、160、130分钟;高三的 5 名学生做所用时间分别为 50、70、
90、55、45 分钟;问高一和高三哪一组离散程度大?(请写出计算过程)
高一用时平均值:
X1=(170+120+110+160+130)/5=138
高一用时方差:
5/ 6
教育统计作业答案(第一次)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)