心理统计学笔记
(1)基本概念
总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体 样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本
变量:本身是变化的或者对于不同个体有不同值得特征或条件 常量:本身不变且对不同的个体的值也相同
参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到 比例:全组中取值为X的比例,p=f/N
插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化 统计量:描述样本的数值,与参数的获得方式相同
随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等 取样误差:样本统计量与相应的总体参数之间的差距
偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应 次数分布:一批数据在某一量度的每一个类目所出现的次数情况
离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在
连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分
(2)学习建议
①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学。 ②一定要将统计方法与心理学研究的情景结合起来学习。
③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础。 ④做题按照推荐格式能避免出错几率。 (3)统计检验总表
数据类型 单样本问题 独立样本比较 相关样本比较 多组样本的比较 独立样本 重复测量 相关问题 Pearson 积差相关 转化为顺序型 Spearman 等级相关 χ2独立性检验
等 总体单样本t/z 距 正态检验 型 分布 分布大样本下形态的相应的未知 t/z检验 顺序型 符号检验
法
命名型
χ2匹配度
检验
独立样本相关样本t 独立样本重复测量t/z 检验 方差分析 方差分析 检验 大样本下大样本下转化为顺序型 的相应的的相应的tt/z检验 检验
曼-惠特尼 维尔克松 克-瓦氏单弗里德曼U检验 T检验 向 双向等级
方差分析 方差分析
χ2独立性符号检验χ2独立性检验 检验 法
1
一、描述统计
描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。 (一)统计图表
统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点。它们是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:
①数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列 ②统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去 1.统计图
统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式 组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注 分类:条形图、圆图、线性图、直方图、散点图、茎叶图 2.统计表
统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式
组成:隔开线、表号、名称、标目、数字、表注 分类:简单表、分组表、复合表 (二)集中量数
集中量数又叫集中趋势,是体现一组数据一般水平的统计量。它能反映频数分布中大量数据向某一点集中的情况。 1.算数平均数
(1)定义
算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数 平均数一般与标准差、方差相结合使用。
2
n?X?i?1XiN
(2)特点
①在一组数据中每个变量与平均数之差的总和等于零
②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C (3)意义
算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。 (4)优缺点
优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响
缺点:易受极端数据的影响、不能在出现模糊数据时计算 2.中数
(1)定义
中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小,等价于百分位数是50的那个数。 (2)算法
①数列总个数为奇数时,第 (n+1)/2 个数就是中数
②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数
③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法
(3)优缺点
优点:计算简单、容易理解、不受极端值影响、能在有模糊数据情况下使用、可在顺序型数据时使用
缺点:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算 3.众数
(1)定义
众数:在次数分布中出现次数最多的那个数的数值
众数可能不只一个。在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间。 (2)优缺点
优点:能在数据不同质的情况使用,能避免极端值干扰
缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算
3
(三)差异量数
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1.离差与平均差
离差:分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表示了它们之间的绝对距离 离差之和始终为零。
x?X??
平均差:次数分布中所有原始数据与平均数绝对离差的平均值
A.D.??Xi?Xn
2.方差与标准差
和方:每一个离差值平房求和
由于离差正负值互相抵消无法代表离中趋势我们引入和方的概念
SS???X???2??X2???XN?2
(1)总体的方差和标准差
方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数
22
作为样本统计量用符号s表示,作为总体参数用符号σ表示,也叫均方。
?2?SSN
标准差:方差的平方根
作为样本统计量用符号s表示,作为总体参数用符号σ表示。
???2 (2)样本的方差和标准差
样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:
S2?SSn?1
4
S?S2
(3)性质
①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差 ②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数
(4)意义
方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数,它们的优点有:
反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了 3.变异系数
当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。
①两个或两个以上样本所使用的观测工具不同,所测的特质相同
②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大
差异系数:一种最常用的相对差异量,为标准差对平均数的百分比
CV?sX?100%
(四)相对量数
1.百分位数
百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数
百分位数和百分等级是同一操作定义的两端。当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分 别为百分位数和百分等级。 2.百分等级
百分等级:常模团体中低于该分数的人所占总体的百分比
百分等级一定要对应分数区间的精确上限。百分等级和百分位数都可以由已知数据用差值法求解。
5