心统名词解释:
统计学:是研究如何搜集、整理、分析反映事物总体的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 教育统计学:是运用数理统计的原理和方法研究教育问题的一门应用科学。它提供各种统计方法的应用条件,对统计计算结果进行解释。 随机变量:表示随机现象各种结果的变量。 总体:是具有某(些)共同特征的总和。
样本:是从总体中抽取的作为观测对象的一部分个体。 描述性统计(Descriptive Statistics):研究如何整理实验或调查得到的大量数据,找出这些数据的分布特征。
集中量(CENTRAL TENDENCY):是代表一组数据典型水平或集中趋势的量。 (种类:平均数(MEAN) ; 中位数(MEDIAN) ; 众数(MODE)等) 中位数:是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。
众数:是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。
差异量:表示一组数据变异程度或离散程度的量称为差异量。
四分位数:将一组已排序的数据按个数四等分的百分数,分别是位于25%,50%,75%的百分位数。
相关量:相关系数?
相关:两个变量之间不精确、不稳定的变化关系。
推断统计(Inferential Statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。
二项分布:重复进行n次二项试验后不同成功次数x所对应的概率分布。 正态分布:如果随机变量X的概率密度函数为f(x)=(自己写公式),则称X服从正态分布。 t分布:又称“学生分布”,如果随机变量t的概率密度函数为f(t)=(自己写公式),则称t服从t分布。
自由度:总体参数估计量中变量值独立自由变化的个数。
简单随机抽样:从总体中完全以随机形式抽取若干个个体组成一个样本。在抽取过程中,总体中每个个体被抽到的概率是均等的,并且在任何一个个体被抽取之后总体内成分不变。 分层随机抽样:按有关的因素或指标经总体划分为互不重叠的几个层,再从各层中独立地抽取一定数量的个体,最后将从各层中抽取的个体合在一起,组成一个样本。
机械抽样:先将总体中的所有个体按顺序编号,然后每隔一定的间隔抽取个体,组成样本。 整群抽样:以整群为单位的抽样方法,即从总体中抽取的个体同属于某个群体。 标准误:样本统计量的标准差,例如:样本平均数的标准差。 点估计:根据样本的观察值计算出一个与θ相应的估计值,用这个估计值直接作为对参数θ的估计。
区间估计:根据样本的观察值计算出两个估计值θ1^和θ2^,,用区间(θ1^,θ2^)作为参数θ可能的取值范围,并指出参数θ落在这一区间的概率。 无偏性:若E(θ^)=θ,则θ^为θ的无偏估计量。(意思到了就OK) 有效性:多个无偏估计量中方差最小的最有效。(同上)
一致性:若limθ^(n→+∞)=θ,则称θ^为θ的一致估计量。(lim式子格式自己理一下)
相关样本:在样本之间有互相影响的条件下抽取的到的样本,两个样本内个体之间存在着一一对应的关系。 独立样本:分别独立抽取的样本,抽取其中任何一个样本都不会对抽取另一个样本产生任何影响,两个样本内个体之间不存在对应关系。 积差相关系数:表示两个呈线性关系的正态连续变量之间的相关程度的特征量,它是协方差除以两个变量的标准差所得的值。
等级相关系数:表示顺序水平的变量之间的相关程度的特征量。
肯德尔和谐/一致性系数:用来表示多个顺序水平的变量之间的相关程度的等级相关系数。常用于分析多个评定者对同一组个体进行等级评定的一致性程度,或同一个评定者对同一组个体进行多次等级评定的一致性程度。 回归分析:利用一个变量或一组变量的变化来估计或预测另一个变量或一组变量的变化情况。 非参数检验:不涉及总体参数的假设检验。
非参数检验的特点:①无须假定总体的分布形态,对资料的计量水平要求不高;
②适用于小样本;③方法简单易掌握。
X2(卡方)检验:是一种用途很广的计数资料的假设检验方法,属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。 X2(卡方)检验的特点:?
X2(卡方)值的特点:具有可加性、永远为正、大小随实际频数与理论频数差的大小而变化
X2(卡方)分布的特点:1.呈正偏态,右侧无限延伸,但永不与基线相交; 2.随自由度的变化而形成一簇分布形态;
3.自由度越小,卡方分布偏斜度越大,自由度越大,卡方分布形态越趋于对称。
先验概率(prior probability):是指根据以往经验和分析得到的概率,如全概率公式。 后验概率:是指在得到“结果”的信息后重新修正的概率,如贝叶斯公式。