频数 5. 几种常用的统计指标与参数(重点)(计算及理解) (1)描述地理数据一般水平的指标 1)平均值 反映了地理数据一般水平。
2)中位数 ① 对于未分组的地理数据,样本数n为奇数时,中位数是位置排在第(n+1)/2位的数据;样本数n为偶数时,中位数是排在中间位置的两个数据平均值。 ② 分组的地理数据中位数的计算步骤 : 确定中位数所在的组位置,按公式计算中位数 3)众数:众数就是出现频数最多的那个数 (2)描述地理数据分布的离散程度的指标: 1)极差,指所有数据中最大值与最小值之差 2)离差,指每一个地理数据与平均值的差
3)离差平方和:从总体上衡量一组地理数据与平均值的离散程度
4)方差与标准差,从平均概况衡量一组地理数据与平均值的离散程度。 标准差为方差的平方根
5)变异系数,表示了地理数据的相对变化(波动)程度(计算) 6. 地理数据分布指数及其用途
(1)罗伦次曲线:首先使用累计频率曲线研究工业化的集中化程度。罗伦次曲线的上凸程度,就表示农户家庭经营性纯收入的部门集中化程度。上凸程度越大,就表示农户家庭经营性纯收入越是集中于某些产业部门。
(2)集中化指数:描述地理数据分布的集中化程度的指数。I越大,就说明数据分布的集中化程度越高
(3)基尼系数:用于对经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。(4)锡尔系数:锡尔系数越大,就表示收入分配差异越大;锡尔系数越小,就表示收入分配越均衡。
三、1. 相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。
2. 一元线性回归模型 假设有两个地理要素(变量)x和y,x为自变量,y为因变量。
y则一元线性回归模型的基本结构形式为 ??a?bx????? ?1,2,?,n式中:a和b为待定参数;为各组观测数据的下标;为随机变量。
????b?y?a?bxa记 和 分别为参数a与b的拟合值,则
代表x与y之间相关关系的拟合直线,称为回归直线; 是y 的估计值,亦称回归值。
3.时间序列的组合成份 ①长期趋势(T),是时间序列随时间的变化而逐渐增加或减少的长期变化之趋势。 ②季节变动(S),是时间序列在一年中或固定时间内,呈现出的固定规则的变动。 ③循环变动(S),是指沿着趋势线如钟摆般地循环变动,又称景气循环变动 ④不规则变动(R),是指在时间序列中由于随机因素影响所引起的变动 4. 聚类要素的数据处理
当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。
关于计量地理学考试重点



