精品
第一章 气象资料及其表示方法
一、
数据资料的统计特征
要素样本中资料分布的特点----用一些统计量表征。 1、 平均值
含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。 2、 距平
含义:反映数据偏离平均值的状况 ,也是通常所说的异常。 **中心化**
概念:把资料处理为距平的方法叫中心化 特性:距平值的平均值为0,使用方便;
直接作为预报值,比较直观(偏高/偏低)。 3、 方差和均方差(标准差)
含义:
是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值
是方差。
的平均变化程度(离散程度),
标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。
累积频率:变量小于某上限的次数与总次数之比。 二、
总体和样本
1、 总体(母体):统计分析对象的全体。 2、样本:总体中的一部分。
感谢下载载
精品
三、数据的标准化
各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)。
证明:
(1)标准化变量的平均值为0。 (2)标准化变量的方差为1。
峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
三、
状态资料和统计特征
1. 状态资料(离散型随机变量)
表征气象要素的各种状态,观测结果无法用数据表示。 2. 频率表、分布列----------列出各个状态出现的频率。 对样本而言是频率表,总体而言就是分布列。 四、
多要素的气象资料
两个方面来研究问题:
感谢下载载
精品
“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。(行) “Q型分析”:研究样本之间的关系(列)。 五、
统计量---协方差和协方差矩阵
1. 协方差
衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)
(距平的内积)
反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。
变量自身的协方差就是方差
协方差带单位,不同要素之间不好比较,相关系数可解决这个问题。 2. 协方差矩阵
m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。 六、
区域资料的整理和利用
(1)代表站方法---平均相关系数最大的站
(2)区域平均法---区域平均值要与周围格点(站点)值区别大 (3)综合指数法(各站点要素方差差异较大)
<越大,异常越明显>
i表示区域内台站,j表示观测资料的年代
第二章 选择最大信息的预报因子
感谢下载载