第一类错误的概率为a
被称为显著性水平
第二类错误(取伪错误)
原假设为假时接受原假设
第二类错误的概率为b (Beta) H0 检验 # H0为假 第二类错误(b) 正确决策 (1-b) 决策 实际情况 H0为真 不拒绝H0 !正确决策 (1 – a) 第一类错误(a) 拒绝H0
4、假设检验的思路和程序; 假设检验的步骤
提出假设 # 确定适当的检验统计量 规定显著性水平a 计算检验统计量的值 作出统计决策
5、双侧检验与单侧检验的判断和执行; 双侧:
1. 属于决策中的假设检验 2. @ 3. 不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施
4. 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格
我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立
5. 建立的原假设与备择假设应为
H0: m = 10 H1: m 1 10 单侧:
1. 将研究者想收集证据予以支持的假设作为备择假设H1
例如,一个研究者总是想证明自己的研究结论是正确的 : 一个销售商总是想证明供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致
2. 将研究者想收集证据证明其不正确的假设作为原假设H0 3. 先确立备择假设H1
(单侧的备择假设是支持自己反对别人)
6、一个总体的均值、比例的单侧与双侧检验 P192 特殊:未知总体方差小样本为t分布
-
第九章 相关与回归(大题,软件应用分析)
1、相关的概念与种类
(1)函数关系与相关关系的联系与区别 函数关系:
1. 是一一对应的确定关系 2. 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 3. 各观测点落在一条线上 相关关系的例子
& 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系
区别:
1、函数关系中两变量之间的关系是确定的 相关关系中两变量之间的关系是不确定 )
2、函数关系变量之间关系可以用方程y = f (x)表示出来 相关关系不能用一定的方程表示
3、函数关系是相关关系的特例,函数关系是完全的相关关系。(联系)
(2)相关关系的种类和判断 一、按相关的程度分为:
完全相关、不完全相关、不相关 二、按相关的方向分为: *
正相关、负相关 三、按相关的形式分为:
线性相关、非线性相关 四、按影响因素的多少分为: 单相关、复相关
2、会根据简单相关系数的数值和符号判断变量之间相关关系的种类和程度。 对两个变量之间线性相关程度的度量称为简单相关系数r。 1. > 2. r 的取值范围是 [-1,1] 3. |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
4. r = 0,不存在线性相关关系相关 5. -1r<0,为负相关 6. 0 7. |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 ; 3、相关分析与回归分析的区别与联系; (1)相关分析: 1. 从一组样本数据出发,确定变量之间的数学关系式 2. 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 (2) 区别: ①相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 ②相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 ③相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 — 4、拟合优度的计算:可决系数R2的含义及其计算公式; ……可决系数是评价两个变量之间线性相关关系强弱的重要指标。 r2?SSR?SST?y?i?i?1n?y??y?2??yii?1n?1??yi?i?1n?y??22??y?ii?1n?y?2……取值范围在 [ 0 , 1 ] 之间 ……r2 1,说明回归方程拟合的越好;r20,说明回归方程拟合的越差 ……判定系数等于相关系数的平方,即r2=(r)2 5、最小平方(和)法(最小二乘法):回归模型参数估计的思想; # 原数列的观测值与方程的估计值的离差平方和为最小 原数列的观测值与方程的估计值的离差总和为零 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任 何直线都小 6、一元线性回归方程系数的解释; ?0???y???1x 其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 … 重点掌握如何根据Excel回归结果分析回归方程,并利用回归方程进行点预测。 第十章 时间序列分析指标(重要) 1、时间序列的概念 (1)时间序列的含义 同一现象在不同时间上的相继观察值按时间先后顺序排列而成的数列,也称时间数列。 (2)时间序列的两个基本构成要素 一个是资料所属时间,一个是在一定条件下的统计指标数值。 . (3)时间序列的种类 绝对数数列(时期数列:一段时期内总量的排序、时点数列:某一时点上总量的排序)、相对数数列:一系列相对指标按时间顺序排列而成、平均数数列:一系列平均指标按时间顺序排列而成。 2、时间序列的水平分析指标 (1)发展水平与平均发展水平 前者:现象在不同时间上的具体指标数值(表中的每个数值),说明现象在某一时间上所达到的水平。 后者:某一现象总体在不同时间上取值的平均数,说明在一段时期内所达到的一般水平,不同类型的时间数列有不同的计算方法。 (2)平均发展水平的计算: ① 时期指标的序时平均数计算 、 直接加总算算术平均数 ②时点指标的序时平均数计算;P234 (1)根据每日时点资料计算 (2)根据间断相等的时点资料计算 (3)根据间断不等的时点资料计算(加权计算) ③相对数序列和平均数序列的平均数计算P236 (3)增长量与平均增长量 $ 前者:报告期水平与基期水平之差,说明现象在观察期内增长的绝对数量 后者:观察期内各逐期增长量的平均数 ,描述现象在观察期内平均增长的数量 3、时间序列的速度分析指标 (1)发展速度:定基与环比; 定基:报告期水平与某一固定时期水平之比:环比:报告期水平与前一时期水平之比: a1a2a3,,,a0a0a0,ana0 a1a2a3,,,a0a1a2,anan?1 (2)增长速度:定基与环比; 增长量与基期水平的比值。增长速度=发展速度-1 (3)平均增长速度=平均发展速度-1 (4)平均发展速度几何平均法求法(水平法) x?na1a2??a0a1?an?an?1n?x?nana0 4、计算和运用速度指标应该注意的问题:增长1%绝对值。 速度每增长一个百分点二增加的绝对量=前期水平/100 ?nR第十一章 时间序列预测方法(小题,非计算) 1、时间序列的各个影响因素的含义 ①长期趋势:由于某种根本原因的影响,在长时间内,持续增长或减少。 ② 季节变动:由于自然条件、社会条件的影响,在一定时期内岁季节的转变而引起周期性变动。如农业,空调衣着 ③ 循环波动:社会经济现象以若干年为周期波浪式的变动。虽长短不一,幅度不一致 ④不规则变动:由于意外偶然性因素引起的,突然发生的无周期随机拨动,如地震。 2、了解长期趋势预测的方法:时据扩大法;移动平均法;最小平方法(回归分析) 3、了解时间序列的季节变动分析 第十二章 统计指数(重要) 1、狭义指数与广义指数的含义 从广义上讲,指数是指反映社会经济现象总体数量变动的相对数; 从狭义上讲,指数是指反映不能直接相加的复杂社会经济现象在数量上综合变动情况的相对数 2、指数的分类P280
统计学原理韩兆洲期末考试复习提纲



