好文档 - 专业文书写作范文服务资料分享网站

统计学 贾俊平 考研 知识点总结

天下 分享 时间: 加入收藏 我要投稿 点赞

十八、残差分析的作用:

(1)用于判断有关模型的假定是否成立(如误差项ε的假定是否成立) (2)用于分析回归中的异常值和对模型有影响的观测值

十九、影响区间宽度的因素

(1)置信水平(1-?),区间宽度随置信水平的增大而增大。 (2)数据的离散程度(s),区间宽度随s的增大而增大 (3)样本容量,区间宽度随样本容量的增大而减小

(4)用于预测的 与 的差异程度,区间宽度随 与 的差异程度的增大而增大

第十一章 多元线性回归

一、解释多元线性回归模型、回归方程、和估计的多元回归方程的含义

(1)多元线性回归模型:描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 ? 的方程,称为多元回归模型。涉及 p 个自变量的多元回归模型可表示为

y= + + +…+ +

? 其中, 、 、 、 是参数,? 是误差项

(2)回归方程:描述因变量 y 的平均值或期望值如何依赖于自变量 、 、 的方程; 多元线性回归方程的形式为

E( y ) =

(3)估计的多元回归方程:由于回归方程中的 、 、 。。 是不知道的, 需要利用样本数据去估计它们,当我们用用样本统计量 、 、 。。 估计回归方程中的 参数 、 、 。。 时就得到了估计的多元线性回归方程,其一般 形式为: = + + +…+ 、 、 。。 被称为偏回归系数

二、多元线性回归模型中,对误差项 有三个基本假定:

(1)误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 、 、 的值,y 的期望值为 E( y ) = (2)对于所有的 、 、 值,ε的方差σ2 都相同

(3)误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 )独立性意味着对于自变量 、 、 的值,它所对应的ε与其他 、 、 的任意一组其他值所对应的ε不相关。正态性意味着对于给定的 、 、 的值,因变量y也是一个服从正态分布的随机变量

三、多元线性回归模型中的基本假定

(1)误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 、 、 的值,y 的期望值为 E( y ) = (2)对于所有的 、 、 值,ε的方差σ2 都相同

(3)误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 )独立性意味着对于自变量 、 、 的值,它所对应的ε与其他 、 、 的任意一组其他值所对应的ε不相关。正态性意味着对于给定的 、 、 的值,因变量y也是一个服从正态分布的随机变量

(4)自变量 、 、 是非随机的,固定的且相互之间互不相关(无多重共线性)

四、若这些假定不成立的应对方法?

(1)若模型中存在多重共线性,解决的方法是:第一、将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关 ;第二、如果要在模型中保留所有的自变量,则应 避免根据 t 统计量对单个参数进行检验 ;对因变量值的推断(估计或预测)的限定在自变量样本值的范围内

(2)若模型中存在序列相关时,解决的方法有:如果误差项ε不是相互独立的,则说明回归模型存在序列相关性,这时首先要查明序列相关产生的原因,如果是回归模型选用不当,则应改用适当的模型;如果是缺少重要的自变量,则应增加自变量;如果以上两种方法都不能消除序列相关性,则需要采用迭代法,差分法等方法处理。 (3)若模型中存在异方差时,解决的方法有:当存在异方差时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。

五、多元回归中为什么需要用修正的判定系数来比较方程的拟合程度?如何计算

由于自变量个数的增加,将影响到因变量中被估计的回归方程所解释的变差数量。当增加自变量时,会使得预测误差变得比较小,从而减少残差平方和SSE,由于回归

平方和SSR=SST-SSE,当SSE变小时,SSR就会变大,从而使R 2变大。如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R2也会变大。因此,为避免增加自变量而高估R2,统计学家提出用样本容量n和自变量p去修正R2,计算出修正的多重判定系数。修正后的判定系数不会由于模型中自变量个数的增加而越来越接近于1。

其计算公式为:

六、解释多重判定系数R2和调整的多重判定系数的含义和作用?

(1)多重判定系数:是指回归平方和占总平方和的比例。多重判定系数是估计多元线性回归方程拟合程度的度量,反映了在因变量取值的变差中,能被估计的多元回归方程所解释的比例,计算公式为 = =1-

(2)修正的多重判定系数:是指用样本容量n和自变量的个数p修正的多重判定系数。它同时考虑了样本容量和模型中参数的个数p的影响,这就使得 的值永远小于 ,而且 的值不会由于模型中自变量个数的增加而越来越接近1。

七、多元线性回归中,为什么对整个回归方程进行检验后,还要对每个回归系数进行检验?

线性关系的检验主要是检验因变量同多个自变量的线性关系是否显著,在p个自变量中,只要有一个自变量同因变量的线性关系显著,F检验就通过,但这不一定意味着每个自变量同因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否显著。如果某个自变量没有通过检验,这就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放入回归模型中了。

八、F检验和t检验的区别:

在一元线性回归中,线性关系的检验(F检验)和回归系数的检验(t检验)的等价的,但在多元回归中,这两种检验就不再等价。线性关系的检验主要是检验因变量同多个自变量的线性关系是否显著,在p个自变量中,只要有一个自变量同因变量的线性关系显著,F检验就通过,但这不一定意味着每个自变量同因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否显著。如果某个自变量没有通过检验,这就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放入回归模型中了。

九、多重共线性及产生的问题(即多重共线性对回归分析的影响)

(1)含义:指回归模型中两个或两个以上的自变量彼此相关时,称回归模型中存在多重共线性 (2)存在的问题:

首先、可能会使回归的结果造成混乱,甚至会把分析引入歧途 ;

其次、可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们与其的正负号相反

十、如何识别多重共线性:

检测多重共线性的方法很多,其中最简单的一种方法是计算模型中各自变量之间的相关系数,并对各相关系数进行显著性检验,如果有一个或多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题。具体的说,如果出现下列情况,暗示存在多重共线性: ( 1)模型中各对自变量之间显著相关。

(2)当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著 (3)回归系数的正负号与其的相反

十一、多元线性回归中选择自变量的方法有哪些:

在多元线性回归中,变量选择的方法主要有:向前选择、向后删除、逐步回归、最优子集

(1)向前选择是从模型中没有自变量开始,不停的向模型中增加自变量,直至增加自变量不能导致SSE显著增加(这个过程通过F检验来完成)为止

(2)向后删除是与向前选择相反,一直将自变量从模型中删除,直至删除一个自变量不会使

SSE显著减小为止,这时,模型中所剩的自变量都是显著的。

(3)逐步回归是向前选择和向后回归的结合,不停的增加变量并开了剔除以前增加的变量的可能性,直至增加变量已经不能导致SSE显著减少

第十一章 事件序列分析和预测

一、时间序列预测的程序

在对时间序列进行预测时,通常包括以下步骤:

(1)确定时间序列所包含的成分,也就是确定时间序列的结果 (2)找出适合此类时间序列的预测方法

(3)对可能的预测方法进行评估,以确定最佳预测方案 (4)利用最佳预测方案进行预测

二、简述平稳序列和非平稳序列的含义

(1)平稳序列是指基本上不存在趋势的序列。平稳序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,而其波动可以看成是随机的。

(2)非平稳序列是指包含趋势性、季节性或周期性的序列,它可以是只含有其中的一种成分,也可能是几种成分的组合。非平稳序列又可以分为有趋势的序列,有趋势、季节性和周期性的序列,即复合型序列

三、时间序列的构成要素

(1)时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,称为趋势,也称长期趋势

时间序列在一年内重复出现的周期性波动,称为季节变动

(2)时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动,称为周期性,或称循环波动

(3)时间序列中除去趋势、周期性和季节变动之后的偶然性变动,称为随机性,也称不规则变动

这样,可以将时间序列的构成要素分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则变动(I)

四、增长率分析中应注意的问题

统计学 贾俊平 考研 知识点总结

十八、残差分析的作用:(1)用于判断有关模型的假定是否成立(如误差项ε的假定是否成立)(2)用于分析回归中的异常值和对模型有影响的观测值十九、影响区间宽度的因素(1)置信水平(1-?),区间宽度随置信水平的增大而增大。(2)数据的离散程度(s),区间宽度随s的增大而增大(3)样本容量,区间宽度随样本容量的增大而减小(4)用
推荐度:
点击下载文档文档为doc格式
6qq1m8wyx33gyk618jsm0fvam2gyzr007ee
领取福利

微信扫码领取福利

微信扫码分享