稳健的变量选择方法及其应用
樊亚莉1, 徐群芳2
【摘 要】摘要:在已有的变量选择方法和稳健估计方法的基础上,提出了一种针对纵向数据的稳健的变量选择方法,通过模拟衡量其稳健性,并将其应用到一组实际的纵向数据分析中.模拟和实例分析结果表明,提出的稳健的变量选择方法在选择变量、估计变量系数的同时,对数据中可能存在的异常值有明显的抵抗作用.
【期刊名称】上海理工大学学报 【年(卷),期】2013(035)003 【总页数】5
【关键词】惩罚函数;估计方程;稳健性;变量选择
统计学的中心任务是对观测到的因变量和自变量进行建模,从而对因变量在未来的取值进行预测和一些统计推断.在现实问题的数据中往往会含有多个自变量,如果建立的模型中含有多余的自变量,不仅会引起过度拟合,还会影响估计的精度和估计的效率[1].因此,如何选择出真正对因变量有影响的自变量是建模过程中值得关注的问题.另一方面,如果数据中存在异常值,这些个别的异常值也会对模型中参数的估计造成很大的影响[2].
针对上述两个问题,统计学家们作了大量的研究.一方面,对于变量选择问题,统计学方法已经由古典的子集选择方法发展到近年来的系数压缩方法[3].文献[4]提出的带有光滑截断绝对差的惩罚似然方法(SCAD)能够将变量选择和对回归系数的估计同时进行,这大大缩减了传统的AIC(Akaikes infotmation critetion)、BIC(Bayesian informationcriterion)等方法的计
稳健的变量选择方法及其应用
稳健的变量选择方法及其应用樊亚莉1,徐群芳2【摘要】摘要:在已有的变量选择方法和稳健估计方法的基础上,提出了一种针对纵向数据的稳健的变量选择方法,通过模拟衡量其稳健性,并将其应用到一组实际的纵向数据分析中.模拟和实例分析结果表明,提出的稳健的变量选择方法在选择变量、估计变量系数的同时,对数据中可能存在的异常值有明显的抵抗作用.
推荐度:
点击下载文档文档为doc格式