广义线性模型的M-估计
冯敬海*1, 刘 茹菲1, 黄玉洁1,2
【摘 要】摘要:用M-估计来估计广义线性模型中的未知参数β.首先,在一定的假设条件下,根据已有的对广义线性模型中未知参数β的极大似然估计方法,应用大数定律及鞅中心极限定理,证明了广义线性模型的M-估计的两个重要性质,即相合性及渐近正态性.其次,将固定设计的思想引入M-估计,并与广义线性模型相结合,证明了其相合性及渐近正态性.最后通过数值模拟证明了估计的优良性.
【期刊名称】大连理工大学学报 【年(卷),期】2011(051)003 【总页数】5
【关键词】关健词:广义线性模型;M-估计;相合性;渐近正态性
0 引 言
广义线性模型在形式上是常见的正态线性模型的直接推广.它可适用于连续数据和离散数据,特别是后者,如属性数据、计数数据.这在实用上,尤其是生物、医学和经济、社会数据的统计分析上,有重要的意义.广义线性模型的个别特例起源很早.Fisher在1919年曾用过它.最重要的Logistic模型,在20世纪四五十年代Berkson、Dyke和Patterson等曾使用过.1972年Nelder等[1]引进广义线性模型一词,此后研究工作逐渐增加.1982年McCullagh等[2]出版了系统论述此专题的专著并于1989年再版.关于广义线性回归似然或拟似然方程解的存在与唯一和解的大样本性质,在文献[3~6]中已有很多讨论. 在广义线性模型问题的研究中参数估计一直是大家关注的焦点问题之一.文献
[7、8]用极大似然方法来估计广义线性模型的参数,文献[9]说明了用极大似然法估计未知参数时具有非稳健性,拟似然法也是如此.在统计实际应用中,估计的稳健性又是必须要考虑的.由于M-估计有较好的稳健性[10],于是本文采用M-估计来估计所提出的广义线性模型的参数,在适当的假设下,研究模型参数估计的强相合性与渐近正态特性.
1 概念及假设
考虑广义线性模型(generalized linear model)
参数空间H是有界闭集,β0为取值于H上的p维未知参数真值,且β0为H的内点.{X i,i∈N}为平稳遍历序列[11],εi为ε的样本,{εi}是独立同分布的误差,且{εi}与{Xs,s≤i}独立.F(·)为已知单调函数,F′(·)有界,v(·)为已知非负连续有界函数,并设上界为M0. 首先,给出如下假设:
(1)本文中所讨论积分和极限均可换序;
(2)设ρ(u)为已知的对称凸函数,ρ(0)=0,ρ(u)在正半轴上单调递增(可以增至+∞),且ρ″(u)有界,设上界为C1,由ρ(u)为凸函数知0≤ρ″(u)≤C1.令Mb(a)=E(ρ(a+bε)),并设对于任意b>0,Mb(a)在a=0时达到最小.由假设(1)知
令L(b)=E((ρ′(bε))2),并设L(b)连续;
2 主要结论及证明
2.1 准备知识及证明
在证明定理之前,先来证明下面的命题. 2.2 得到的定理及其证明
3 固定设计时的M-估计
在固定设计中,建立模型如下:
其中参数空间H、函数F(·)与v(·)的定义如前.此模型中,{x ni,i=1,2,…,n}为固定的p维向量组,且一致有界,x ni代表第n批第i次试验结果.{εni,i=1,2,…,n,n≥1}为独立同分布的随机变量组.记
4 数值模拟
在模型中,设X服从二元泊松分布,参数真值为β0=(β01β02)T,误差变量ε服从标准正态分布.用蒙特卡罗方法产生n个服从二元泊松分布的X与一元标准正态分布的ε,得到相应响应变量的值.再将该操作重复m次,算出平均误差作为模型误差.仿真结果见表1、2.
表1 仿真结果1(β0=(0.8 1)T,样本容量为100)
Tab.1 Simulation result 1(β0=(0.8 1)T,sample size is 100)
由上表可以看出,模型的M-估计具有良好的性能,不失为一个好的估计方法.
5 结 语
本文针对广义线性模型提出了对参数的M-估计方法,在适当的假设条件下证明了这种估计的强相合性与渐近正态性.最后通过数值模拟结果可以看出这种估计的优良性.本文提出的这一模型与估计方法在实用上,尤其是生物、医学和经济、社会数据的统计分析上有重要的意义. 参考文献:
[1]NELDER J A,WDDERBURN R W M.Generalized linear models[J].Journal of the Royal Statistical Society,1972,135(3):370-384 [2]MCCULLAGH P,NELDER J A.Generalized Linear Models[M].2nd