GARCH模型案例
1.数据选取与时段选择
本案例以上证指数为例,通过ARCH/GARCH模型研究我国证券市场的波动性规律。尽管上证指数从1990年12月9日开始公布,但由于在开始阶段,进入流通的样本股票数量少,而且交易制度不完善,股票投机性强,所以股市异常波动性太大。1996、1997年以后,这种异常波动趋于平稳,上证指数方差变化指小于0.03。考虑到我国股市制度变化对收益变化有很大影响,因此在时段选择上还要考虑股市交易制度的变化。为了保证股市稳定,防止过度投机行为,中国股票市场交易1996年12月6日开始实行T+1交易制度,以及实施涨跌停板限制。综合以上因素,把数据分析时段选择为1998年1月1日至2007年9月28日,共2350个数据。
2.波动率及其特征
金融资产收益率的波动性在证券、期权交易中是一个重要因素,它是标的资产的条件方差。波动率在风险管理中也是重要的,它为计算资产的在险价值(VaR)提供了一个简单的方法。一般来说,波动率不能被直接观测到,但它也具有一些特征值得研究。这些特征包括:(1)波动率存在聚类性,也就是波动率可能在一些时间段上较高,而在另一些时间段上较低;(2)波动率以连续方式变化,波动率的跳跃现象是少见的;(3)波动率是平稳的,不会发散到无穷,而是在一定范围内随时间连续变化;(4)波动率对利好消息和利空消息的反应是不同的,即存在杠杆效应。
3.数据基本分析
本案例研究的收益率形式为日对数收益率,即
其中,为上证指数当日收盘点位,
为其前日收盘点位,其时序图如下所示:
对收益率数据进行初步分析得当的结果如下表所示: 均值 0.000654 最大值 0.09404 最小值 -0.092554 标准差 0.0149 偏度 0.045533 峰度 8.003 J-B检验值 2451.654 从表中数据可以看出,股指日对数收益率的均值很小,可以认为是0。收益率的分布具有正的偏度,所以分布的尾部略向右拖,表明盈利的概率要大于亏损的概率。峰度值大于正态分布的峰度(正态分布的峰
度为3),这反映了收益率分布具有尖峰厚尾的特征。下面再进行上证指数时序特征分析。观察上证指数时序图,收益率的确存在明显的聚类效益(即一次大的波动后往往伴随着另一次大的波动)。对其进行不包含截距项和趋势项的ADF单位根检验,得到的结果如表所示,表明日对数收益率序列在各个显著性水平下都是平稳的,图()是序列的自相关图和偏自相关图,Q统计量显示序列在3阶以后基本不存在自相关现象,因此可以用AR(3)模型拟合收益率序列,使用软件估计模型得到:
(2.835)
ADF统计量 -47.48441
1%临界值 -2.565947 5%临界值 -1.940959 D.W.=1.96 10%临界值 -1.616609
在此基础上进行条件异方差检验,主要使用Engle提出的ARCH-LM检验方法。ARCH-LM检验的原假设是残差序列中直到p阶都不存在ARCH效应,能够得到两个检验统计量:(1)F统计量是对所有残差平方的滞后的联合显著性所作的一个省略变量检验;(2)渐近服从ARCH(q) 1 2 3 4
统计量是Engle’s LM检验统计量,一般情况下
分布。在本案例中,检验结果如下表所示,表明日对数收益率序列的确存在条件异方差现象。
LM统计量 28.97134 49.64832 100.5029 195.8411
概率 0.000000 0.000000 0.000000 0.000000
结论 存在异方差 存在异方差 存在异方差 存在异方差
4.建立GARCH模型
通过对对数收益率数据的简单分析,收益率序列存在明显的异方差性,应该考虑建立ARCH/GARCH模型。由于GARCH模型具有比ARCH更优秀的性质,例如它比ARCH模型需要更小的滞后阶数,并有与ARMA模型相似的结构,因此本案例直接建立GARCH模型。建立GARCH模型通常包括三个步骤:(1)建立均值方程(例如ARMA),以分离出数据中任何线性相关成分;(2)确定GARCH(p,q)模型的结构。与ARCH模型不同,GARCH模型的阶数较难确定,在实际应用时,一般只会用到低阶的GARCH模型,如GARCH(1,1)、GARCH(1,2)、GARCH(2,1)等。在针对金融时间序列分析的研究中,有两类模型经常用到,
包括GARCH(1,1)模型和GARCH(1,1)~t模型。其中后者是指随机扰动项服从t分布的情况,能更好地刻画一些金融时间序列的波动性和高峰厚尾现象;(3)检验拟合的GARCH模型,对其进行必要的修正。 本案例的建模过程也遵循这一步骤,直接使用上面的AR(3)作为均值方程,在此基础上建立GARCH(1,1)模型,模型形式为:
,
,,
为待估参数,使用软件估计得到:
(6.55) (12.897) (82.64) 需要特别指出的是,均值方程伴有GARCH方程以后,方程中的某些项通常常失去显著性。为了进行比较,表给出了分别在正态分布、t分布和广义误差分布假设下的估计结果: 分布类型 正态分布 (2.085) t分布
(3.576) 广义误差分布 (3.530)
(3.756) (12.897) (82.64)
(3.82) (6.266) (44.84) (6.55) (12.897) (82.64) 均值方程
GARCH方程
不难看出,在随机干扰项服从t分布或者广义误差分布的假设下,均值方程的参数显著性都比服从
正态分布假设条件下要高,进一步验证了金融时间序列具有高峰厚尾的特点。
5.模型结果分析
在本案例针对上证指数日对数收益率拟合的一组GARCH(1,1)模型都具有以下几个共同特征: (1)模型中的
系数都较大,并且通过了显著性检验,说明指数波动具有“长期记忆性”,即过去价
格的波动与其无限长期价格波动的大小都有关系。
(2)GARCH方程中
接近于1,表明条件方差函数具有单位根和单整性,也就是说条件方差波
动具有持续记忆性,说明证券市场对外部冲击的反应以一个相对较慢的速度递减,股市一旦出现大的波动
在短时期内很难消除。
(3)GARCH方程中
,说明收益率条件方差序列是平稳的,模型具有可预测性。
6.GARCH模型改进
在进行金融时间序列分析时还经常用到GARCH-M模型和EGARCH模型。前者将条件方差项引入均值
方程,表明了风险与预期收益存在紧密联系;后者则为研究条件方差的非对称性提供了便利的分析工具。此外,EGARCH模型放宽了传统GARCH模型中对参数的非负限制,而且由于EGARCH模型的条件方差方程是的一次函数,可以比较好地判断波动源的持续性。
首先建立GARCH(1,1)-M模型,模型形式为:
(1)正态分布假设下:
(2.054) (2.312)
(6.460) (12.382) (81.854) (2)在t分布假设下:
(2.054) (2.233)
(3.781) (6.27) (44.82) (3)在广义误差分布假设下:
(3.406) (2.632)
(3.708) (6.583) (45.33)
在各种分布假设下,均值方程中的都具有显著性,表明了证券市场的预期收益与风险成比例,即风险
越大,期望收益越大。 下面再建立EGARCH(1,1)模型,模型形式为:
使用软件估计得到:
(1.987)
(-8.72) (-5.237) (12.85) (200.95)
条件方差方程中,各项参数都通过了显著性检验。其中参数
,说明信息作用是非对
称的,具有明显的杠杆效应,即股市受负冲击要比正的冲击引起更大的波动。信息冲击曲线(图)也可以反映出相同的结论,这条曲线在信息冲击小于0时,也就是代表负冲击时,比较陡峭,而在正冲击时则比较平缓,这说明了负冲击使得波动性的变化更大一些。