格兰杰因果关系检验的步骤
(1)将当前的y对所有的滞后项y以及别的什么变量(如果有的话)做回归,即y对y的滞后项yt-1,yt-2,…,yt-q及其他变量的回归,但在这一回归中没有把滞后项x包括进来,这是一个受约束的回归。然后从此回归得到受约束的残差平方和RSSR。
(2)做一个含有滞后项x的回归,即在前面的回归式中加进滞后项x,这是一个无约束的回归,由此回归得到无约束的残差平方和RSSUR。
(3)零假设是H0:α1=α2=…=αq=0,即滞后项x不属于此回归。 (4)为了检验此假设,用F检验,即:
它遵循自由度为q和(n-k)的F分布。在这里,n是样本容量,q等于滞后项x的个数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
(5)如果在选定的显著性水平α上计算的F值超过临界值Fα,则拒绝零假设,这样滞后x项就属于此回归,表明x是y的原因。
(6)同样,为了检验y是否是x的原因,可将变量y与x相互替换,重复步骤(1)~(5)。
首先将选定指标(xxx,xxx)对上证指数收益率及标志性股票收益率进行格兰杰因果检验,确定指标与收益率之间是否有因果关系,并以此作为筛选指标的标准。
为了排除其他其他有效变量对残差的影响,将股票收益率预测的几个常用指标(波动率,var,市净率,巴拉巴拉)加入通过格兰杰因果检验的市场情绪指标,一并进行主成分分析(选择主成分分析的原因是这些常用市场预测指标与市场情绪有符合常识的相关性),并选出解释度高的主成分,推算出关于选定指标的回归方程。即为情绪指标的预测模型。
将预测模型对一千天的数据进行回顾测试,用方差分析检验二者之间是否存在显著差异;再选择市场情绪发生重大波动的特殊时段进行测试,方差分析检验二者是否存在显著差异。若存在显著差异,考虑滞后影响和变量形态(比如变量的平方),进一步调整模型,直到得到满意的结果(比如置信度99.99%)