基于不定核LS-SVM模型的公司违约概率预测
李 昊1,梁 州1,黄 迅2,林 宇1(教授)
【摘 要】【摘要】以短期融资券为研究对象,构建基于信用利差的公司违约概率样本,并将传统正定核最小二乘支持向量机(LS-SVM)模型拓展到不定核LS-SVM模型对公司违约概率展开合理预测分析,进而对不定核LS-SVM模型与正定核LS-SVM模型以及Logistic模型进行了全行业以及分行业公司违约概率的预测精度对比。实证结果表明,基于不定核LS-SVM模型的公司违约概率预测模型无论在全行业还是在分行业中均展现出最优的预测性能,且具有更为优异的稳健性。
【期刊名称】财会月刊(会计版) 【年(卷),期】2018(000)014 【总页数】7
【关键词】【关键词】不定核;LS-SVM;公司违约概率;短期融资券;信用利差
一、引言
近年来,我国债券市场实现了大幅度的跨越式发展,2016年全年发行债券35.6万亿元,同比增长56.1%,各类债券余额同比增长30.7%,达到了63.8万亿元,约占GDP比重的85.7%。然而,在债券市场迅猛发展之际,受过度投资、缺乏有效风险管理、信息不对称、投机氛围浓厚等复杂因素的综合影响,自2014年“11超日债”违约开始,“15五洋债”“15机床MTN001”等众多公司违约事件近年来不断涌现[1]。这不仅扰乱了我国债券市场的既定秩序,给投资者带来严重损失,甚至还可能诱发系统性风险,阻碍整个经济社会的健
康发展。因此,科学开展对我国债券市场公司违约概率的预测研究,对于公司经营者以及监管层防范和化解风险与危机具有重大而深远的意义。
相当长时期以来,学术界与实务界已不遗余力地开发出Credit Risk+、逻辑(Logistic)回归、概率比(Probit)回归、KMV、人工神经网络(Artifical Neural Network,ANN)等一系列模型对公司的违约概率进行了广泛而深入的研究[2][3][4][5][6]。虽然相关研究取得了令人满意的成果,但是上述模型却都存在前提条件过于苛刻、过学习、局部最小值等问题[7]。令人欣喜的是,支持向量机(Support Vector Machine,SVM)却正好拥有解决这些问题的突出优势,使其具有更为优异的泛化推广能力,从而自其被提出以来,就受到广大学者的青睐并被广泛运用于金融领域的研究之中[8]。并且在传统SVM的基础上,学者们还进一步研究出具有更高运算速度和更强抗干扰能力的最小二乘SVM(Least Square Support Vector Machine,LS-SVM)对公司违约概率进行预测研究,且取得了较为瞩目的研究成果[9]。因此,本文引入LS-SVM模型对公司违约概率进行预测研究,从而为监管部门以及公司管理层防范风险提供合适的操作工具。
对于公司违约概率预测研究的重点在于构建LS-SVM模型,而构建LS-SVM模型的关键又在于对核函数(Kernel Function)的选取[10]。虽然目前研究均使用正定核(Positive Kernel)来构建LS-SVM模型[11],但是基于样本数据集所构建的正定核矩阵的特征值往往为正,特征值为负的情形从未被纳入核矩阵的构建中。随着经济一体化与金融全球化的深入推进,各国金融市场间的联系日益紧密,金融市场数据也呈现出更为复杂的结构特征,从而导致基于金融市场数据集所构建核矩阵的特征值出现负值的情况普遍存在,如果仍然使用正定
核对金融市场数据集进行核矩阵的构建,将很可能无法刻画金融市场数据的复杂结构特征,从而造成构建的LS-SVM模型出现预测偏误,导致公司违约概率预测研究的失败[12]。令人欣慰的是,随着对核函数的深入探索,有部分学者另辟蹊径,探索出不定核(Indefinite Kernel)这一新颖的核函数构建方法,能够根据样本数据集的复杂结构特征自适应地构建特征值或正或负的核矩阵,从而更为有效地提升LS-SVM的预测性能,不定核相较传统正定核所具有的上述明显优势,也在实证研究中获得了充分的验证[13]。因此,本文将构建基于不定核的LS-SVM模型,以期为公司的违约概率预测奠定坚实的理论基础与工具保障。
基于以上分析与认识,本文以短期融资券作为研究对象,以交叉验证(Cross Validation,CV)作为模型的训练方法,将传统正定核LS-SVM模型拓展为不定核LS-SVM模型对公司违约概率开展预测研究,并将不定核LS-SVM模型与其他预测模型进行预测性能的比较研究,进而针对在国民经济中位于重要地位的违约风险高发行业,对不定核LSSVM模型的稳健性进行考察。
二、文献综述
迄今为止,就所掌握的文献而言,已有学者将LS-SVM模型运用于金融领域进行预测建模。Zhu等[14]将经验模态分解(Empirical Mode Decomposi?tion,EMD)与LS-SVM模型相结合,提出了EMDLSSVM-ADD模型,并对碳价格进行了预测研究。更进一步地,在LS-SVM模型下运用不定核的研究中,Huang等[15]在LS-SVM模型的框架下,基于UCI训练集,将不定核与正定核进行对比,实证研究表明,不定核LS-SVM模型在某些UCI数据集下要显著优越于正定核LS-SVM模型。而在围绕债券市场公司违约概率的研究中,尽管