? 陈强,《高级计量经济学及 Stata 应用》课件,第二版,2014 年,高等教育出版社。
第 11 章 二值选择模型
11.1 离散被解释变量的例子
二值选择(binary choices):考研或不考研;就业或待业;买房或
不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回国;战争或和平;生或死。
多值选择(multiple choices):对不同交通方式的选择(走路、骑车、坐车上班);对不同职业的选择。
这类模型被称为“离散选择模型”(discrete choice model)或“定
1
性反应模型”(qualitative response model)。有时被解释变量只能取非负整数:
企业在某段时间内获得的专利数;某人在一定时间内去医院看病的次数;某省在一年内发生煤矿事故的次数。
这类数据称为“计数数据”(count data),被解释变量也是离散的。考虑到离散被解释变量的特点,通常不宜用 OLS 进行回归。
2
11.2 二值选择模型
假设个体只有两种选择,比如y ? 1(考研)或y ? 0(不考研)。所 有 解 释 变 量 都 包 括 在 向 量 x 中 。“线性概率模型”(Linear Probability Model,简记 LPM):
yi ??xi???? ?i (i ? 1, ?, n)
优点:计算方便,容易得到边际效应。
缺点:(1)由于?i ? yi ? xi?? ,故?i ? 1 ? xi?? 或?i ? ? xi?? ,因此?i 必 然与xi 相关,导致估计不一致。
3
(2) ?i 服从两点分布,而非正态分布。
(3) 由于Var(?i ) ? Var( xi?β) ,故扰动项?i 的方差依赖于xi ,存在异方差(故应使用稳健标准误)。
(4) 可能出现y? ? 1或y? ? 0的不现实情形,参见图 11.1。
4
图 11.1 OLS 与二值选择模型
5