1.尊敬的各位老师,我的问题如下:多元回归分析中相关性分析和回归分析变量的符号不一致。回归分析的结果与论文预期一致,但相关分析结果相反。这样的结果正常吗?这是为什么?相关分析的符号与预期不一致,是不是说就没有必要做多元回归分析了?还是说相关分析的结果只是一个大致的检测,具体的关系还是要以回归分析为准。相关分析的符号与预期不一致,会影响后续进行多元回归分析吗?
2.老师您好。我想将家庭背景作为协变量,分析家庭背景Z(连续变量/分类变量)是如何影响阅读时间X(分类变量)和语文成绩Y(连续变量)的关系的。想得到在控制家庭背景变量之后不同阅读时间的语文均值,然后和控制家庭背景变量之前的不同阅读时间的语文均值进行比较。请问:我应该怎么操作才能得到这个结果呢?非常感谢。
1.相关系数和回归系数符号相反是可能发生的。因为相关分析关注的是两个变量之间的相关方向和相关程度,而没有考虑其他变量的影响。多元线性回归得到的系数是偏回归系数,考虑了其他控制变量的影响。如果确认数据不存在问题(没有离群值,进行了缩尾处理),那么可以考虑是否存在多重共线性,多重共线性的一个重要后果就是得到的系数符号相反。此外,由于控制变量中的某些变量遮掩(多元回归中的抑制现象(Suppression))主要变量,也可能发生符号相反的情况。两者符号不一致并不影响你进行分析,结果当然还是以回归分析为主。
2.分析家庭背景Z(连续变量/分类变量)是如何影响阅读时间X(分类变量)和语文成绩Y(连续变量)的关系可以通过交乘项来实现,通过交互项的系数来分析家庭背景的作用就行了,没必要根据你说的这样取均值。Stata的回归命令为: reg Y Z##i.X // Z为分类变量时 reg Y c.Z##i.X //Z为连续变量时
学术指导:张晓峒老师
本期解答人:曹晖老师 统计小妹 编辑:统计小妹 统筹:易仰楠 技术:林毅
互助问答第235问 相关分析和回归分析的符号以及协变量问题



