京卫计网审[2015]第0523号 京ICP备14051922号 京ICP证160408号
京公网安备 11010502030806号 Copyright © 2014 北京易康医疗科技有限公司版权
发布时间:2016-07-04 | 来源: | 责任编辑:嗵嗵e研

在多重线性回归中,要满足各自变量间没有共线性,在线性回归中,可以在线性回归对话框“统计量”-“共线性诊断”查看。

在结果中,一般认为容忍度(SPSS中文译为“容差”)<0.1或方差膨胀因子(VIF)大于10时认为有共线性。
下面我们以一个例子说明共线性的诊断及处理。如下面数据,我们有11年的经济数据,我们想看总产量、存储量、总消费量与进口总额的关系。我们以进口总额(y)为因变量,以总产量(x1)、存储量(x2)、总消费量(x3)为自变量,进行多重线性回归,结果如下:
我们发现结果中,进口总额与总产量没有关系,而与存储量、总消费量正相关(方程中系数为正值),这与我们常识可能不符合,我们一般认为总产量应该会影响进口额,而存储量越高,进口应该减少。再看后面容差及VIF,发现有两个VIF超过180,即存在严重共线性。
从上面例子中也可以看出,共线性会影响结果的解读,即可能使某自变量的系数偏大或偏小,甚至改变系数正负号,如果我们使用前进或后退法筛选变量,可能导致我们认为有意义的变量被踢除方程。
怎么解决共线性问题呢?有几种方法供大家参考。
1.一般产生共性问题的两个或多个变量之间相关性r值达到0.9或更高,也即我们可以人为其中一个变量代表共线性的另外变量进行回归,即选择专业上认为有意义或更容易解读的变量进行回归。在前面例子中我们发现总产量与总消费量高度相关(r=0.997,见下图),我们可以选择这两个变量其中之一进行回归;
2.可以进行因子分析,用提取的公因子进行回归分析,因子分析过程较复杂,详细可以查看书籍;
3.进行岭回归分析。岭回归原理较难理解,感兴趣的可以查看相关资料。在SPSS可以作岭回归,但不能在菜单操作,需要调用安装文件下的岭回归程序。需要的话可以找统计专业人员咨询。
京卫计网审[2015]第0523号 京ICP备14051922号 京ICP证160408号
京公网安备 11010502030806号 Copyright © 2014 北京易康医疗科技有限公司版权