京卫计网审[2015]第0523号 京ICP备14051922号 京ICP证160408号
京公网安备 11010502030806号 Copyright © 2014 北京易康医疗科技有限公司版权
发布时间:2016-07-02 | 来源: | 责任编辑:嗵嗵e研

控制混杂因素的方法不只有配比法,在数据分析阶段,还可以使用分层分析和多因素回归的方法。另外还可以使用工具变量法控制无法观测到的混杂变量。
分层分析
如果在一个研究中,年龄是混杂因素,我们可以按照年龄分层(如50岁以下、50-70岁、70岁以上分成三层,也可以分更多层)。分层后在每层中的两组的年龄都相差不大,即认为每层中两组的年龄是平衡的,不会对结局产生影响,从而达到控制混杂因素的的目的,这种方法就是分层分析法。分层分析很容易理解,操作也比较简单,但不宜用于很多混杂因素的控制及连续变量的控制。当有多个因素时,分层太多,导致分析很繁杂。这时可以借助倾向评分法把多个混杂变量综合为一个混杂变量,即评分,再进行分层、配比等分析。
回归分析
在分析阶段,用于控制混杂因素的最常用的方法是多重回归分析法,包括了Logistic回归、COX回归、线性回归等,这些方法原理基本相同,操作也很简单,即把所有混杂变量和分组变量同时作为自变量进行回归。需要强调的是任何回归模型都是黑匣子,要注意模型的适用条件及模型稳定性
工具变量法
前面方法都是在讨论当混杂因素可以测量得到时如何控制,但在研究过程中,可能有一些因素不能直接测量或者有一引起未知的混杂因素,这时如何控制这类混杂因素呢?工具变量法可能是解决这类问题的一个方法。所谓工具变量就是与我们研究的因素高度相关,但与其它混杂因素无关,这样我们可以用工具变量代替我们研究的变量,观察其与结局的关系。
在研究和生活中我们也经常用到工具变量的思想。当一个要测量的指标无法直接测量或者测量成本较大时,我们可以用一个与其直接相关的指标代替它。这在宏观经济学中经常使用。例如我们要调查北京市常住人口,进行全市的调查当然可以,但成本较大。这时我们可以用食盐消耗量代替,因为平均每个人食盐食用量相差不大。在医学中我们以一个例子看看工具变量在医学中的应用。
例如一个研究中想观察是否进行新生儿监护与早产儿死亡率的关系。于是选择了有新生监护的高级医院和没有监护的普通医院进行对比。但这个研究中,新生儿生前的健康状况、心脏追踪结果、妊娠期疾病的严重程度等是混杂因素,这些因素影响新生儿的结局,也会影响到是否进行新生儿监护。但由于不同级别的医院水平不同,这些混杂因素并非全部测量,有些资料无法测量。但不调整这些混杂因素的作用,显然结果是有偏的。研究引入一个工具变量:与高级医院距离的远近(Z)。当与高级医院的距离比普通医院距离高于10分钟车程时,认为可能送入普通医院;否则认为距离相差不大,可能送入高级医院治疗。Z与进入医院的类型高度相关,与结局和新生儿生前的健康状况、妊娠期疾病的严重程度等混杂因素的关系不大,可以认为是一个较好的工具变量,如果证明Z与结局有关,可间接认为不同类型医院的新生儿死亡率不同。
选好工具变量是比较难的,感兴趣的朋友可以查看更多的文章,也欢迎与我们讨论。
京卫计网审[2015]第0523号 京ICP备14051922号 京ICP证160408号
京公网安备 11010502030806号 Copyright © 2014 北京易康医疗科技有限公司版权