全国服务热线:400-627-0012 首页 | 收藏 注册登录

标准差大于均值,数据就不是正态分布吗?

发布时间:2016-08-02 | 来源: | 责任编辑:嗵嗵e研

 


经常有人咨询:“审稿专家说我的**指标的标准差大于均值,不是正态分布,让我调整统计方法。”标准差大于均值似乎成为判断数据是否正态分布的“金标准”,这个这谓的“金标准”从哪里来的?那它是金标准吗?


首先看几个正态分布的直方图(用R产生1000个均值为6、标准差为2、4、6的随机数字并作图)。

左侧图(红色)均值6,标准差为2,此时小于0的数值较少(理论上小于0的数据少于1%)。

中间图(绿色)均值6,标准差为3,此时小于0的数值仍较少(理论上小于0的数据少于2%),但明显增多。

右侧图(蓝色)均值6,标准差为6,此时小于0的数值仍较多,如果将小于0的数据去掉,只保留大于0的数据,数据呈明显偏态分布。


从上图模拟数据可以看出,正态分布数据随着标准差的变大,数据分布范围越来越大,小于0的数据比例也越来越多。而在临床中我们观察到的数据多数只能取正值,在这个条件下,均值6标准差为2时还是正态分布,而均值6标准差为6时去除小于0的数据,数据呈偏态分布。(下图为用R产生1000个均值为6、标准差为2、4、6的随机数字,去除负数并作图)

因此“标准差大于均值时数据不是正态分布成立”的必要条件就是:指标只能取正值或只能取负值。而当指标既可以取正值也可以取负值时,此判断不成立。由于临床指标多数为正,这个判断多数情况下成立。这也是在没有原始数据情况下进行粗略判断的最实用的方法,因此被审稿专家所青睐。


“标准差大于均值时数据不是正态分布成立”也不太准确,从上述模拟图可以看出,当标准差大于均值的1/2时,数据偏态分布已经较明显。因此有的专家要求标准差要小于均值的1/3或1/2。超过1/2时提示可能数据不是正态分布。


其次这个判断不是说标准差较小就一定是正态分布的,数据是不是正态分布,需要用直方图、茎叶图、p-p图、Q-Q图等进行检查。当审稿专家怀疑你的数据分布时,你首先要做的是把直方图、p-p图画一下看看数据分布状态,如果不是正态分布,按专家意见进行修改;如果是正态分布,可以把分布图给审稿专家查看。目前,图形(包括直方图、茎叶图、p-p图、Q-Q图等)是验证是否正态分布的金标准。

0

京卫计网审[2015]第0523号      京ICP备14051922号      京ICP证160408号

      京公网安备 11010502030806号      Copyright © 2014 北京易康医疗科技有限公司版权

全国免费咨询热线
400-627-0012