上QQ阅读APP看书,第一时间看更新
第三节 正态分布及分布描述
在统计学中有许多分布,如这里描述的正态分布,此外还有t分布、F分布、二项分布、Poisson分布等。对于分布曲线下的面积,应当用自左至右的累计面积的比例来描述,但统计书籍中也常用另一种更方便的描述方法。为了便于讨论和以后章节中的应用,先要对标准正态分布进行说明。
一、标准正态分布
在x=μ-1倍标准差与x=μ+ 1倍标准差两点中间曲线下中间面积占整个面积的68.27%,其外占31.73%。在x=μ-1.96倍标准差和x=μ+ 1.96倍标准差两点中间曲线下的面积占整个面积的95%,其外占5%。在x=μ-2.58倍标准差和x=μ+ 2.58倍标准差两点中间曲线下的面积占整个面积的99%,其外占1%。
如果把正态分布中横轴中某一点x对均数的距离除以其标准差定义为u。则:
以u值代替x作图,则是一条以0为中心的,标准差= 1的正态分布曲线,u的分布称为标准正态分布,而u值称为标准正态变量(统计学中也常用z表示标准正态变量)。其相应的面积介于-1和+ 1两点中间曲线下面积占整个面积的68.27%,其外占31.73%(图2-3a)。u介于-1.96和+ 1.96两点间曲线下的面积占整个面积的95%,其外占5%(图2-3b)。u介于-2.58和+ 2.58曲线下的面积占整个面积的99%,其外占1%(图2-3c)。
图2-3 u分布示意图
二、标准正态分布表的使用
附录A表是标准正态分布表。表的左边第1列为u值的整数位于第一个小数位,表的第一行给出u值的第二小数位。表中其他数值给出了标准正态曲线下大于u值的面积比例。例如,当u= 0.00时,相应面积比例为0.5000;当u= 1.96时,相应面积比例为0.0250; 当u= 1.64时,相应面积比例为0.0505。
因为标准正态分布是关于u= 0对称的,所以利用附表1也能求得当u小于0时,标准正态曲线下小于u值的面积比例。例如,标准正态曲线下小于u=-1.96的面积比例等于曲线下大于u= 1.96的面积等于0.025。
利用附表1还能由标准正态曲线下的面积比例求相应的u值。例如,欲求曲线下右侧面积比例为0.02的u值。则先从表中找面积比例为0.02,可以发现没有正好为0.02的面积比例,最接近的为0.0202和0.0197,再由这两个值查相应的u值,得面积0.0202对应u= 2.04,面积0.0197对应u= 2.05,说明与0.02面积对应的u值2.04与2.05中间。
三、关于记号ua
u= 1.96时标准正态曲线下其右侧面积比例为0.0250,则其左侧面积比例为0.9750,所以1.96其实是标准正态分布的第97.5百分位数。u= 1.64是标准正态分布的第95百分位数(确切地讲是第94.95百分位数)。按数理统计中的习惯记号,记u= 1.96为u 0.975,u= 1.64为u 0.95。一般地u 1-α表示在此u值右侧曲线下面积比例为α。u 1-0.05= 1.64,u 1-0.05/2=1.96(图2-4a,b)。
图2-4 u值与曲线下面积的表示方法
在医学卫生统计领域的假设检验问题中,常用α表示检验水准,当统计量为u时,以u a表示检验的临界值。双侧检验时,以使P( ≥A)=α的值A为u a。例如,若取α= 0.05,则因为P( ≥1.96)= 0.05,所以u 0.05= 1.96。若取α= 0.01,则因为P( ≥2.58)= 0.01,所以u 0.01= 2.58(图2-5a,b)。本书大部分内容用这种方法表示。
图2-5 u值与曲线下面积的常用表示方法
如果资料呈正态分布或近似正态分布,μ和σ未知,可用样本均数作为总体均数的估计值,用样本的标准差作为总体标准差的估计值,只要求出 和s,便可对其频率分布作出概括估计。
四、正态分布的应用
1.估计医学参考值范围
参考值范围亦称正常值范围。在医学上通常把95%的正常人某指标所在范围作为参考值范围。如果资料近似正态分布,且样本含量较大,可按 ±n s估计参考值范围。
2.质量控制
为了控制实验中的检测误差,常以 ±2s作为上、下警告限,以 ±3s作为上、下控制界限。这里的2s和3s可视为1.96s和2.58s的约数。
3.正态分布
是许多统计方法的理论基础。
有些医学检验资料,如正常人血铅含量虽不服从正态分布,但经对数转换后服从对数正态分布,仍可按上述正态分布规律来处理。
综上所述,正态分布是很多统计方法的理论基础,也是质量控制图的理论依据,故了解正态分布可为以后的学习质量控制方法打下坚实的基础。