微 信 题 库 搜 索
精品课程
热门课程
>
外科 妇产科 儿科
内科学 生理学 更多
药学专业
药理学 中药学 药物化学
生药学 卫生毒理学 更多
中医专业
中医基础理论 中医学 更多
口腔专业
口腔内科 口腔外科 更多
 医学全在线 > 精品课程 > 卫生学 > 南华大学 > 正文
卫生学电子教材-第七章 计量资料的统计方法:第二节 正态分布和正常值范围
来源:南华大学资源网 更新:2013/9/10 字体:
<一、正态分布><二、正常值范围的确定>
一、正态分布 

正态分布(normal distribution)又称Gauss分布,是医学和生物学中常见的总体分布。用样本变量值的频数表和频数分布图来推断总体变量值分布,则其符合正态分布的条件为:频数分布以均数为中心、左右两侧基本对称,靠近均数两侧的频数较多,而两侧距均数较远时,频数逐渐减少。实际上如果某指标的频数分布符合这些必要条件,该指标一般符合正态分布。

正态分布曲线简称正态曲线(normal curve)。理论上的正态曲线如图7-2所示,是一条高峰位于中央(均数所在处)、两侧完全对称、两端永远不与横轴相交的钟型曲线。任何实际指标的分布都不可能和理论上的正态分布完全吻合,只要近似为正态分布就认可。

正态曲线的横轴为变量X,纵轴为概率密度f(X)(当频数表的组距很小时,把每组变量值的频率除以组距即相当于概率密度)。概率密度用以求正态曲线下的面积,正态曲线下的整个面积为1,正态曲线下X从a到b

(b>a)的面积也即该面积对整个面积的比(或百分数),可由概率密度正态分布总体有2个总体分布参数:均数μ和标准差σ,可记作N(μ,σ)。均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。知道了μ和σ就可确定正态曲线(可写出概率密度)。

图7-2正态曲线下的面积是据其概率密度的积分得出来的,下述规律在统计学上特别重要,经常用到:

μ±σ范围内占正态曲线下面积的68.27%,也就是说有68.27%的变量值分布在此范围内;

μ±1.96σ范围内占正态曲线下面积的95.00%,也就是说有95.00%的变量值分布在此范围内;反之,μ±1.96σ范围外只占正态曲线下面积的5.00%,也就是说只有5.00%的变量值分布在此范围外(左、右两侧各占2.50%);

μ±2.58σ范围内占正态曲线下面积的99.00%,也就是说有99.00%的变量值分布在此范围内;反之,μ±2.58σ范围外只占正态曲线下面积的1.00%,也就是说只有1.00%的变量值分布在此范围外(左、右两侧各占0.50%)。

如果样本含量很大(比如n>100),用正态曲线下的面积分布规律,可据样本资料考察总体是否符合正态分布。

例7·14  据例7·1中的130名正常成年男子的红细胞数,用正态曲线下的面积分布规律考察正常成年男子的红细胞数是否服从正态分布。

本例作为大样本,例7·3和例7·10已算得 =4.794×1012/L s=0.409×1012/L故

-s~ +s=4.794-0.409~4.794+0.409

=4.385~5.203(1012/L)

-1.96s~ +1.96s=4.794-1.96×0.409~4.794+1.96×0.409

=3.992~5.596(1012/L)

-2.585~ +2.58s=4.794-2.58×0.409~4.794+2.58×0.409

=3.739~5.849(1012/L)

逐个清点表7-1中的130个变量值,得出在4.385~5.203之间有88个变量值;在3.992~5.596之间有120个变量值;在3.739~5.849之间有129个变量值。表7-7为130名正常成年男子红细胞数的实际分布与正态理论分布的比较,发现实际分布和正态理论分布近似,可认为正常成年男子的红细胞数服从正态分布。表7-7 130名正常成年男子红细胞数(1012/L)实际分布与正态理论分布的比较

 可把变量值分布分为正态分布和偏态分布(skewnessdistribution)。所有不符合正态分布的变量值分布都称为偏态分布,不对称分布为实际应用中最常见的偏态分布。但对称分布不一定是正态分布,对称分布还要符合正态分布的面积分布规律才是正态分布。如均匀分布(在相等变量值范围内的变量值频数或频率相等)为对称分布,但为偏态分布。 

返回顶部

二、正常值范围的制定 

正常值(normal value)亦称参考值(reference value),指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其生理常数有一定的波动范围,因此一般采用正常值范围(normalrange),亦称参考值范围(referencerange)。由于个体对同一种刺激的反应情况有所不同,因此也可制定各种反应的正常值范围。例如白细胞数的正常值范围为(4~10)×109/L,尿不超过0.08mg/L等。有了正常值范围在评价个体某指标值是否正常时便有了依据,在正常值范围之内,则认为该指标值属于正常;在正常值范围之外,则认为该指标值属于不正常或异常。有些医学指标因为地区、时间和其他影响条件不同,正常值范围也不同,故有时为了评价本地的情况,往往需要制定本地区一些医学指标的正常值范围。因此制定各种医学指标的正常值范围是医学实践和医学科研经常性的重要任务。

一个医学指标的正常值范围采用双侧还是单侧界值,依据医学专业知识而定。例如白细胞数无论过低或过高均属异常,应采用双侧正常值范围,制定下侧(或低侧)和上侧(或高侧)界值;尿铅排出量过高才属异常,应采用单侧正常值范围,制定上侧界值;肺活量过低才属异常,应采用单侧正常值范围,制定下侧界值。

医学指标的正常值范围的意义是指绝大多数正常人的变量值都在这个范围内,这个绝大多数习惯上是包括正常人的80%、90%、95%、99%等,而最常用的是95%。如果正常百分界限采用95%,则在正常值范围之外正常人的变量值尚有5%,对于双侧界值,在下侧和上侧界值之外各有2.5%;对于单侧界值,在下侧或上侧界值之外有5%。

制定医学指标的正常值范围的方法根据对该变量的总体分布的判断而定,有下述2种方法。

1.正态分布法对正态分布总体的变量用正态分布法制定指标的正常值范围。

若变量X服从均数为μ、标准差为σ的正态分布N(μ,σ),则X称为正态变量。作变量转换

u称为标准正态变量,服从均数为0、标准差为1的正态分布,称为标准正态分布。

标准正态曲线下u从a到b>a)的面积为u值分布在此范围内的百分比,用概率说法,即u值落在此范围内的概率P。如下定义uα值(取正值),称为P为α的u界值。

双侧:P(u≤-uα)和P(u≥uα)为α,由于u分布以0为中心对称,即P(u≤-uα)=P(u≥uα)=α/2。

单侧:P(u≤-uα)=α或P(u≥uα)=α。

根据标准正态曲线下的面积计算,由α值可得出uα值。α在后述的假设检验中,称为检验水准。表7-8列出了用正态分布法制定正常值范围常用的单、双侧uα值。 

若样本含量很大(比如n>100),可近似用 代替μ,s代替σ,于是根据正态分布规律近似有

例7·15 据例7·1中的130名正常成年男子的红细胞数,制定正常成年男子红细胞数的95%正常值范围。

正常成年男子的红细胞数服从正态分布,现样本含量很大,可用正态近似法制定www.med126.com/wsj/其正常值范围。据医学专业知识,红细胞数过低或过高均属异常,应采用双侧正常值范围,制定下侧和上侧界值。例7·3和例7·10已算得 =4.794×1012/L,s=0.409×1012/L,故其95%正常值范围为

该地区正常成年男子红细胞数的95%正常值范围为3.992×1012/L~5.596×1012/L。

μ±uασ=μ-uασ~μ+uασ称为总体个体值(即变量值)的1—α容许区间(tolerence in-terval),说明总体个体值有1—α的百分比落在此区间内。制定正常值范围属于由样本求总体个体值的近似容许区间。

2.百分位数法对偏态分布总体的变量一般用百分位数法制定指标的正常值范围,要求样本含量必须很大(n至少大于100)。

双侧1—α正常值范围:P100α/2~P100-100α/2

单侧1—α正常值范围:>P100α或<P100-100α

例7·16 据例7·8中238名正常人的发汞值,制定正常人发汞值的95%正常值范围。

正常人的发汞值为偏态分布,现样本含量很大,用百分位数法制定其正常值范围。据医学专业知识,发汞值过高才属异常,应采用单侧正常值范围,制定上侧界值,本例应求P95。由表7-5,据(7·8)式得

正常人发汞值的95%正常值范围为小于2.65μg/g。

如果偏态分布是对数正态分布,原变量为X,令Y=lgX,Y服从正态分布。按正态分布法求出Y的正常值范围的界值后,再取反对数就得出X的正常值范围的界值,这较用百分位数法为好。

www.med126.com/kuaiji/回顶部


相关文章
版权所有:医学全在线(m.med126.com)