微 信 题 库 搜 索
精品课程
热门课程
>
外科 妇产科 儿科
内科学 生理学 更多
药学专业
药理学 中药学 药物化学
生药学 卫生毒理学 更多
中医专业
中医基础理论 中医学 更多
口腔专业
口腔内科 口腔外科 更多
 医学全在线 > 精品课程 > 卫生学 > 南华大学 > 正文
卫生学电子教材-第八章 计数资料的统计方法 :第二节 计数资料的统计推断
来源:南华大学资源网 更新:2013/9/10 字体:
<一、率的抽样误差与标准误><二、总体率的区间估计><四、总体率的假设检验>
一、率的抽样误差与标准误

本节和下节介绍计数资料的统计推断。本节介绍最简单的计数资料是分成两类,计数资料原分成多类但只研究其中特定的一类也可简化为两类——某类和非某类。

两类构成总体为:总个体数为N,某类个体数为M,非某类个体数为N-M。只有一个总体参数,据其实际含义称为某类的总体率或总体构成比,用π表示,即π=M/N。

率(或构成比)的抽样误差与标准误和均数的抽样误差与标准误其概念相同。从总体率为π的两类构成总体中随机抽取含量n的样本,抽得某类个体数X(非某类个体数n-X),算出样本率p=X/n。由抽样造成的样本率和总体率的差别称为率的抽样误差。所有可能的含量n的样本率构成变量为p的总体。样本率总体中p值的差别是由抽样误差造成的。总体率π为定值,分析样本率p的分布情况就可得出抽样误差p-π的分布情况。数理统计学中证明,含量n的样本率p的总体均数为π,标准差为

率的标准差又称为率的标准误。率的标准误是描述率的抽样误差的统计指标(变异指标),率的标准误越大,则率的抽样误差越大(更确切地说,是抽样误差的波动程度越大)。

由(8·8)式可见,率的标准误σp的大小决定于总体率π和样本含量n,n越大,σp越小。从同一总体中抽样,总体率为定值,因此要减小率的标准误,降低抽样误差,只有加大样本含量。

总体率π一般是未知的,若用样本率p估计,则据(8·8)式,σp的样本估计值为例8·3 在某镇按人口的1/20随机抽取329人,作血清登革热血凝抑制抗体反应检验,发现阳性者29人,求阳性率及其标准误。

该镇329人血清登革热血凝抑制抗体反应检验的阳性率为8.81%,标准误为1.56%。

关于样本率p的总体分布,作说明如下:两类构成总体某类率为π,非某类率为1-π。从总体中抽取含量n的样本,抽得某类个体数X和某类率p是不连www.med126.com续的,其取值可能情况为X=0,1,2,…,n,即p=0/n,1/n,2/n,…,n/n。由于抽得某类个体的概率为π,抽得非某类个体的概率为1-π,数理统计学中证明,p(或X)为上述各种取值的概率等于二项式〔(1-π)+π〕n。展开后的各项,故p(或X)服从二项分布。二项分布是不连续的概率分布,有2个参数:原总体率π和样本含量n。π=0.5,二项分布对称;π≠0.5,二项分布不对称。π和0.5相差越大,二项分布越不对称,特别当n小时更是如此。实际验证发现,当n足够大,π和1-π均不太小,有nπ≥5和n(1-π)≥5时,二项分布近似正态分布。因此当π<0.5时,总体率π越小,需要的样本含量n越大p分布才近似正态分布,例如π=0.2,0.1,0.05,则需要的样本含量至少为n=25,50,100。

  

返回顶部

二、总体率的区间估计

和由样本统计量推断总体均数一样,由样本统计量推断总体率(或总体构成比)有2个重要方面:区间估计和假设检验www.med126.com/jianyan/。先介绍总体率的区间估计。

设两类构成总体某类总体率为π,从中抽取含量n的样本,抽得某类个体数为X,要由样本估计总体率π的1-α可信区间。

算出样本率p(X/n),当nπ≥5和n(1-π)≥5时,p近似服从均数为π、标准差(即标准误)为σp的正态分布,故标准正态变量为

当总体率π未知时,σp用其估计值sp取代,则近似有

当总体率π未知时,正态近似条件nπ≥5和n(1-π)≥5用np≥5和n(1-p)≥5取代,由于np=X,因此即样本中的某类个体数X≥5和非某类个体数n-X≥5。只要p不接近0或1,n较大即可达到此要求。在医学实际应用中,此条件一般容易满足,故总体率的区间估计常可用正态近似法。据(8·11)式,总体率的1-α可信区间为

ua值见上章的表7-8(也可见表7-9的ν=∝的ta值)。常用的是求总体率的95%可信区间,双侧u0.05=1.96,如要提高可信度,则求总体率的99%可信区间,双侧u0.01=2.58。样本率作为总体率的点估计处于可信区间中心。

例8·4求例8·3中某镇人群血清登革热血凝抑制抗体反应阳性率的95%可信区间。

在例8·3中已算得p=0.0881,sp=0.0156,故有:

0.0881±1.96×0.0156=0.0575~0.1187=5.75%~11.87%

该镇人群血清登革热血凝抑制抗体反应阳性率的95%可信区间为5.75%~11.87%。

注意的是:若样本中某类个体数X<5或非某类个体数n-X<5时,则不宜用正态近似法求总体率的可信区间,此时可据样本含量n和某类个体数X,查专门医学统计书中据二项分布算得的总体率的可信区间表。

返回顶部

三、总体率的假设检验(u检验)

 

推断单个总体率(或总体构成比)π是否等于已知总体率π0,和推断两个总体率π1和π2是否相等,其假设检验的基本思想和步骤和总体均数的假设检验相同。只是总体均数的假设检验其样本检验统计量为t,称为t检验;而总体率的假设检验其样本检验统计量为u,称为u检验。

1.样本率和总体率比较的u检验从未知总体率π的两类构成总体抽取含量n的样本,推断π是否等于π0(一般为理论率或标准率,如某病用常规药的治愈率)。作p和π0比较的u检验,据(8·10)式,计算u值的公式为

例8·5根据以往经验,一般胃溃疡病患者中有20%发生胃出血症状。现某医院观察65岁以上胃溃疡病人152例,有48例发生胃出血症状。问老年胃溃疡病患者是否较容易发生胃出血?

已知一般胃溃疡病患者总体的胃出血发生率π0为0.2,设65岁以上老年胃溃疡患者总体的胃出血发生率为π,假设为:

H0:π=0.2

H1:π>0.2

单侧α=0.05

今π0=0.2,n=152,X=48,

据(8·13)式有

单侧u0.01=2.326,现u>u0.01,得p<0.01。按α=0.01水准拒绝H0,接受H1,认为老年胃溃疡病患者较一般胃溃疡病患者较容易发生胃出血。

2.两个样本率比较的u检验从两个未知总体率π1和π2的两类构成总体分别抽取含量n1和n2的两个样本,数理统计学中证明,当π12=π时,两个样本率之差p1-p2的总体均数为0,标准差为

σp1-p2为两个率之差的标准误,其样本估计值为

式中pc为两个样本的合并率,是π的点估计。设p1=X1/n1,p2=X2/n2,则p2=(X2+X2)/(n1+n2)或pc=(n1p1+n2p2)/(n1+n2)。

当两个样本满足正态近似条件时,标准正态变量为

推断π1是否等于π2,作p1和p2比较的u检验,用(8·16)式计算u值。

例8·6在某山区小学随机抽取男生80人,其中肺吸虫感染23人;随机抽取女生85人,肺吸虫感染13人。问该山区小学男生和女生的肺吸虫感染率有无差别?

设该山区小学男生总体的肺吸虫感染率为π1,女生总体的肺吸虫感染率为π2,假设为:

H0:π12

H1:π1≠π2

α=0.05

今n1=80,X1=23;n1=85,X2=13。

据(8·16)式有

双侧u0.05=1.96,现u>u0.05,p<0.05,按α=0.05水准拒绝H0,接受H1,认为该山区小学男生和女生的肺吸虫感染率有差别,男生高于女生。

返回顶部


 


相关文章
版权所有:医学全在线(m.med126.com)