4)整群抽样(cluster sampling):抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校等。然后用以上几种方法从相同类型的群体中随机抽样。抽到的样本包括若干个群体,对群体内所有个体均给以调查。群内个体数可以相等,也可以不等。
这种方法的优点是,在实际工作中易为群众所接受,抽样和调查均比较方便,还可节约人力、物力和时间,因而适于大规模调查。但整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的可靠信息。
5)两级或多级抽样(two-stage or multi-stage sampling):这是大型调查时常用的一种抽样方法。从总体中先抽取范围较大的单元,称为一级抽样单元(例如县、市),再从抽中的一级单元中抽取范围较小的二级单元(如区、街),这就是两级抽样。还可依次再抽取范围更小的单元,即为多级抽样。
多级抽样常与上述各种基本抽样方法结合使用。
(2)样本含量
1)对均数做抽样调查时的样本含量公式:
n=(uaσ/δ)2
(式3-1)
式中n为样本含量,uα为正态分布中自左至右的累积概率为σ/2时的u值(如u0.05=1.960,u0.01=2.576),σ是标准差,δ是允许误差。也可用如下公式:
n= (tas/δ)2
(式3-2)
式中s为样本标准差代替总体标准差σ,以t分布中的tα代替正态分布中的uα。当样本含量n<30时,用后一个公式更合适。
例:欲调查某病病人血红蛋白含量,据以往的经验,σ=3.0g/100ml,要求误差不超过0.5g/100ml,并定α=0.05,则该调查样本大小为:
n=(tas/δ)2=1.960×3.0/0.5)2≈139(人)
2)对率做抽样调查时的样本含量公式:
N=K×Q/P
(式3-3)
N为调查例数,P为预期阳性率,Q=1-P。当容许误差为10%时,k=400;容许误差为15%时,k=178;容许误差为20%时,k=100。(见表3-2)。
表3-2 按不同预期阳性率和容许误差时现况调查样本大小
预期阳性率 | 容 许 误 差 | ||
0.1P | 0.15P | 0.2P | |
0.05 | 7600 | 3382 | 1900 |
0.075 | 4933 | 2193 | 1328 |
0.10 | 3600 | 1602 | 900 |
0.15 | 2264 | 1000 | 566 |
0.20 | 1600 | 712 | 400 |
0.25 | 1200 | 533 | 300 |
0.30 | 930 | 415 | 233 |
0.35 | 743 | 330 | 186 |
表3-2是用上式计算出来的样本大小,可参考使用。但须注意,当流行率或阳性率明显小于1%时,此式不适用。