教 案
2007 — 2008 学年 春 季学期
所在单位 公共卫生与热带医学学院
系、教研室 生物统计学系
课程名称 卫生统计学
授课对象 2005级预防医学本科
授课教师 阎玉霞
职 称 讲师
教材名称卫生统计学
南方医科大学教案首页
授课题目 | 参数估计 | 授课形式 | 讲授 |
授课时间 | 2008-4-21 | 授课学时 | 3 |
教学目的 与 要 求 | 1.掌握样本均数、率的抽样误差概念;掌握样本均数、率的标准误的意义、计算方法和用途; 2.掌握可信区间的概念及其估计方法(95%、99%可信区间); | ||
基本内容 | 1.均数(率)的抽样误差与标准误; 2.总体均数(率)的点估计与区间估计; 3.可信区间的含义; 4. 两均数(率)差的可信区间; 5. 标准差与标准误的区别; 6. 可信区间与参考值范围的区别。 | ||
重 点 难 点 | 上述3.5.6为重点难点 | ||
主要教学 媒 体 | 多媒体投影仪 | ||
主 要 外 语 词 汇 | Confidence interval, CI, Standard error | ||
有关本内容的新进展 | |||
主要参考资料或相关网站 | http://www.smmu.edu。cn/zykj/~statistics/index/index.htm 1. 徐勇勇主编. 医学统计学(第二版). 北京:高等教育出版社,2004 2. 杨树勤主编. 卫生统计学(第二版). 北京:人民卫生出版社,1991 3. 方积乾主编. 医学统计学与电脑实验(第二版). 上海:上海科学技术出版社,2001 4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004 | ||
系、教研室 审查意见 | |||
课后体会 |
南方医科大学教案
教学内容 | 时间分配和 媒体选择 |
一、抽样误差与标准误 (一)、均数的抽样误差概念 (二)、中心极限定理 (三)、标准误意义及其计算方法 1、意义: 说明均数抽样误差大小的指标,用σx表示。σx越大, 均数抽样误差越大;反之,σx越小,均数抽样误差越小。 2、计算公式: 3.均数标准误的用途: 二、t分布 (一)t分布含义: (二)t分布特征: (三)t界值表 三、总体均数的估计 (一)估计方法: 1、点值估计:用样本均数(率)直接作为总体参数的估计值。 2、区间估计: (二)总体均数的区间估计 1、定义: 2、估计方法: 3、可信区间的涵义 4、可信区间两个要素: 5、可信区间与正常值范围区别: 四、总体率的估计 几个重要的概念 小结
| 幻灯片45分钟 幻灯片15分钟 幻灯片35分钟 幻灯片10分钟 幻灯片10分钟 幻灯片5分钟 |
讲稿
教学内容 | 时间分配 媒体选择 |
一、抽样误差与标准误 (一)、均数的抽样误差概念 由于总体中存在个体变异,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称均数的抽样误差。在抽样研究中,抽样误差是不可避免的,但可以估计其大小。 (二)、中心极限定理 1、在正态总体中,随机抽取例数为n的样本,样本均数X服从正态分布; 2、在偏态总体中随机抽样,当n足够大时(n>50),X也近似正态分布; 3、从均数为μ,标准差为σ的正态或偏态总体中,抽取例数为n的样本, 样本均数X的总体均数仍为μ,标准差为σx (三)、标准误意义及其计算方法 1、意义: 说明均数抽样误差大小的指标,用σx表示。σx越大, 均数抽样误差越大;反之,σx越小,均数抽样误差越小。 2、计算公式: .........(理论值) ...........(估计值) 与 成正比,与成反比,可以通过增加n减小。 3.均数标准误的用途: (1)说明均数抽样误差大小,反映均数的可靠性。σx 越大,用样本均数推论总体均数越可靠,反之亦然 (2)估计总体均数的可信区间 (3)用于进行假设检验 二、t分布 (一)t分布含义: 由于呈正态分布N(、),则可以将一般正态变量变换成标准正态变量:
将一般的正态分布变换为标准正态分布N(0、1)。 在实际应用中,往往未知,用代替,则只能对做t变换而不是变换: = 每个可以算出一个t值,t值的分布称t分布。 (二) t分布特征: 1、以0为中心,左右对称的单峰分布; 2、t分布的形态与自由度ν有关: 1) ν越小,t分布曲线峰部越低平而尾部翘得越高;(t分布与u分布相差较大,即相同的曲线下面积,t值>u值) 2) ν逐渐增大,t分布逼近标准正态分布; 3) ν=∞,t分布=标准正态分布。(同样的曲线下面积,t值=u值) 4) 自由度不同,t分布曲线形态就不相同,因此t分布是一簇曲线,则就是说,自由度不同,相同的t值所对应的面积不同,或说,出现该t值的概率不同。 (三) t界值表 对应于每一自由度取值,就有一条t分布曲线,每条曲线都有自身曲线下t值的分布规律,相同曲线下面积所对应的t值不同,计算t值较为繁杂。为此,统计学家已制成t值表,通过查表即获得相应的t值。查表须注意: 1、www.med126.com/zhicheng/横标目(左边第一列)为自由度(),纵标目为概率(P或),也就是t界值以外单侧或双侧尾部的面积占总面积的百分比,表中的数字就是对应于和的t界值,用tα,ν表示; 2、t值有正负值,由于t分布是以0为中心的对称分布,故表中只列正值,查表时,不管t值正负只用绝对值; 3、当ν一定时,t值越大,P越小; 4、当P一定时,ν越大,t值越小;ν=∞时,t=u; 5、当ν和t值一定时, 双侧P=2倍单侧P。 即 双侧tα,ν=单侧tα/2,ν。 例 ν=10时: 单侧 =1.812 即 P(t≤-1.812)=0.05 或P(t≥1.812)=0.05 双侧 =2.228 即 P(t≤-2.228)+P(t≥2.228)=0.05 三、总体均数的估计 (一)估计方法: 1、点值估计:用样本均数(率)直接作为总体参数的估计值。 2、区间估计: (二)总体均数的区间估计 1、定义: 按一定的概率(1-α)确定包含未知总体均数的可能范围。所确定的范围称为总体均数的可信区间(或置信区间,CI);1-α称可信度,最常用双侧95%。 2、估计方法: (1)当σ未知,而且样本例数n较小(n<60)时,按t分布原理估计: ±tα,ν. (2)当σ已知,或σ未知但样本例数足够大(n≥60)时,按标准正态分布原理估计: A.σ已知: (-uα. ,+uα.) uα为u界值, uα. B.σ未知但n足够大(n≥60): (-uα. , +uα. ) uα. 按标准正态分布原理估计总体均数可信区间时,熟记下列常用区间:www.med126.com/yishi/ 95%总体均数可信区间: 1.96 或 1.96 99%总体均数可信区间: 2.58 或 2.58 例 n=20, =118.4mmHg, s=10.8 mmHg, 估计其95%可信区间。 (-tα,ν. , +tα,ν. ) t0.05,19=2.093 ==2.41 (118.4-2.093×2.41 , 118.7+2.093×2.41) (113.3,123.5)mmHg 例 n=200, =3.64mmol/L, s=1.20mmol/L, 估计其95%可信区间。 uα. (3.64- 1.96× ,3.64+1.96×) (3.47,3.81)mmol/L 3、可信区间的涵义 以95%总体均数可信区间为例: 有95%的可能所计算出的区间包含了总体均数,即估计正确的概率为95%,错误5%。 4、可信区间两个要素: (1)准确度:反映在可信度(1-α)的大小。1-α越接近1,越准确。 如可信度99%比95%准确。 (2)精确度:反映在区间范围宽窄。范围越摘越好。 95%可信区间精度优于99%。 在n确定的情况下,准确度↑,精确度↓; 在兼顾准确度和精确度时,一般取95%可信区间; 在可信度确定的情况下,增加样本例数,可提高精确度。 5、可信区间与正常值范围区别: (1)意义不同:正常值范围是指绝大多数观察值在某个范围; 可信区间是指按一定的可信度估计总体参数(均数)可能所在的范围; (2)计算公式不同 可信区间 ±uα. (大样本) 或 ±tα,ν. (小样本) 正常值范围 ±uα.S 前者用标准误,后者用标准差。 (3)用途不同:可信区间用于估计总体均数,参考值范围用于判断观察对象某项指标正常与否。 | 幻灯 投影 投影 板书 投影 投影 |