医学统计学:教案第五章 t检验

南方医科大学教案首页

授课题目	假设检验	授课形式	讲授
授课时间		授课学时	3
教学目的与要求	目的的要求：掌握假设检验的基本原理，t检验的各类应用。
基本内容	（一)掌握内容 1.假设检验的基本原理 2.t检验的方法应用于单样本、配对、两组独立样本的资料比较 3.有关概念（如I、II类错误)及注意事项。 (二)熟悉内容两样本方差齐性检验。（三)了解内容 1.总体方差不等时的两样本均数的比较； 2.二项分布、泊松分布资料的Z检验
重点难点	重点： 1.假设检验的基本原理 2.t检验应用于单样本、配对、两组独立样本的资料处理 3.I、II类错误难点： i. 两组独立样本资料的t检验 ii. 假设检验功效
主要教学媒体	采用课堂讲授，习题练习 ppt演示
主要外语词汇	Significance test t-test
有关本内容的新进展
主要参考资料或相关网站	http://www.smmu.edu。cn/zykj/~statistics/index/index.htm 1. 徐勇勇主编. 医学统计学（第二版). 北京：高等教育出版社，2004 2. 杨树勤主编. 卫生统计学（第二版). 北京：人民卫生出版社，1991 3. 方积乾主编. 医学统计学与电脑实验（第二版). 上海：上海科学技术出版社，2001 4. 孙振球主编. 医学统计学（供研究生用). 北京：人民卫生出版社，2004
系、教研室审查意见
课后体会

南方医科大学教案

教学内容

时间分配和

媒体选择

一、假设检验的概念

二、假设检验的基本步骤

三、计量资料的假设检验

1、单样本t检验

2、配对t检验

3、两样本t检验

四、假设检验应注意的问题

(1)要有严密的研究设计，这是假设检验的前提。

(2)不同变量或资料应选用不同的检验方法。

(3)正确理解“显著性”一词的含义。

(4)作结论不能绝对化。

(5) 统计“显著性”与医学／临床／生物学“显著性”

五、小结

幻灯片20分钟

幻灯片30分钟

幻灯片40分钟

幻灯片20分钟

幻灯片10分钟

教学过程

教学内容

教学活

动方式

假设检验

一、假设检验的概念

统计推断包括两大方面的内容，其一为参数估计(如总体均数的估计)，另一方面，即假设检验（hypothesis test)。假设检验过去亦称显著性检验（significance test)。其基本原理和步骤用以下实例说明。

例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了 25名健康成年男子，求得其脉搏的均数为 74．2次／分，标准差为6．0次／分。根据大量调查，已知健康成年男子脉搏均数为72次／分；能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数？

本例可用下图表示。

显然，本例其目的是判断是否μ＞μ₀。从所给条件看，样本均数X与已知总体均数μ₀不等，造成两者不等的原因有二：

①非同一总体，即μ#μ₀；

②同一总体即μ=μ₀，两个均数不相等的原因在于抽样误差。

假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说，是解决样本均数代表性如何的问题。上例是，样本均数比已知总体均数大，有可能是由于抽样误差引起，也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致，如何判断呢，这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。

(提问：统计分析包括参数估计和假设检验)

下面我们以例题所提出的问题学习假设检验的基本步骤，同时学习样本均数与总体均数比较的t检验。

假设检验一般都是有“名”的，比如t检验，大家要知道假设检验的命名通常是以所要计算的统计量来命名的，如t检验、F检验、X2检验等。后面有进一步介绍。

二、假设检验的基本步骤

建立检验假设
（一)建立假设

假设有两种：一种是检验假设，常称无效假设，用 H0表示。这种假设的含义是假设两个指标(样本指标与总体指标、或两个样本指标)是相等的，它们的差别是由于抽样误差引起的。另一种是备择假设，常称对立假设，常用H1表示，是与H0相对立的假设，假设两个指标不相等，它们的差别不是由于抽样误差引起的，若无效假设被否决则该假设成立。

在建立检验假设时，应当注意：

① 检验假设是针对总体而言，而不是针对样本；

②H₀和 H₁是相互联系、对立的假设，后面的结论是根据 H_O和 H₁作出的，因此两者不是可有可无，而是缺一不可；

③H₀为无效假设，其假定通常是：某两个（或多个)总体参数相等，或某两个总体参数之差等于0；

H₁的内容反映出检验的单双侧。若H₁假设为μ＞μ₀或μ<μ₀，则此检验为单侧检验（one－sided test)。它不仅考虑有无差异，而且还考虑差异的方向。如上例研究者只关心山区成年男子的脉搏数是否高于一般；若H1为μ#μ₀，则此检验为双侧检验（two－sided test)。例如研究者对山区成年男子的脉搏数高于一般和低于一般同样关心。

单双侧检验首先应根据专业知识来确定，同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果，拟用单侧检验。在尚不能从专业知识判断两种结果谁高准低时，则用双侧检验。一般认为双侧检验较保守和稳妥。现以样本均数的比较为例，用符号表示如下：

样本均数所代表的未知总体µ与已知总体均数µ0的比较

目的　　　　 H0 H1

双侧检验是否µ#µ0 　 µ=µ0 µ#µ0

是否µ>µ0 µ=µ0 µ>µ0

单侧检验

　是否µ<µ0 µ=µ0 µ<µ0

两样本均数所代表的未知总体均数µ1与µ2的比较

目的　　　　 H0 H1

双侧检验是否µ1#µ2 µ1=µ2 µ1#µ2

是否µ1>µ2 µ1=µ2 µ1>µ2

单侧检验

是否µ1<µ2 µ1=µ2 µ1<µ2

（二)确定检验水准（size of a test)，代号α,过去称显著性水准（significance level)，是一个接受或拒绝H0的概率标准，是预先规定的概率值，它确定了小概率事件标准。在实际工作中一般取α=0．05。但α的取值并非一成不变，可根据不同研究目的给予不同设置，如方差齐性检验、正态性检验等常取α等于0．10、0．20，甚至更高。

(三)选定检验方法，计算检验统计量

应根据研究目的、变量或资料类型、设计方案、检验方法的适用条件等选择检验方法，并计算统计量（test statistic)。如两均数比较可选用t检验，(当样本含量较大，如n>100时可用u检验；两样本方差比较可选用F检验、率的比较可选用u检验或x2检验。

(四)确定P值

从假设检验的整个逻辑推理过程可看出，P的含义是指从由H0规定的总体中随机抽得等于及大于（或等于及小于)现有样本获得的检验统计量值（如 t或u)的概率，可以简单地理解P的含义是H0成立的概率。

(五)作出统计推断

根据计算出的检验统计量，查相应的界值表即可得概率P。如上例，算得t＝1．833，查表14-16，t界值表，先从横标目找到自由度υ＝24一行，1. 833在界值1.711与2．064之间，相对应纵标目的单尾P值分别为0．05与0.025，得本例0．025＜ P＜ 0．05；余类推。

将获得的事后概率P，与事先规定的概率——检验水准α进行比较而得出结论。一般来说，推断的结论应包含统计结论和专业结论两部分。统计结论只说明有统计学意义（statistical significance)或无统计学意义（statistical significance)，而不能说明专业上的差异大小。它必须和专业结论有机地相结合，才能得出恰如其分、符合客观实际的最终结论。若P≤α，则结论为按所取的α检验水准，拒绝H0，接受H1，差别有统计学意义（统计结论)，可认为……不同或不等（专业结论)。如例题得到0．025＜P＜0．05，按所取检验水准0．05，则拒绝H0，接受H1，有统计学意义，可认为该山区健康成年男子脉搏均数高于一般健康成年男子。若P＞a，则结论为按α检验水准，不拒绝H。，无统计学意义（统计结论)，还不能认为……不同或不等（专业结论)。

P＞α过去称“无显著性”，在文献中常用 NS（non- significant／no- significant。)表示，也就是人们常说的“阴性结论”。注意：①虽然否定之否定为肯定，但不拒绝H0不等于完全接受H。,此时，尚没有足够的证据认为H。成立。从决策的观点：可认为暂时“接受”它，或“阴性待观察”。②下结论时，对H0只能说：拒绝（reject)或不拒绝（not reject)；而对 H1只能说：接受 H1，除此之外的其它说法均不妥当。

三.计量资料的假设检验

假设检验的具体方法，通常以选定的检验统计量来命名。如检验统计量t和u分别对应于t检验（t－test，亦称 Student’s t－test)和 u检验（u－test，亦称 Z－test)。假设检验方法的选择应根据不同的资料类型和性质，研究的目的等来确定。实际应用时，应弄清各种检验方法的用途、适用条件和注意事项。

前面我们学过，统计资料可分为计量资料、计数资料和等级资料三种，这三种不同类型的资料都有其相应的假设检验方法：

计量资料：常用t检验(u检验)、F检验(方差分析)等；

计数资料：X2检验等；

等级资料：秩和检验。

我们首先学习计量资料的假设检验。同样是计量资料，还有不同的检验方法，这主要是要根据具体的资料内容的研究目的来确定。一般来说，两均数比较用t检验，而两个以上均数的比较就必须用方差分析了。

t检验的应用条件：当样本含量n较小时（如n＜ 50＝，理论上要求样本取自正态总体，两小样本均数比较时还要求两样本总体方差相等。但在实际应用时，与上述条件略有偏离，只要其分布为单峰近似对称分布，则对结果亦影响不大。u检验的应用条件：样本含量n较大, 一般要求n>50。其实，u检验和t检验都属同类，其方法步骤也基本相同，不同的地方仅在于确定P值时界值的选择。

(一)样本均数与总体均数比较的t检验

下面我们以例题提出的问题为例，学习假设检验的一般步骤方法、掌握样本均数与总体均数比较的t检验的过程。

在例题中，某医生在一山区随机抽查了 25名健康成年男子，其脉搏的均数为 74．2次／分，标准差为6．0次／分，这是一个样本。而已知的一般健康成人脉搏均数72次／分可作为总体均数。这是一个样本均数与已知总体均数比较的问题，故选用t检验方法。(有的同学会问，不是说总体均数一般为未知的吗？是的，但医学上也有一些数据比较稳定、经过长时间研究应用的常数，如医学正常值、理论值、标准值，这些有时可作为总体均数来应用。)

①建立检验假设，确定检验水准

H0：µ=µ0，即山区成年男子平均脉搏数与一般成年男子相等

H1：µ＞µ0，即山区成年男子平均脉搏数高于一般成年男子

②确定检验水准

取α=0．05

③选定检验方法，计算检验统计量

因该例为计量资料且 n=25＜50，故选用样本均数与总体均数比较的 t检验。已知 X=74．2次／分，S=6．0次／分，按下式计算统计量：

t=(X-µ)/s_x=1.833

④确定P值

按自由度υ=n-1=25-1=24查t界值表得：

单侧t_0.05,24=1.711; t_0.01,24=2.492

t_0.05,24=1.711<t< t_0.01,24

故单侧0.01<P<0.05。

⑤统计推断，下结论

因0.01<P<0.05，按α=0.05的水准拒绝H0，接受H1，差别有统计学意义。可认为该山区健康成年男子脉搏数高于一般成年男子。

这个例题是一个单侧t检验，就是说研究者只关心山区健康成年男子脉搏数是否高于一般成年男子，并不认为相反结果会成立。但是医学上的大部分研究都必须关心到正反两种结果，如一种新疗法与传统疗法的疗效比较等，所以，除非有确实必要或专业知识的要求，我们一般都要用双侧检验。双侧检验和单侧检验的区别在于①建立假设时的叙述；②确定P值时查表是用单侧或是双侧

(二)配对资料的t检验

有以下两种不同的配对资料：①将实验对象配成对子，分别给予不同的处理，以推断两种处理是否有区别；②对同一实验对象，比较其处理前后的差别，以推断某种处理有无作用，如临床上病人治疗前后某个指标的对比。

(三)两样本均数的t检验

又称成组t检验，适用于完全随机设计两样本均数的比较。完全随机设计是分别从两个研究总体中随机抽取样本，对这www.med126.com/yishi/两个样本均数进行比较，以推断它们所代表的总体是否一致。

其他的还有两大样本比较的u检验、两几何均数比较的t检验等。这些检验思路、方法基本相同，只不过是计算统计量的公式不同而已。

四．假设检验应注意的问题

(1)要有严密的研究设计，这是假设检验的前提。组间应具可比性，也就是除对比的主要因素（如用新药和用安慰剂)外，其它可能影响结果的因素（如年龄，性别，病程，病情轻重等),在对比组间应尽可能相同或相近；应保证样本是从同质总体中随机抽取。

(2)不同变量或资料应选用不同的检验方法。应根据分析目的、资料（变量)类型和分布、设计方案、样本含量大小等选用适当的检验方法。如：配对设计的计量资料采用配对t检验，而完全随机的两样本定量（变量)资料，若为小样本（即任一组 n＜ 50)且方差齐，则选用两小样本t检验；若方差不齐，则选用近似t'检验（Cochran＆Cox法或Satterthwaite法)；若为大样本（每组n＞50)，则可选用大样本u检验。

(3)正确理解“显著性”一词的含义。差别有统计学意义，过去称差别有“显著性”，不能理解为差异大。假设检验的结医学招聘网果并不指差异的大小，只能反映两者是否相同或不同，因此一般采用“有无统计学意义”一词表达。差异的大小只能根据专业知识予以确定。

(4)作结论不能绝对化。因统计结论具有概率性质，不宜用“肯定”，“一定”，“必定”等词。在报告结论时，最好应列出检验统计量的值，尽量写出P值的确切范围（并注明单侧还是双侧)，如写成0．025＜P＜0．05，以便读者与同类研究进行比较。

(5) 统计“显著性”与医学／临床／生物学“显著性”（statistical vs medical／ clinical／ biological significance)。统计“显著性”对应于统计结论，而医学／临床／生物学“显著性”对应于专业结论。假设检验是为各专业服务的，统计结论必须和专业结论有机的相结合，才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致，则最终结论就和这两者均一致（即均有或均无意义)；若统计结论和专业结论不一致，则最终结论需根据实际情况加以考虑。当统计结论有意义，而专业结论无意义，则可能由于样本含量过大或设计存在严重的偏倚（偏性)，那么最终结论则没有意义。例如：有人欲比较A、B两种降压药物的降压效果，随机抽取了高血压病人各100名，分别测定两组病人服药后舒张压的改变值，得两组舒张压改变值之差的平均数为0．11kPa。作两大样本u检验得u＝6．306，P《0．001，有统计学意义。但因A、B两组高血压病人服药后舒张压改变值之差较小，仅0．11kPa，不足有临床意义的差值0．67kPa，故最终结论并无实际意义。相反，统计结论无意义，而专业结论被认为有意义，那就应当检查设计是否合理、统计分析方法应用是否恰当等等，并进一步加以验证。

小　　结

t检验的基本步骤：

① 建立假设：H0、H1

② 确定检验水准：α=0.05

③ 计算统计量t：根据不同的资料选用相应的计算公式

④ 查t值表，确定P值：

t ≥ tα,υ P≤α

t ≤ tα,υ P≥α

⑤统计推断结论

P>0.05,接受H0，差别无显著意义；

0．01<P≤0.05，拒绝H0，接受H1，差别有显著意义；

P≤0.01 拒绝H0，接受H1，差别有非常显著意义。

t检验的注意事项

① 资料必须有可比性；

② 必须是计量资料；

③ 资料必须呈正态或近似正态分布；

④ 要根据不同的资料类型选用不同的计算公式；

要正确理解统计结论的含义。

版书

10’

幻灯

10’

讲解

10’

提问

版书

幻灯

10’

幻灯

10’

幻灯

10’

幻灯

10’

讲解

版书

10’

幻灯

10’

幻灯

10’

外科	妇产科	儿科
内科学	生理学	更多

药理学	中药学	药物化学
生药学	卫生毒理学	更多