您的当前位置:首页正文

统计学教案习题08卡方检验

来源:画鸵萌宠网
第八章

2检验

一、教学大纲要求

(一) 掌握内容 1. 2检验的用途。 2. 四格表的检验。

(1) 四格表检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的检验。 3. 行列表的检验。 (二) 熟悉内容

频数分布拟合优度的检验。 (三) 了解内容 1.分布的图形。

2.四格表的确切概率法。

222222二、教学内容精要

(一) 检验的用途

22检验(Chi-square test)用途较广,主要用途如下:

1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 检验的基本思想

1.检验的基本思想是以值的大小来反映理论频数与实际频数的吻合程度。在零假设H0(比如H0:12)成立的条件下,实际频数与理论频数相差不应该很大,即值不应该很大,若实际计算出的值较大,超过了设定的检验水准所对应的界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1(比如H1:12)。 ,A为实际频数(Actual Frequency),T为理论频数(Theoretical Frequency)。四格

T22表检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法: 2. 基本公式:222222AT2pSp(1)n,为总体率,或 (8-1)

p(1p), np为样本率; (8-2)

2.总体率的可信区间

当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布。 总体率的可信区间:(pu/2Sp,pu/2Sp)。 (8-3) (四)检验的基本计算

表8-1 检验的用途、假设的设立及基本计算公式

资料形式 四格表

22用途 ①独立资料两

样本率的比较

②配对资料两 样本率的比较

H0、H1的设立与计算公式 H0:两总体率相等 H1:两总体率不等

①专用公式

自由度 1

(adbc)2n

(ab)(cd)(ac)(bd)②当n40但1T<5时,校正公式

22(adbcn/2)2n(ab)(cd)(ac)(bd)2 ③配对设计RC表

①多个样本率、 构成比的比较

②两个变量之 间关联性分析

(bc1)2bc

(R-1)(C-1)

H0:多个总体率(构成比)相等

(H0:两种属性间存在关联)

H1:多个总体率(构成比)不全相等

(H0:两种属性间存在关联)

频数分布表 频数分布的拟合优

度检验

2n(A21) nRnCH0:资料服从某已知的理论分布 H1:资料不服从某已知的理论分布

(AT)2

T据频数表的组数而定

(五)四格表的确切概率法:当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。

2(六)检验的应用条件及注意事项

21.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正检验;T1,或n40时,

用Fisher精确概率法。

2.对于RC表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;

(2)注意考察是否有有序变量存在。对于单向有序RC表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的RC表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的RC表资料,为考察两种方法检测的一致性,应选用Kappa检验。

三、典型试题分析

(一)单项选择题

1.下列哪项检验不适用检验( )

A. 两样本均数的比较 B. 两样本率的比较

C. 多个样本构成比的比较 D. 拟合优度检验

答案:A[评析] 本题考点:检验的主要用途。检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher精确概率法( )

A.140 B.T<5 C.T1或n40 D.T1或n100

答案: C[评析] 本题考点:对于四格表,当T1或n40时,不宜用检验,应用Fisher精确概率法。 3.值的取值范围为

222A.<< B.0 C.1 D.0

222222 答案: B[评析]根据分布的图形或的基本公式可以判断值一定是大于等于零且没有上界的,故应选B。

(二)是非题

两样本率的比较可以采用检验,也可以采用双侧u检验。答案:正确。 [评析]就两个样本率的比较而言,双侧u检验与检验是等价的。 (三)简答题

1.四格表的检验和u检验有何联系与区别?

答案:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用检验,两者是等价的,即u;相异点:(1)u检验可进行单侧检验;(2)满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)检验可用于22列联表资料有无关联的检验。

2.RC表检验的适用条件及当条件不满足时可以考虑的处理方法是什么?

答案:RC表检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,

222222222222使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况

肥胖

发生 未发生 19 5 12 86 31 91

2正常体重 发 生

未发生 合 计

合计 24 98 122

[评析]这是一个配对设计的资料,因此用配对检验公式计算。 H0:肥胖者与正常体重者的静脉曲张发生情况无差别 H1:肥胖者与正常体重者的静脉曲张发生情况不同 0.05 2(bc1)2bc=

512125122.12,1

22=2.11<0.05,1,P>0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。对三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较 有效人数 无效人数 合计 51 84 135 6 26 32 5 13 18 62 123 185

矫治方法 夏天无眼药水 新医疗法 眼保健操 合计 有效率(%) 37.78 18.75 27.78 33.51

[评析]

H0:三种措施有效率相等

H1:三种措施有效率不相等或不全相等 0.05

22222512A284626513=4.498,=(2-1)1(3-1)=2 n(1)=18562135123135623212332621812318nrnc查表得0.25>P>0.10,按0.05水准不拒绝H0,尚不能认为三种措施有效率有差别。

23.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%)

100 41 颈麻

100 94 注药

100 89 置栓

100 27 对照

[评析] 为了应用检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

表8-5 4种镇痛方法的效果比较

镇痛方法 有效例数 无效例数 合计

41 59 100 颈麻

94 6 100 注药

89 11 100 置栓

27 73 100 对照

251 149 400 合计

2H0:4种镇痛方法的效果相同 H1:4种镇痛方法的效果不全相同

0.05

22412A25973...1=146.175, n(1)=400251100149100149100nrnc2=(4-1)(2-1)=3

查表得P <0.05,按0.05水准拒绝H0,接受H1,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

1. 关于样本率p的分布正确的说法是: A. 服从正态分布 B. 服从分布

C. 当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布 D. 服从t分布 2. 以下说法正确的是: A. 两样本率比较可用u检验 B. 两样本率比较可用t检验 C. 两样本率比较时,有u D. 两样本率比较时,有t 3. 率的标准误的计算公式是: A.

p(1p) B.

2222pp(1p) C. D.

n1np(1p) n4. 以下关于2检验的自由度的说法,正确的是: A.拟合优度检验时,n2(n为观察频数的个数) B.对一个34表进行检验时,11 C.对四格表检验时,=4

22D.若0.05,0.05,,则

5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?

A.不能确定 B.甲、乙法一样 C.甲法优于乙法 D.乙法优于甲法

6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是: A.分性别比较 B.两个率比较的2检验 C.不具可比性,不能比较 D.对性别进行标准化后再做比较 7.以下说法正确的是

A.两个样本率的比较可用u检验也可用2检验 B.两个样本均数的比较可用u检验也可用2检验 C.对于多个率或构成比的比较,u检验可以替代2检验 D.对于两个样本率的比较,2检验比u检验可靠 (二) 名词解释

1. 实际频数与理论频数 2. 2界值表 3. 拟合优度 4. 配对四格表

5. 双向有序分类资料 6. 率的标准误

7. 多个率的两两比较 8. Fisher精确概率 9. McNemar检验 10. Yates校正

(三) 是非题

2四个样本率做比较,20.05(3) ,可认为各总体率均不相等。 (四) 计算题

1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?

2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?

表8-6 冠心病诊断结果与眼底动脉硬化级别的关系

眼底动脉硬化级别 冠心病诊断结果

正常 可疑 冠心病 0 340 11 6 I 73 13 6 II 97 18 18 III 3 2 1

513 44 31 合计

合计 357

92 133 6 588

3.表8-7是用两种方法检查已确诊的乳腺癌患者120名的检查结果,问:两种方法何者为优?

表8-7 两种方法检查结果比较

甲法

合计

+ - 42 18 60 30 30 60 72 48 120

乙法 +

- 合计

4.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?

表8-8 两种方法检查结果比较 粪见检阴性人数 阴转率(%)

25 86.2 17 60.7 42 73.7

组 别

试验组 对照组 合 计 观察人数 29 28 57

5.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9,问三个疗程组的有效率之间有无显著差异?

表8-9 冠心2号方治疗心绞痛的有效率 例数 有效例数 有效率(%) 110 82 74.5 150 130 86.7 63 56 88.9 323 268 83.0

疗 程

一疗程 二疗程 三疗程 合 计

6.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表8-10。问两组肝波型的差异有无显著性?

表8-10 急性黄疸型肝炎与正常人的超声波波形

组别 波 型

正常 可疑 较密

12 43 232 黄疸型肝炎组

277 39 11 正 常 人 组

289 82 243 合计

合计 287

327 614

7.有人研究惯用手与惯用眼之间是否存在一定关系,得资料如表8-11,试作统计分析。

惯用左手 两手并用 惯用右手 合 计

表8-11 冠心2号方治疗心绞痛的有效率 惯用左眼 两眼并用 惯用右眼 34 62 28 27 28 20 57 105 52 118 195 100

合计

124 75 214 413

8.苏格兰西南部两个地区献血人员的血型记录如下表(表8-12),问两地的血型分布是否相同?

表8-12 两个地区献血人员的血型分布 血 型 A B O AB 33 6 56 5 54 14 52 5 87 20 108 10

地区

Eskdale

Annandale 合计

合计 100 125 225

五、习题答题要点

(一) 单项选择题

1.C 2.A 3.D 4.D 5.A 6.D 7.A (二) 名词解释

1.实际频数:actual frequency,即实际观察值。理论频数:theoretical frequency,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

2.2界值表:将2分布右侧尾部面积等于时所对应的2值称为2分布的临界值,对于不同的自由度及有不同的临界值,由这些临界值构成的表即2界值表。

3.拟合优度 :指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

4.配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A处理,另一个接受B处理,每种处理的反应都按二项分类。全部n对实验结果的资料以表8-12表示,这样的表称为配对四格表。

表8-12 配对四格表的形式 A处理 + - 5.

B处理 + a c - b d 双向有序分类资料:对于RC表资料,当两个定性变量都有序时,这样的资料称为双向有序分类资料,如

“急性放射病分度与放射烧伤面积占不同体表面积的百分比”,这里的两个变量均为有序的。

6.

率的标准误:用以衡量由于抽样引起的样本率与总体率之间的误差的统计量,记为P。p(1)n,为总体率,n为样本容量;当总体率未知时,以样本率P作为的估计值,率的标准误为Sp7. 8.

p(1p)。 n多个率的两两比较:指当假设检验确定了多个率之间存在差别后,检验哪两个两个样本率之间的差别具有统Fisher精确概率: 指当四格表中出现理论数小于1或n<40时,用R.A.Fisher(1934)提出的方法直接计算

计学意义的方法。

出的有利于拒绝H0的概率。

9. McNemar检验:McNemar’s test for correlated proportions,是分析配对四格表资料的方法,其计算公式为2(bc1)2bc,v=1。

10.Yates校正:英国统计学家Yates F认为,由于2分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对2值作连续性校正(correction of continuity),这一校正即所谓的Yates校正(Yates’ correction)。

(三) 是非题

错。多个样本率做比较时,H1为各总体率不全相等,所以当接受H1时,并不能说明各总体率均不相等。 (四) 计算题:

1.将资料整理成四格表

手术方法

电切术 开放手术

合并症 + 11 1 12 - 71 38 109 82 39 121 用四格表校正公式算得22.37,P>0.05,尚不能认为两种手术的合并症发生率有差异。 2.该资料属双向有序分类资料,用2检验解决。

H0: 冠心病诊断结果与眼底动脉硬化级别无关联 H1: 冠心病诊断结果与眼底动脉硬化级别有关联

0.05

22=61.59, 2<0.01,6,P<0.05,

按0.05水准拒绝H0接受H1,故可认为冠心病与眼底动脉硬化有关联。 3.采用配对2检验。

H0: 两法不分优劣 H1: 两法能分优劣 0.05

2=3.00,按0.05水准不拒绝H0,尚不能认为检出率有差别。

4.可用u检验或2检验。用2检验时,首先将资料整理成四格表形式,然后再代入公式。算得2=4.774,按

0.05水准拒绝H0接受H1,认为两组阴转率差别有统计学意义。

5.用RC表2检验公式算得2=8.539,v=2,P<0.05,,按0.05水准拒绝H0接受H1,三个疗程有效率的差异有统计学意义。

6.用RC表2检验公式算得2=443.456,v=2,P<0.05,,按0.05水准拒绝H0接受H1,两组肝波型的差异有统计学意义。

7.由2检验公式算得2=4.020,v=4,P>0.05,,按0.05水准不拒绝H0,尚不能认为惯用手与惯用眼之间存在关系。

8.本例只有一个格子的理论频数小于5,故仍可用2检验。2=5.710,v=3,P>0.05,,按0.05水准不拒绝H0,尚不能认为两地的血型分布不同。(徐勇勇 马跃渊)

因篇幅问题不能全部显示,请点此查看更多更全内容

Top