一.单选题
1.均数和标准差的关系是( ) 愈大,s愈大 愈大,s愈小
愈大,对各变量值的代表性愈好 愈小,与总体均数的距离愈大 愈小,对各变量值的代表性愈好
2.对于均数为μ、标准差为σ的正态分布,95%的变量值分布范围为 ( )
A.μ-σ~μ+σ B.μσ~μ+σ C.μσ~μ+σ ∞~μ+σ ~μ+σ
3.设x符合均数为μ.标准差为σ的正态分布,作u=(x-μ)/σ的变量变换,则 ( )
符合正态分布,且均数不变 符合正态分布,且标准差不变
符合正态分布,且均数和标准差都不变 符合正态分布,但均数和标准差都改变 不符合正态分布
4.在比较两个独立样本资料的总体均数时,进行t检验的前提条件是 ( )
A.两总体方差相等 B.两总体方差不等 C.两总体均数相等 D.两总体均数不等 E.以上都不对
5.在同一总体中作样本含量相等的随机抽样,有99%的样本均数在下列哪项范围内 ( )
A.± B.± C.μ± D.μ± E.μ± 分布与标准正态分布相比 ( )
A.均数要小 B.均数要大 C.标准差要小 D.标准差要大 E.均数和标准差都不相同
7.由两样本均数的差别推断两总体均数的差别,所谓差别有统计学意义是指( )
A.两样本均数差别有统计学意义 B.两总体均数差别有统计学意义
C.其中一个样本均数和总体均数的差别有统计学意义 D.两样本均数和两总体均数差别都有统计学意义 E.以上都不是
8.要评价某市一名8岁女孩的身高是否偏高或偏矮,应选用的统计方法是( )
A.用该市8岁女孩身高的95%或99%正常值范围来评价 B.作身高差别的假设检验来评价
C.用身高均数的95%或99%可信区间来评价 D.不能作评价 E.以上都不是
9.若正常人尿铅值的分布为对数正态分布,现测定了300例正常人的尿铅值,以尿铅过高者为异常,则其95%参考值范围为( ) A. lg(x± Slgx )
lgx-1
B. lg(x± Slgx )
lgx-1
C. <lg(x+ Slgx )
lgx-1
D. <lg(x+ Slgx )
lgx-1
E. >lg(x- Slgx )
lgx-1
10.某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大约为( ) kg
11.单因素方差分析中,造成各组均数不等的原因是( ) A.个体差异 B.测量误差 C.个体差异和测量误差 D.各处理组可能存在的差异 E.以上都有
12.已知2006年某医院住院病人中,胃癌患者占5%,该指标为 A.发病率 B.构成比 C.标化发病率 D.相对比 E.以上都不是
13.某地男性肺癌发病率是女性的10倍,该指标为 A.构成比 B.相对比 C.定基比 D.流行率 E.以上都不对 14.下列指标中,哪个是相对比指标
A.中位数 B.均数 C.变异系数 D.标准差 E.几何均数
15.分别采用Z检验和χ2检验,对两个率的差别进行假设检验,则求出的Z值和χ2值的关系是
A.χ2检验比Z检验准确 检验比χ2检验准确
2=χ2 = E.χ2=Z
16.某医师采用两种不同的药物治疗甲.乙两组相同疾病的患者,其中甲组的患者数是乙组的10倍,假设两组治愈率相等,比较两总体治愈率的95%置信区间,则有
A.甲组的较乙组的精密 B.甲组的较乙组的准确 C.乙组的较甲组的精密 D.乙组的较甲组的准确 E.以上都不对
17.某研究人员为比较甲.乙两县的胃癌死亡率,现以甲.乙两县合计的人口为标准计算标化死亡率。假设对甲县而言,以各年龄组人口数为标准算得的标化率为p1,以各年龄组人口构成为标准算得的标化率为p2,则 >p1 =p1 <p1 比p1要准确 比p2要合理 18.检验主要是检验
A.两个观察的实际数间的吻合程度 B.观察的实际数与假设的理论数吻合程度 C.两个计算的理论数间的吻合程度 D.两样本率间的吻合程度 E.样本率与总体率间的吻合程度
19.某医师进行了四组人群的血型情况研究,每组人群有A、B、AB和O型四种血型的人数各若干,要比较四组人群血型分布的差别,则要进行 检验 B.?2检验 检验 D.秩和检验 E.回归分析 20.四个样本率的比较,进行 χ2检验,其自由度为
21.关于行×列表资料的?2检验,下列哪项是正确的 A.任何一格1≤A< 5,则要进行合理合并 B.任何一格1≤T < 5,则要进行合理合并 C.若有1/5格子以上1≤T < 5,则要进行合理合并 D.若有1/5格子以上1≤A < 5,则要进行合理合并
E.以上都不对
22.对于某四格表资料,用?检验的基本公式算得?值为12,用专用公式算得为22,则两者的关系是
22222222221221212121A.> B.= C.< D.比准确 E.比准确
22
23.若仅已知样本率,估计率的抽样误差,应用下列哪个指标表示? A.p B.sx E.?
24.某人从甲.乙两文中查到同类研究,均采用四格表资料?检验对两个率进行了比较,结果显示 甲文?>02.01,1,乙文?>02.05,1,可认为 A.乙文结果更为可信 B.两文结果有矛盾 C.甲文结果更为可信 D.两文结果基本一致 E.甲文说明总体的差异较大
参考答案 一、单选题
2
2
2
二.简答题(一)
1.常用的相对数指标有哪些?它们的意义和计算上有何不同? 2.应用相对数的注意事项有哪些? 3.什么情况下需要进行率的标准化? 4.率的抽样分布有何规律和特征? 5.率的标准误的意义和用途。 6.率的Z检验的应用条件是什么? 7.χ2检验的基本思想如何? 8.χ2检验的主要用途有哪些?
9.四格表资料使用? χ2检验有何规定?
10.四格表资料确切概率法如何进行双侧、 单侧检验? 11.行×列表资料的χ2检验应注意哪些事项? 简答题(二)
1.假设检验.区间估计之间的联系?在检验两均数差别上两者有何区别?
2.何为标准化法?直接标准化法与间接标准化法的区别? 分布的特点
4.交互作用与混杂的区别? 5.非参数检验的优点和不足。 简答题(一) 参考答案
1.常用的相对数指标有率.构成比.相对比。
率 是某现象实际发生数与可能发生该现象的总数之比,用以说明某现象发生的频率或强度。其计算公式 ,式中K为比例基数,主要依习惯而定或使计算结果能保留1~2位整数。
构成比 指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。通常以100%为比例基数,故又称百分比。计算公式
相对比 指两个有关指标之比,说明两个指标的比例关系。若比值大于1,用倍数表示,比值小于1,用百分数表示。通常两个指标互不包含。 计算公式 (或×100%) 2.应用相对数的注意事项 (1)计算率或构成比时分母不宜过小
(2)正确区分构成比和率 构成比说明事物内部某组成部分占其全部的比重或分布,分子是分母的一个组成部分;而率是说明某现象出现的频率,分子是分母发生某现象的例数。
(3)正确计算平均率(合计率) 对分组资料计算平均率(合计率)时,不是由几组率简单相加或平均求得,而是由各组实际发生总数与各组可能发生总数之比得到。
(4)应注意资料的可比性 在率或构成比进行比较时,除了要比较的因素外,其他影响的因素应基本一致。在比较内部构成不同的两个合计率时,通常还需要进行率的标准化。
(5)样本率或构成比进行比较时要作假设检验
3.在两个合计率作比较时,当其资料内部构成不同,并且对结果有影响,此时需采用率的标准化方法,对内部构成进行齐同,以使其具有可比性。 4.样本率的抽样分布规律为服从二项分布,即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。率的抽样分布具有如下特征 ①为离散型分布;②当π=时,呈对称分布;③当n增大时,只要π不太接近0或1,二项分布逐渐逼近正态分布。一般认为,当nπ和n(1-π)≥5时, 可看作近似正态分布。
5.率的标准误是反映率的抽样误差大小的统计指标,它可用于率的置信区间估计和假设检验。
6.当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),此时样本率的抽样分布近似正态分布,可按正态分布的理论来进行率的Z检验。
7.用χ2检验基本公式来说明? χ2检验的基本思想,χ2值反映的是实际频数与理论频数的吻合程度,在检验假设H0成立的情况下,实际频数与理论频数差别仅由随机误差所致,其? χ2值会比较小;反之,其χ2值会比较大,χ2值越大,就越有理由认为检验假设H0不成立。此外,自由度一定时,χ2值概率分布是确定的。 8.χ2检验的主要用途有 (1)两个或多个样本率的比较;
(2)两个或多个样本构成比的比较; (3)其它,如频数分布拟合优度检验等。 9.四格表资料使用χ2检验有关规定为
(1)N≥40,且T≥5时,直接计算χ2值,不用校正; (2)N≥40,且1≤T<5时,用连续性校正χ2检验; (3)N<40或T<1,不能用χ2检验,用直接计算概率的方法。
10.列出周边合计数不变的各四格表组合,双侧检验时,选择大于等于实际四格表的组合,计算其Pi之和。单侧检验时,若设H1:?1>χ2?2,求大于等于实际四格表值的各组合Pi之和;当设H1:?1<χ2时,则求小于等于实际四格表值的各组合Pi之和。得到的P值与检验水准比较后对检验假设作出判断。
11.行×列表资料? χ2检验的注意事项有
(1)作行×列表资料χ2检验时,要求不能有1/5以上的格子理论频数小于5,或者不能有任意一个格子的理论频数小于1,否则易导致分析的偏性。出现这些情况时可采取以下措施 ①在可能的情况下再增加样本含量;②若专业上允许,可将过小的理论频数所在的行或列的实际数与相邻的行或列中的实际频数合并;③删去理论频数过小的行和列;④行×列表资料确切概率法。 (2)如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间都有差别,若要进一步分析彼此之间的差别,可将行?列表分割,再进行?2检验。
(3)单向有序的行×列表资料,即等级资料,不宜用χ2检验比较两组效应,若作χ2检验只能说明各处理组的效应在构成比上有无差异。
简答题(二) 参考答案
1.假设检验.区间估计之间的联系?在检验两均数差别上两者有何区别? (1)假设检验用于推断质的不同,即判断两个或多个总体参数是否不等,而可信区间用于说明量的大小,即推断包含总体均数的可能范围。
(2)联系在于,可信区间亦可回答假设检验的问题,在判断两个总体参数是否不等时,两者是完全等价的。
(3)另一方面,可信区间不但能回答差别是否有统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。
(4)可信区间只能在预先规定的概率——检验水准a的前提下进行计算。 (5)假设检验虽然也需要规定一个检验水准,但是能够获得一个较为确切的概率P值,并且可以通过P值与不同的检验水准进行比较,从而使一型错误的概率更为确切,范围更小。
2.何为标准化法?直接标准化法与间接标准化法的区别?
(1)采用某影响因素的统一标准构成对原始率进行校正,消除原样本内部某影响因素构成不同对合计率的影响,使通过标准化后的标准化率具有可比性,称为标准化法。 区别
(2)如对死亡率的年龄构成进行标准化,若已知年龄别死亡率,可采用直接法,选择一个标准年龄人口构成为权数直接计算标准化率;
(3)若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法,选择一个标准年龄别死亡率,先计算实际死亡人数与期望死亡人数之比,即标化死亡比(SMR),再用SMR乘以标准总死亡率得标准化死亡率。 分布的特点
(1)总体均数和方差相等。
(2)当n很大,而π很小,且nπ=λ为常数时,Possion分布可看做是二项分布的极限分布,
(3)当λ增大时,Possion分布近似正态分布,一般而言,λ>=20时,Possion资料可作为正态分布处理。
(4)Possion分布具备可加性,即对于服从Possion分布的m个互相独立的
随机变量.…….Xm,它们之和也服从Possion分布,且其均数是这m个随机变量的均数之和。 4.交互作用与混杂的区别? (1)概念不同
混杂 与所研究的暴露因素和疾病都有联系的外部因子,可以歪曲(掩盖或夸大)暴露因素与疾病之间真正联系。
交互 与所研究的暴露因素和疾病都有联系的外部因子,它的存在使得暴露因素和疾病之间的效应发生真实的改变。 (2)性质不同
混杂 造成偏倚,影响结果的真实性。不是一个因素固定不变的特性,即在一项研究中它起混杂作用,而在另一项研究中却不是混杂因子。
交互 是一种真实的效应。所产生的效应是恒定的,从数学上来说是常数。 (3)处理的方法不同
混杂 应尽量避免与消除。它存在与否取决于研究设计,可以通过设计的更改进行防止。
交互 应尽量去发现,评价。它的存在与否与研究设计无关。 5.非参数检验的优点和不足。
(1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料;
(3)非参数检验很适用于小样本,并且计算简单;
(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息,检验效能低;
(5)非参数检验法目前还不能用于处理因素间的交互作用。 三.论述题( 应用题)
1.某临床医生分别用A、B两种药物治疗动脉硬化患者,共68例,具体结果如下表,问这两种药物治疗动脉硬化患者的疗效有无差别?
两种药物治疗动脉硬化患者的疗效情况两种药物治疗动脉硬化患者的疗效情况
2.在某牧区观患者植物血凝试验反应,资活动型与稳定
PHA皮试反应阳性率有无差别? 两型慢性布氏病PHA皮试反应
分型
例数 阳性数
1 3 4
阳性率(%)
处理 A药 B药 合计
例数 有效人数 有效率(%) 31 32 63
25 29 54
察慢性布氏病素(PHA)皮肤料如下表,问型布氏病患者
活动型 15 稳定型 10 合计
25
3.某疾病预防控制中心随机选取了某市5个班级的中小学生,共175名,观察三种矫治近视措施的效果,近期疗效数据如下表,故得出结论 “近期疗效要以眼舒润眼液最好,保健操次之,新疗法最差”。试对此进行评价。 三种措施的近期有效率
矫治方法 眼舒润眼液 新疗法 眼保健操
观察例数 135 32 18
近期有效率(%)
4.某研究者为研究两种方法对乳腺癌的检出率,分别用这两种方法对已确诊的乳腺癌患者120名进行了检查。结果发现,甲法检出率为60%,乙法检出率为50%,甲.乙两法一致的检出率为35%。问甲.乙两种方法检出率有无差别?
5.某医学院教师为研究家庭关系好坏对老年人生活满意度的影响,调查了343
例离退休老年人,结果如下表,试分析家庭关系状况与老年人生活满意度的关系。
343例离退休老年人的家庭关系与生活满意度
家庭关系 和睦 一般 差 合计
满意度 满意 不满意 174 36 6 216
60 57 10 127
合计 满意度(%) 234 93 16 343
6.某市100名7岁男童的坐高(cm)如下
(1)编制其频数分布表并绘制直方图,简述其分布特征;
(2)计算中位数.均数.几何均数,用何者表示这组数据的集中趋势为好? (3)计算极差.四分位数间距.标准差,用何者表示这组数据的离散趋势为好? 应用题答案
1.答 用四格表资料?2检验校正公式,?2=,P>,按?=水准,不拒绝H0,差异无统计学意义,尚不能认为两种药物治疗动脉硬化患者的疗效有差别。 2.答 用四个表资料确切概率法,双侧检验,P=>=,不拒绝H0,差异无统计学意义,尚不能认为两型慢性布氏病PHA皮试反应阳性率有差别。 3.答 没有进行假设检验,不能得出结论。本例,可以进行卡方检验再下结论。
4.答 采用配对四格表资料的?2检验,得?2=,P>,按?=水准,不拒绝H0,差异无统计学意义,尚不能认为两种方法检出率有差别。
5.答 采用行×列表资料的?2检验,?2=,P<,拒绝H0,接受H1,差异有统计学意义,可以认为家庭关系和老年人的生活满意度有关。
6.答 1.均数=(cm),中位数=(cm),用均数表示这组数据的集中趋势为好。(由于本资料服从正态分布,中位数与均数比较接近,因此也可以用中位数表示这组数据的集中趋势)
极差=(cm),标准差=(cm),四分位数间距=(cm),用标准差表示这组数据的离散趋势为好。
因篇幅问题不能全部显示,请点此查看更多更全内容