患近视眼。其实,这是一种假象。请解释导致这种假象的原因。
答:也许存在患有近视的人作眼保健操的多,即病例组因患有近视而重视眼保健操,而对照组因未患近视而忽视眼保健操。
2. 某从事政治教育的机构,对在押妓女进行教育,观察以后是否从良。研究结果表明,在未失访的全部被教育对象中,彻底改掉原先恶习的人所占的比例相当高,故得出结论:所采取的教育方法非常得力,教育成果巨大。请问:这个评价结论是否科学?为什么?
答:这个评价结论不科学。因在未失访的全部被教育对象中,彻底改掉原先恶习的人所占的比例相当高,这里未交待失访情况,也许这些失访者并未改掉原先恶习,故对教育方法是否得力作出评价需慎重。
3. 病例-对照研究为什么不能计算患病率?横断面研究可否计算患病率?可否计算时点患病率?队列研究可否计算患病率和发病率?为什么?
答:病例-对照研究不能计算患病率,因为总人口中的病例数及未病人数不详;横断面研究可计算时点患病率,因它可获得某地某时点的总人数;队列研究可计算患病率和发病率,因它可获得总人口中的新旧病例数及未病人数。
4. 某研究者在进行吸烟与肺癌关系的调查研究中,以肺结核患者和慢性支气管炎患者作为对照人群。请问:这样选择对照组有何不妥?
答:在该研究中,肺结核和慢性支气管炎是混杂因素。
5. 诱导性问题是指由于问题的措辞、内容等方面的原因使调查对象有意无意地不得不选择某种答案。有鉴于此,在调查表的设计中,不可使用诱导性问题。请问:在调查设计中,一旦使用了诱导性问题,将意味着什么?
答:在调查设计中,一旦使用了诱导性问题,将意味着存在应答信息偏倚。
(方 亚 胡良平 高 永 周诗国)
第15章 样本含量估计 思考与练习参考答案
一、最佳选择题
1. 在假设检验中,样本含量的确定( C )。
A. 只与Ⅰ类错误概率?有关 B. 只与Ⅱ类错误概率?有关
C. 与?、?都有关 D. 与?、?都无关 E. 只与?、?有关
2. 以下关于检验功效的描述,不正确的是( C )。
A. 假设检验中,若H0客观上不成立,但根据假设检验的规则,将有?大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为1??,称为检验功效。
B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和?值等要素的影响。 C. 假设检验的“阴性”结果(P>0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。
D. 假设检验得出“阴性”结果(P>0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。
E. 当假设检验出现“阴性”结果(P>0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。
3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。
A. n?[(t??t?)S?]2 B. n?2?[(t??t?)S?]2
2C. N?[(t??t?)S?]2 D. n?2p(1?p)(Z??Z?)(p1?p2)22
E. n?[Z?2p(1?p)?Z?p1(1?p1)?p2(1?p2)](p1?p2)2
4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。
A. n?[(t??t?)S?] B. n?2?[2(t??t?)S?]2
2C. N?[(t??t?)S?]2 D. n?2p(1?p)(Z??Z?)(p1?p2)22
E. n?[Z?2p(1?p)?Z?p1(1?p1)?p2(1?p2)](p1?p2)2
5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出
来的一切公式进行相应的统计分析。下列说法中( C )最正确。
A. 题中所说的条件和结论都正确 B. 题中所说的条件正确,但结论不正确 C. 题中所说的条件和结论都不正确 D. 题中所说的条件不正确,但结论正确
E. 题中所说的条件和结论正确概率为70%,错误概率为30%
6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N(即拟观测的个体数目)至少应当是自变量个数的10倍。下列说法中( B )最正确。
A. 此法无任何参考价值
B. 在没有精确算法时,此法有一定的参考价值 C. 此法根本不能用 D. 此法永远是正确的
E. 此法正确的概率为80%,错误的概率为20%
二、思考题
1. 决定样本含量的依据有哪些?
答:决定样本含量的依据有:① 犯Ⅰ类错误的概率α,即检验水准。② 犯Ⅱ类错误的概率?。③ 总体平均数?(或总体概率?)、总体标准差?。?(?)、?一般未知,通常以样本的X(p)、S作为估计值,多由预实验、查阅文献、经验估计而获得。④ 处理组间的差别?(所比较的两个总体参数间的差别?),如???1??2或???2??1。若研究者无法得到总体参数的信息,可作预实验来估计,也可根据专业要求由研究者规定。 2. 当假设检验的结果为“阴性”(P>0.05)时,对样本含量和检验功效进行复核有何意义?
答:当假设检验的结果为“阴性”(P>0.05)时,对样本含量和检验功效进行复核具有重要意义。通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。
三、计算题
1. 据说某民族正常人体温平均高于37℃,为了进行核实,拟进行抽样调查。如果就总体而言平均高出0.1℃便不可忽略,而已知正常人体温的标准差约为0.2℃,那么,为了将Ⅰ、Ⅱ类错误的概率控制在??0.05和??0.05,试估计样本含量。
解:据题意,要核实某民族正常人平均体温是否高于37℃,就是要通过抽样对该民族正常人的平均体温作出估计,并检验该平均体温是否高于37℃。很显然,应采用单侧检验。又已知?=0.10,?=0.20,??0.05,??0.05,先取df??,则
t?(?)?t0.05(?)n(1)=1.645,
t?(?)?t0.05(?)2=1.645,将数据代入公式(15-1),得
?(t??t?)S??(1.645?1.645)?0.2?2??????0.1??=??=43.3?44
(1)df?n?1?43,则 取
t?(43)?t0.05(43)?1.681n(2),
2t?(43)?t0.05(43)?1.681,代入公式算得:
?(t??t?)S??(1.681?1.681)?0.2?2??????0.1??=??=45.2?46
(1)df?n?1?45,则 取
t?(45)?t0.05(45)?1.6792,
t?(45)?t0.05(45)?1.679,代入公式计算得:
n(2)2?(t??t?)S?(1.679?1.679)?0.2???????0.1??=???=45.1?46
可取n?46,即需从该民族的正常人群中随机抽取46人进行调查。
2. 某人在进行上述调查之前未经估算便人为决定取样本量n?25。试估计检验功效。
解:据题意,有n?25,?=0.10,?=0.20,??0.05,Z??Z0.05?1.645,将数据代入公式(15-20),得
Z???n0.125?Z???1.645?0.855 ?0.2查表,得检验功效
1???0.8023?0.8051=0.803 7。
23. 为了比较两类片剂的溶解速率,决定各随机抽取10片,测定5 min溶解量,然后作
??0.05水平的检验。据预实验,两类片剂的变异性相同,标准差约为6个单位,均数之
差也约为6个单位,问该项研究的功效有多大?欲使功效达到95%,样本量应当多大?
解:已知n1?10,n2?10,??6,??6,双侧??0.05,Z?/2?Z0.05/2?1.96,将数据代入公式(15-23),得
Z????1/n1?1/n2?Z?/2=
661/10?1/10?1.96=0.276 1
查表,得检验功效
1???(0.6064?0.6103)?0.6084
2要使功效达到95%,需重新估计样本含量:
将数据??6,??6,t?/2(?)?t0.05/2(?)?1.96,t?(?)?t0.05(?)=1.645代入公式(15-6),得
N(1)?4(t?/2?t?)2S2?2(1)4(1.96?1.645)2?62??51.98?52
62取df?N?2?50,则
t?/2(50)?t0.05/2(50)??t0.05/2(40)?t0.05/2(60)??(2.021?2.000)/2?2.0105t?(50)?t0.05(50)??t0.05(40)?t0.05(60)??(1.684?1.671)/2?1.6775
将有关数据代入公式(15-6),得
N(2)?4(t?/2?t?)2S2?24(2.010 5?1.677 5)2?62??54.41?56(取比计算结果稍26大的偶数)
取df?N(2)?2?54,则
t?/2(54)?t0.05/2(54)?t0.05/2(60)?2.000 t?(54)?t0.05(54)?t0.05(60)?1.671
将有关数据代入公式(15-6),得