第二章:统计
2.1随机抽样
第一课时 2.1.1简单随机抽样
教学要求:正确理解随机抽样的必要性和重要性,掌握简单随机抽样的两种方法(抽签法和随机数法)的一般步骤,能从生活实际中提出一定价值的统计问题. 教学重点:掌握抽签法和随机数表法的一般步骤.
教学难点:正确理解样本的随机性,合理选择抽签法与随机数法. 教学过程:
一、复习准备:
1、讨论:如何对一批袋装牛奶质量进行检查? (普查的弱点;抽样省时、省力→抽样必要性) 2、讨论:什么是总体与样本?怎样获取样本呢?什么样的样本是一个好的样本? 如何通过一勺汤的味道来判断一锅汤的味道?(关键在于将总体“搅拌均匀”)
阅读著名的统计调查失败的案例,思考美国总统选举的民意测验与实际选举结果为何相反? 二、讲授新课:
1、教学简单随机抽样的概念:
① 思考:如要在我们班选出五个人去参加劳动, 应当怎样选呢? 怎样选才是最公平的呢?
② 简单随机数法的概念: 一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 就把这种抽样方法叫做简随机抽样. 有抽签法与随机数法两种方法.
强调三点: 不放回的抽取;样本个数n小于等于总数N;抽到的机会相等. ③练习:下列抽样的方式是否属于简单随机抽样?为什么?
A.从无限多个个体中抽取50个个体作为样本. B.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子. 2、教学抽签法和随机数法
① 抽签法也叫抓阄法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
② 游戏: 给班上的每位同学编上号码,然后让同学用小纸条把号码写下来放在粉笔盒里,我把小纸条搅拌均匀,随机的抽出五个号码,被抽到的同学会有奖品. 在这个游戏结束以后,由同学来总结抽签法的步骤:
给个体编号 → 在不透明的容器里搅拌均匀 → 要不放回随机的抽取.
③讨论:抽签法的优点和缺点?(优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,使样本代表性差的可能性很大. )
④ 随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法. ⑤ 出示例:从800袋牛奶种抽取出60袋看一看质量是否达标. 给每一袋牛奶编号. → 在随机数表中任选一个数(表略),在这个向右读(也可向左),连取三位,包含它本身,比如785,因为对应的编号785<800,说明这个号码在总体内所以将它取出. 然后继续向右读916 ,因为916>800,所以舍去. 然后到末行的时候可以向上也可以向下读,直到取够60个为止. (▲带领同学反复练习,使同学学会如何使用随机数表. )
⑥讨论:随机数法的优点和缺点? (优点:当个体数量较多时,个体有均等的机会被抽中. 缺点:个体数量很多时,对个体编号的工作量太大;“搅拌均匀”也比较困难. )
3、小结:简单随机抽样两种方法操作步骤及优、缺点. (优点:对个体数量较少时,抽取样本简便易行. 缺点:当个体数量较多时,对个体编号的工作量太大,使操作不快捷. )
三、巩固练习:1、P47-1,2,3,4 2、作业:从100件产品中抽10件,试写两种操作步骤. 读报.
(将100件编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.)
第二课时 2.1.2系统抽样
教学要求:正确理解系统抽样的概念;掌握系统抽样的步骤;正确理解系统抽样与简单随机抽样的关系;掌握系统抽样的优点和缺点.
教学重点:掌握系统抽样的步骤.
教学难点:系统抽样时,当分段间隔k不是整数的时候怎么办. 教学过程:
一、复习准备:
1. 提问:简单随机抽样应注意几点?有哪几种方法?每种方法的优点和缺点是什么? 2. 分别用两种方法设计从本班学生53人中抽取5人进行调查的抽样方案.
3. 引入:当个体的数量较多的时候,为了使个体的被抽中的机会均等,要用随机数法.
可是数量太多,编号的工作量又太大,也很难搅拌均匀. 面对这种情况,我们今天来学一种新的抽样方法——系统抽样. 二、讲授新课:
1、教学系统抽样的概念及步骤:
① 系统抽样概念:当总体中的个体数较多时,将总体的每个个体进行编号,并根据样本数对编号进行分段,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需样本的抽样方法. ② 进行系统抽样的步骤:
(1)先将总体的N个个体编号. 有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等; (2)确定分段间隔k,对编号进行分段.当N/n(n是样本容量)是整数时,取k=N/n; (3)在第一段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本. 通常是将l加上间隔k得到第2个个体编号(l+k),再加得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
NN;若不是整数时,
nn可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n整除. 每个个体被剔除的机会相等,从而使整个抽样过程中每个个体被抽取的机会仍然相等. 2、教学例题:
① 出示例:我校为了了解高一年级学生对教师教学的意见,打算从高一年级的500名学生中抽取50名进行调查. 用系统抽样的方法,你怎样进行操作呢?
解:第一步,编号,给500名同学编号.(注意和随机数法不同,500人、编号不一定是三位数. 如1,2,3. . . ) ; 第二步,分段,确定分段间隔k=500/50=10.(把500人分成了10段); 第三步,确定起始号,在第一段1~10里随机的选一个数(抽签法)比如6;第四步,抽取样本,每隔10个号码抽取一个,要选的50个数的编号是6、16、26、36、46. . . . . . . . . 496(如果第三步选的是10,则他们的编号是10、20、30. . . . 500)
② 思考:当第二步的k不是整数的时候怎么办呢? 例题变式502人. (先随机剔除几个个体) ③ 练习:在2003名同学间选出100人进行有关视力的问卷调查,你怎样选取样本呢? 分析:我们知道2003/100不是整数,这时我们就要随机的选出3名同学(用什么方法?) 然后再重新进行编号,步骤就和能整除的时候一样了.
3、小结:由同学来总结系统抽样有那些优点和缺点. (优点:可以利用个体自身的编号,对数量较多的个体操作比较便捷. 缺点:当对总体情况不是很了解的情况下,样本的代表性较差. ) 注意:在使用抽样方法时,总体的数量较多,但必须要对总体有个大概了解的前提下. 三、巩固练习:
1、练习:P49-1,2,3;读报(第30期第1版文);阅读:广告数据的可靠性. 2、作业:P54-6.
③ 注意:分段间隔k的确定. 当总体个数N恰好是样本容量n的整数倍时,取k?
第三课时 2.1.3分层抽样
教学要求:使学生掌握分层抽样的方法,并能结合以前学过的知识对三种抽样方法进行比较,活学活用,并能把三种抽样方法融会贯通处理一些复杂的问题,使样本有更好的代表性. 教学重点:运用分层抽样的方法抽取样本.
教学难点:恰当选用三种抽样方法解决实际问题. 教学过程:
一、复习准备:
1、提问:一般在什么条件下使用系统抽样?系统抽样都有那些步骤?当分段间隔不是整数的时候怎么办? 2、试设计从高一学生804人中抽取40人进行调查的抽样方案.
变式:学校高一学生800人,高二640人,高三560人,从全校抽取100人,如何抽样?
3、引入:当对总体情况不是很了解的情况下用系统抽样,样本的代表性可能会很差,比如抽取的可能都是男生,或都是女生. 而且有时一些问题农村和城市,老人和孩子等都有很大的差异,当总体存在很大的差异时,我们怎么办呢,今天我们来学习第三种抽样方法分层抽样. 二、讲授新课:
1、教学分层抽样概念及步骤:
① 定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
② 步骤:根据已掌握的信息,将总体分成互不相交的层;根据总体中的个体数N和样本容量n计算抽样比kn=;确定第i层应该抽取的个体数目ni≈Ni×k(Ni为第i层所包含的个体数),使得诸ni之和为n;在各N个层中,按第三步中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本.
③ 出示例:一支田径队有男运动员56人,女运动员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本. 分析:因为有男,女两个互不交叉的层,所以选用分层抽样. 因为总体的个数是56+42=98,样本容量为28,一定的比例对该题而言样本容量除以总体的个数为28/98=2/7,那么在男队员中应选取的人数为56*2/7=16人,女队员中应选取的人数为42*2/7=12人.
解:田径队共有人数56+42=98人,样本容量为28人,则总数与样本容量的比是28:98=2:7, 男队员中应选取的人数为56*2/7=16人,女队员中应选取的人数为42*2/7=12人. ④ 练习:某地区想调查中小学学生的近视情况,已知高中生有2400人,初中生有10900人,小学生有11000人,如果要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
分析:因为被调查的总体有很明显的差异,所以要使用分层抽样,找到样本容量与总体个数的比例,再和每个层的个体数相乘,得到的样本数量之和就是应抽取的人数.
解:因为要抽取1%,所以样本容量与总体个数的比例为1:100,则高中应抽取人数为2400*1/100=24,初中应抽取人数为10900*1/100=109,小学应抽取人数为11000*1/100=110 思考:如何在2400中抽取24人呢? 2、比较三种抽样方法:
① 简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法都建立在此基础上. 在系统抽样的各段抽样、分层抽样的各层抽样,都需简单随机抽样来实现.
② 分析与比较三种抽样方法的要点、共同点、不同点、联系、适应范围.(见报第30期第1版) 三、巩固练习:
1、练习:教材P52第1、2、3题. 2、作业:教材P54 第5题;读报(《数学周报》第30期).
2.2用样本估计总体
第一课时 2.2.1 用样本的频率分布估计总体分布(一)
教学要求:通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布.
教学重点:会列频率分布表,画频率分布直方图. 教学难点:能通过样本的频率分布估计总体的分布. 教学过程:
一、复习准备:
1. 讨论:我们要了解我校学生每月零花钱的情况, 应该怎样进行抽样. 2. 提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?
3. 讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)
指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征. 二、讲授新课:
1、教学频率分布直方图的作法:
① 引例:确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?为了了较为合理地确定出这个标准,需要做哪些工作?
② 讨论:如何采用抽样调查的方式,得到本市的居民月均用水量? ③ 给出100位居民的月均用水量表,讨论:如何分析数据?
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息
④ 频率分布的概率:频率分布是指一个样本数据在各个小范围内所占比例的大小. 一般用频率分布直方图反映样本的频率分布.
⑤ 作频率分布直方图的步骤:
求极差(数据组中最大值与最小值的差距); 决定组距与组数(强调取整);将数据分组;列频率分布表(包括分组、频数累计、频数、频率);作频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)
⑥ 例:作出教材P56页 居民月均用水量的频率分布直方图. (师生共同按步骤完成)
⑦ 讨论:纵坐标为何取频率/组距? (用矩形面积表示频率) 结论:用矩形面积表示频率,总面积为1.
注:频率分布表列出的是在名个不同区间内取值的频率,直方图是用小长方形面积的大小来表示在各个区间内取值的频率.
2、分析对比频率分布直方图:
① 将组距确定为1,作出教材P56页 居民月均用水量的频率分布直方图.
② 讨论:谈谈两种组距下,你对图的印象? 同一个样本数据,绘制出来的分布图是唯一的吗? (当取不同的组距,得到不同形状的图形,不同的图形给人的感觉也不同. )
③ 讨论: 频率分布图有没有保留我们收集的数据?根据月均用水量的频率分布直方图,你能得到一些怎样的结论?(集中范围、变化趋势、直观表明分布特征、用样本推测总体)
④ 思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗? (3t)
⑤ 练习:P61页第3题的数据,若要绘制成频率图,你打算分几组、极值是多少、组距多少? 3. 小结:处理样本数据,绘制频率分布直方图的五个步骤. 理解面积表示频率.
三、巩固练习: 1. 练习:作P61 3题数据的频率分布直方图. 2. 作业: P61 1题.
第二课时 2.2.1 用样本的频率分布估计总体频率分布 (二)
教学要求:通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,
教学重点:学会列频率分布表、画频率分布直方图、频率折线图、茎叶图. 教学难点:体会用样本估计总体的思想,会用样本的频率分布估计总体分布 教学过程:
一、复习准备:
1. 讨论:绘制频率分布直方图有哪几个步骤呢? 2. 练习:给出一个频率分布直方图,进行一些分析. (如何表示频率?面积和?集中范围?变化趋势?) 二、讲授新课:
1、教学频率分布折线图及茎叶图:
① 定义频率分布折线图:画好频率分布图后,我们把频率分布直方图中各小长方形上端连接起来,得到的图形.
② 定义总体密度曲线:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
注:频率折线图是随着样本而变化的,因此并不能由频率折线图得到准确的总体密度曲线. 当样本容量不断增加,分组的组距不断缩小,频率分布折线图会越来越接近一条光滑的曲线即总体密度曲线,它由(a,b)的阴影部分的面积,直观反映总体在范围(a,b)内取值的百分比. ③ 讨论:对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来? (实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.) ④ 提问:目前有哪些方式可以发现样本的规律?
(分布表、直方图、折线图都能帮助发现样本数据的规律)
⑤ 定义茎叶图: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
注:茎叶是一种形象的说法,表明两部分数据间的关系,茎是指数据中用来分组的依据数,叶是指被分到这组的数.
⑥ 出示例:试将下列两组数据制作出茎叶图.
甲得分:13 ,51,23,8,26,38,16,33,14,25,39,
乙得分:49,24,12,31,60,31,44,36,15,37,25,36,39, (▲ 师生共同按制作茎叶图的方法进行操作)
⑦ 讨论:用茎叶图处理样本数据有何好处,什么时候用茎叶图会比较方使?
(茎叶图不仅能够保留原始数据,数据可以随时记录,随时添加,方便记录, 而且能够展示数据的分布情况,但其仅适用于样本数据较少时,否则枝叶会太长. 茎叶图中数据的茎和叶的划分,可根据数据的特点灵活地决定.)
2、练习: 教材 P61第3题.
3、小结: 不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确. 目前有:频率分布表、直方图、茎叶图. 三、巩固练习:
1. 练习:试制作本班男同学身高的茎叶图. 2. 作业:P72 1、2题,只作图.