专题17 概率与统计
1.以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断.
2.本部分较少命制大题,若在大题中考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和回归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习.
3.以客观题形式考查古典概型与几何概型、互斥事件与对立事件的概率计算. 4.与统计结合在大题中考查古典概型与几何概型.
1.抽样方法
三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 总体中的个体数较简单随机抽样 抽样过程中将总体均分成几部分,每个个体被系统抽样 抽取的概率部分抽取 相等 将总体分成几层,分层分层抽样 进行抽取 2.统计图表
(1)在频率分布直方图中:
频率
①各小矩形的面积表示相应各组的频率,各小矩形的高=;②各小矩形面积之和等于1;③中位数
组距左右两侧的直方图面积相等,因此可以估计其近似值.
(2)茎叶图
1
从总体中逐个抽取 少 在起始部分抽样时采按事先确定的规则在各用简单随机抽样 总体中的个体数较多 分层抽样时采用简单总体由差异明显的随机抽样或系统抽样 几部分组成
当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推). 3.样本的数字特征 (1)众数
在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据). (2)中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.
(3)平均数与方差
-1
样本数据的平均数x=(x1+x2+…+xn).
n1---
方差s2=[(x1-x)2+(x2-x)2+…+(xn-x)2].
n
注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.
(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.
4.变量间的相关关系
(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x和y具有线性相关关系.
(2)用最小二乘法求回归直线的方程 ^^^
设线性回归方程为y=bx+a,则
?^?b=
-?? (x-x)
?^-^-?a=y-bx
ni=1
n
i
i=1
--
? (xi-x)(yi-y)
=--
?xiyi-nxy
i=1n
n
2
2
?x2i-nxi=1
-
.
2
--
注意:回归直线一定经过样本的中心点(x,y),据此性质可以解决有关的计算问题. 5.回归分析
? (xi-x)(yi-y)
i=1
n
--
r=
n
,叫做相关系数.
? (xi-x)2? (yi-y)2
i=1
i=1
-
n
-
相关系数用来衡量变量x与y之间的线性相关程度;|r|≤1,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低.
6.独立性检验
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
x1 x2 总计 则K2=
y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d (a+b+c+d)(ad-bc)2
,
(a+b)(c+d)(a+c)(b+d)
若K2>3.841,则有95%的把握说两个事件有关; 若K2>6.635,则有99%的把握说两个事件有关; 若K2<2.706,则没有充分理由认为两个事件有关. 7.随机事件的概率
随机事件的概率范围:0≤P(A)≤1;
必然事件的概率为1,不可能事件的概率为0. 8.古典概型
m
①计算一次试验中基本事件的总数n;②求事件A包含的基本事件的个数m;③利用公式P(A)=计算.
n-
9.对立事件:在每一次试验中,相互对立的事件A和A不会同时发生,但一定有一个发生,因此有-
P(A)=1-P(A).
10.互斥事件与对立事件的关系
3
对立必互斥,互斥未必对立. 11.几何概型
一般地,在几何区域D内随机地取一点,记事件“该点落在其内部区域d内”为事件A,则事件A发生d的测度
的概率P(A)=.
D的测度
高频考点一 事件与概率
例1.(2018年江苏卷)某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为________.
【变式探究】某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 保费 0 0.85a 1 a 2 1.25a 3 1.5a 4 1.75a ≥5 2a 设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数 概率 0 0.30 1 0.15 2 0.20 3 0.20 4 0.10 ≥5 0.05 (1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (3)求续保人本年度的平均保费与基本保费的比值.
【变式探究】袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为( )
11105A.1 B. C. D.
212121高频考点二 古典概型
例2.从分别标有1,2,???,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是
(A)
5475 (B) (C) (D) 18999【变式探究】袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为( )
4
51011
A. B. C. D.1 212121
【变式探究】从正方形四个顶点及其中心这5个点中,任取2个点,则这2个点的距离不小于该正方形边长的概率为( )
1A. 5
2B. 5
3C. 5
4D. 5
高频考点三 随机数与几何概型
例3.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是
1 41C.
2A.
π 8πD.
4
B.
【变式探究】某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )
1123A. B. C. D. 3234【变式探究】从区间[0,1]随机抽取2n个数x1,x2,…,xn,y1,y2,…,yn,构成n个数对(x1,y1),(x2,y2),…,(xn,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为( )
4n2nA. B. mm4m2mC. D. nn
高频考点四 条件概率与相互独立事件的概率
例4.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:
5