好文档 - 专业文书写作范文服务资料分享网站

概率统计知识点全面总结

天下 分享 时间: 加入收藏 我要投稿 点赞

Mister.D

知识点总结:统计与概率

I统计

1.三大抽样 (1)基本定义:

① 总体:在统计中,所有考查对象的全体叫做全体.

② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2)抽样方法:

①简单随机抽样:逐个不放回、等可能性、有限性。=======★适用于总体较少★

抽签法:整体编号(1~N)放入不透明的容器中搅拌均匀逐个抽取n次,即可得样本容量为n的样本。 随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机

(上、下、左、右)重复,超过范围则忽略不计直至取得以n为样本容量的样本。

②系统抽样:容量大.等距,等可能。=======★适用于总体多★

用随机方法编号,若N无法被整除,则剔除后再分组,k?N。再用简单随机抽样法来抽取一个n个体,设为l,则编号为l,k+l,2k+l……(n-1)k,抽出容量为n的样本。(每组编号相同)。

③分层抽样:总体差异明显.按所占比例抽取.等可能.=======★适用于由差异明显的几部分构成的总体★

n

总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样.抽样比为:k=

N

样本容量各层样本容量抽样比== 总体个数各层个体数量3.总体分布的估计: (1)一表二图:

①频率分布表——数据详实

②频率分布直方图——分布直观

③频率分布折线图——便于观察总体分布趋势

★注:总体分布的密度曲线与横轴围成的面积为1。

(2)茎叶图:

①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数.众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。

版权所有,仿盗必究。

1

Mister.D

4.样本分析

(1)在频率直方图中计算众数.平均数.中位数

众数 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。(最多的那个)--忽视其他数据

中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。(最中间的,若偶取平均)--对极端值不敏感 平均数 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 。--可靠性低 极差(全距) 样本中最大值与最小值的差值

在频率分布直方图中,纵轴表示

频率

,数据落在各小组内的频率用各小矩形的面积表示.各小矩形的面积总和等于1. 组距

频数频数

=频率,此关系式的变形为=样本容量,也可变形为样本容量×频率=频数。

样本容量频率(2)平均数的求法: 题目类型有离散型和连续型两种情况

n① 算数平均数:x?x1?x2?...?xn?1?xi ②加权平均数: nni?1x?x1p1?x2p2?...?xnpn??xipi i?1n

1PS:加权平均数对一些数据的重要程度作出安排,在每个数据中根据它的重要的程度进行取值.按百分比算 (其中p1 , p2 , ... , pi 为x1 , x2 , ... , xi 对应的频率) 方差:s2=n[(x1-?x)2+(x2-?x)2+…+(xn-?x)2] 标准差:s=1[(x1-?x)2+(x2-?x)2+…+(xn-?x)2] n★注:特别地,对于连续型的随机变量在分好组后,其x1 , x2 , ... , xi 应该取每一组的组中值近似的表示 ★注:方差与标准差越小,说明样本数据越稳定。

平均数反映数据总体水平;方差与标准差反映数据的稳定水平。

5.线性回归方程

①变量之间的两类关系:函数关系(确定性关系)与相关关系(非确定性关系); ②制作散点图,判断线性相关关系;

︿是估计,如(yi)

—是平均,如(yi) ③线性回归方程: (最小二乘法)

yi则是真实值.

注:其中x?y?y2?y3???ynx1?x2?x3???xn(x,y)称为样本点的中心,y?1,(回归方程必过此点). nn 相关系数r=

当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强; r的绝对值越接近于0,表明两个变量之间几乎不存在线性关系. 通常|r|大于0.75时,认为两个变量有很强的线性相关性. 残差:ei=yi-yi 相关指数(R2) 即真实值-预报值 残差平方和 R2越大,分母是定值,也可看分子。则残差平方和越小,模型拟合效果越好。在线性回归模型中,R2表示解释变量对预报变量的变化的贡献率。R2越接近1,表示回归效果越好. 版权所有,仿盗必究。 2

Mister.D

6. 独立性检验

(1)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表为:

x1 x2 总计

n(ad-bc)2K= (其中n=a+b+c+d为样本容量).

(a+b)(a+c)(b+d)(c+d)

2

y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d (2)用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关. (3) 当K2≥2.706时,则有90%以上的把握说事件A与B有关; 当K2≥3.841时,则有95%以上的把握说事件A与B有关; 当K2≥6.635时,则有99%以上的把握说事件A与B有关.

II概率

1. 事件

必然事件 :在条件S下一定会发生的事件,叫作相对于条件S的必然事件(P=1) 不可能事件:在条件S下,一定不会发生的事件,叫作相对于条件S的不可能事件(P=0) 确定事件 :必然事件与不可能事件统称为相对于条件S的确定事件,简称确定事件

随机事件 :在条件S下,可能发生也可能不发生的事件,叫作相对于条件S的随机事件[P∈(0,1)]

版权所有,仿盗必究。

3

概率统计知识点全面总结

Mister.D知识点总结:统计与概率I统计1.三大抽样(1)基本定义:①总体:在统计中,所有考查对象的全体叫做全体.②个体:在所有考查对象中的每一个考查对象都叫做个体.③样本:从总体中抽取的一部分个体叫做总体的样本.④样本容量:样本中个体的数目叫做样本容量.(2)抽样方法:①简单
推荐度:
点击下载文档文档为doc格式
0ysdy2nkad9jajr88ky455t2h95x5500wbv
领取福利

微信扫码领取福利

微信扫码分享