实用文档
Excel中的描述统计分析工具
Excel描述统计工具计算与数据的集中趋势、离中趋势、偏度、峰度等有关的描述性统计指标。
使用:工具--数据分析--描述统计—汇总统计 输出结果解释: 平均 标准误差 中值 模式 标准偏差 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 平均数或均值,X S/n,求总体均值的置信区间 中位数,Md 众数,Mo 标准差,S S2 峰度,K SK 总体单位数,或样本容量,n 示例:10年校园调查汇总数据
第一次随堂作业的有关事宜通知
1、作业完成地点:北京大学校内
2、随堂作业时间:本周五下午2:30-4:30
3、作业内容:对10年校园调查的汇总数据进行描述统计分析,完成对一个指定主题的深入分析。
4、作业的具体内容:届时参见网络平台的“作业”版块。 5、其他要求:独立完成,不得与别人讨论交流。
第三部分 推断统计
第四章 概率论与数理统计基础
§1 了解和认识随机事件与概率
北京市天气预报:明天白天降水概率40%,它的含义是: A 明天白天北京地区有40%的地区有降雨; B 明天白天北京地区有40%的时间要下雨;
文案大全
实用文档
C 明天白天北京地区下雨的强度有40%; D明天白天北京地区下雨的可能性有40%;
E 北京气象局有40%的工程师认为明天会下雨。
一、 必然现象与随机现象
1、必然现象:可事前预言,即在准确地重复某些条件下,它的结果总是可以肯定的。 例:
太阳每天从东方升起
在标准大气压下,水加热到100摄氏度,就必然会沸腾 在欧式几何中,三角形的内角和总是180°
在北京大学,不及格科目达到1/3,一定拿不到毕业证
事物间的这种联系是属于必然性的。通常的自然科学各学科就是专门研究和认识这种必然性的,寻求这类必然现象的因果关系,把握它们之间的数量规律。
2、随机现象:一种可能发生,也可能不发生;可能这样发生,也可能那样发生的不确定现象。在随机现象中,可能结果不止一个,且事前无法预知确切的结果。也称偶然现象。 在自然界,在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在的。 例: 高考的结果 掷骰子的结果 学生对手机品牌的选择 随机抽取的交作业名单 今天来上统计学课的学生人数
这类现象是即使在一定的相同条件下,它的结果也是不确定的。
举例来说,同一个工人在同一台机床上加工同一种零件若干个,它们的尺寸总会有一点差异。在同样条件下,进行小麦品种的人工催芽试验,各颗种子的发芽情况也不尽相同,有强弱和早晚的分别等等。
3、为什么会有随机现象
在这里,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然因素又是人们无法事先一一能够掌握的。正因为这样,我们在这一类现象中,就无法用必然性的因果关系,对个别现象的结果事先做出确定的答案。事物间的这种关系是属于偶然性的,随机性的。
在同样条件下,多次进行同一试验或调查同一现象,所的结果不完全一样,而且无法准确地预测下一次所得结果,随机现象这种结果的不确定性,是由于一些次要的、偶然的因素影响所造成的。
文案大全
实用文档
4、随机现象的规律性
随机现象从表面上看,似乎是杂乱无章的、没有什么规律的现象。但实践证明,如果同类的随机现象大量重复出现,它的总体就呈现出一定的规律性。大量同类随机现象所呈现的这种规律性,随着我们观察的次数的增多而愈加明显。比如掷硬币,每一次投掷很难判断是那一面朝上,但是如果多次重复的掷这枚硬币,就会越来越清楚的发现它们朝上的次数大体相同。 我们把这种由大量同类随机现象所呈现出来的集体规律性,叫做统计规律性。概率论和数理统计就是研究大量同类随机现象的统计规律性的数学学科。 例:生日的巧合
根据数学中的“抽屉定理”,我们可以预言,在366个人当中,一定有两个人的生日相同。但是,根据概率论的计算,在k个人群中,至少有2个人生日一样的概率为:
k 5 10 15 20 22 23 计算思路:
p 0.027 0.117 0.253 0.411 0.476 0.507 k 25 30 40 50 60 … p 0.569 0.706 0.891 0.970 0.994
首先计算k个人群的生日搭配一共有365种可能的情况; 然后计算k个人群中,没有任何2个人生日一样的可能情况有
k365?364?(365?k?1)?365!/(365?k)!种
接下来计算k个人群中,没有任何2个人生日一样的概率为:
365!/(365?k)!
365k然后计算在k个人群中,至少有2个人生日一样的概率为:
1?
365!/(365?k)!
365k“你信仰掷骰子的上帝,我却信仰完备的定律和秩序。” ——爱因斯坦致玻尔的信 “我无论如何深信上帝不是在掷骰子。”—— 爱因斯坦
爱因斯坦始终不放弃科学的自然因果律和确定性原则,这是他与玻尔得分歧所在
二、 随机事件
文案大全
实用文档
1、随机试验
(1)试验可以在相同条件下重复进行;
(2)试验的结果不止一个,但所有可能结果都是明确可知的;
(3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定究竟是出现哪一个结果。 例:抛硬币
让一位顾客从两种商品中选出他/她更喜欢的一种 股票市场价格指数每天的变化
2、基本事件:一次随机试验的可能结果 例:
抛硬币只可能出现两种结果:正面或反面 掷骰子可能出现1、2、3、4、5、6六种结果 股票市场价格指数可能取值在(0,+∞)
3、随机事件:随机试验的结果,一个随机事件可以包含多个基本事件 例:掷骰子,“出现奇数” 和“出现不小于4的数” 就是两个事件
三、随机事件的概率
1、 事件A的概率是描述事件A在实验中出现的可能性大小的一种度量。 2、 对概率定义的解释
(1)概率的统计定义:频率解释
频率的稳定性是通过大量的试验所得到的随机事件的规律性,这种规律性因此称为统计规律性。
概率的统计定义:在不变的一组条件S下,重复作n次试验,m是n次试验中事件A发生的次数,当试验次数n很大时,如果频率m/n稳定地在某一数值p的附近摆动,且随着试验次数的增多,摆动的幅度越来越小,则称p为事件A在条件组S下发生的概率,记作:
P(A)?m?p n例:以下是北大经济学院00级成人教育学生,通过调查访问所收集的北京市场上消费者购买冰箱的情况。他们一共访问了457个对象。
次数与频率分布表 随机变量的概率分布表 冰箱品牌 海尔 伊莱克斯 文案大全
购买人数 131 58 比重% 28.67 12.69 冰箱品牌X 1 2 概率pi % 28.67 12.69 实用文档
西门子 新飞 LG 容声 41 34 30 30 8.97 7.44 6.56 6.56
3 4 5 6 8.97 7.44 6.56 6.56 … 容事达 总计 例:
… 1 457 … 0.22 100 … 20 -- … 0.22 100 A 1986 article in Newsweek by the mathematician John Paulos makes the point that most people have no grasp of the probabilities of events that may affect them and tend to have great fear of publicized events with small probability, while not worrying at all about events with much higher probability. As an example, Paulos gives the following data: In 1985, 28 million Americans traveled abroad, and 39 of them were killed by terrorists. But in the same year, 1 in 5300 Americans was killed in an automobile accident.
Probability of being killed by terrorists = 39/28,000,000 = 1.393*10
-6
Probability of being killed in an automobile accident = 1/5300 = 1.887*10
(2) 概率的古典定义,起源与赌博,如掷硬币、掷骰子 核心思想:等可能的结果,概率总和为1。
古典概率模型特点:试验的结果有限、各个结果出现的可能性相等
-4
P(A)?m:事件A所包含的基本事件的个数; n:随机实验所包含的全部基本事件的个数
(3)概率的几何定义
m n集合概率若随机试验中的基本事件有无穷多个,且每个基本事件发生是等可能的,这时就不能使用古典概率,于是产生了几何概率。几何概率的基本思想是把事件与几何区域对应,利用几何区域的度量来计算事件发生的概率,
定义:设区域G的长度(或面积、体积)为D,质点可以等可能地落在区域G中的任何一点,设事件A =“质点落在G内一个长度(面积、体积)为d的区域g内”,定义A的概率为:P(A) = d / D为几何概率。 例:
文案大全