__________________________________________________
第1章 统计与统计数据
一、学习指导
统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。
章节 1.1 统计及其应用领域 主要内容 什么是统计学 统计的应用领域 分类数据、顺序数据、数值型数据 观测数据和实验数据 截面数据和时间序列数据 数据的间接来源 学习要点 ? 概念:统计学,描述统计,推断统计。 ? 统计在工商管理中的应用。 ? 统计的其他应用领域。 ? 概念:分类数据,顺序数据,数值型数据。 ? 不同数据的特点。 ? 概念:观测数据,实验数据。 ? 概念:截面数据,时间序列数据。 ? 统计数据的间接来源。 ? 二手数据的特点。 ? 概念:抽样调查,普查。 ? 数据的间接来源。 ? 数据的收集方法。 ? 调查方案的内容。 ? 概念。抽样误差,非抽样误差。 ? 统计数据的质量。 ? 概念:总体,样本。 ? 概念:参数,统计量。 ? 概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。 1.2 数据的类型 1.3 数据来源 数据的直接来源 调查方案设计 数据质量 总体和样本 1.4 统计中的参数和统计量 几个基本概念 变量 二、主要术语
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计:研究数据收集、处理和描述的统计学分支。
推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 分类数据:只能归于某一类别的非数字型数据。 顺序数据:只能归于某一有序类别的非数字型数据。 数值型数据:按数字尺度测量的观察值。 观测数据:通过调查或观测而收集到的数据。
实验数据:在实验中控制实验对象而收集到的数据。 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间上收集到的数据。
收集于网络,如有侵权请联系管理员删除
__________________________________________________
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推
断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章 数据的图表展示
一、学习指导
数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。 章节 主要内容 数据审核 数据排序 2.1 数据的预处理 数据筛选 数据透视表 学习要点 ? 数据审核的目的。 ? 原始数据和二手数据的审核内容。 ? 数据排序的目的。 ? 分类数据和数值型数据的排序方法。 ? 数据筛选的目的。 ? 用Excel进行数据筛选。 ? 数据透视表的用途。 ? 用Excel进行数据透视。 收集于网络,如有侵权请联系管理员删除
__________________________________________________
2.2 品质数据的整理与展示 分类数据的整理与图示 ? 概念:频数,频数分布,比例,百分比,比率。 ? 用Excel制作分类数据的频数分布表。 ? 分类数据的图示:条形图,帕累托图,对比条形图,饼图。 ? 概念:累积频数,累积频率。 ? 累积频数分布图。 ? 概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。 ? 频数分布表的制作步骤。 ? 用Excel制作频数分布表。 ? ? ? ? ? ? ? ? ? 直方图的绘制。 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。 顺序数据的整理与图示 数据分组 2.3 数值型数据的整理与展示 数值型数据的图示 鉴别图形优劣的准则 2.4 合理使用图表 统计表的设计 ? 图形应包括的基本特征。 ? 鉴别图形优劣的准则。 ? 统计表的结构。 ? 统计表的设计。 二、主要术语
24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35.
频数:落在某一特定类别(或组)中的数据个数。 频数分布:数据在各类别(或组)中的分配。
比例:一个样本(或总体)中各个部分的数据与全部数据之比。 比率:样本(或总体)中各不同类别数值之间的比值。
累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 组距:一个组的上限与下限的差。
组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。
收集于网络,如有侵权请联系管理员删除
__________________________________________________
第3章 数据的概括性度量
一、学习指导
数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。
章节 众数 主要内容 学习要点 ? 概念:众数。 ? 众数的特点。 ? 概念:中位数,四分位数。 ? 中位数和四分位数的特点。 ? 中位数和四分位数的计算。 ? 概念:平均数,简单平均数,加权平均数,几何平均数。 ? 简单平均数和加权平均数的计算。 ? 平均数的性质。 ? 几何平均数的计算和应用场合。 ? 众数、中位数和平均数在分布上的关系。 ? 众数、中位数和平均数的特点及应用场合。 ? 概念:异众比率。 ? 异众比率的计算和应用场合。 ? 概念:四分位差。 ? 四分位差的计算和应用场合。 ? ? ? ? ? ? ? ? ? 概念:极差,平均差,方差,标准差。 极差的计算和特点。 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。 概念:标准分数。 标准分数的计算和应用。 经验法则。 切比雪夫不等式。 中位数和分位数 3.1 集中趋势的度量 平均数 众数、中位数和平均数的比较 异众比率 四分位差 方差和标准差 3.2 离散程度的度量 相对位置的度量 离散系数 ? 概念:离散系数。 ? 离散系数的计算。 ? 离散系数的用途。 ? 概念:偏态,偏态系数。 ? 偏态系数的计算。 ? 偏态系数数值的意义。 3.3 偏态与峰态的度量 偏态及其测度 收集于网络,如有侵权请联系管理员删除
__________________________________________________
峰态及其测度 ? ? ? ? ? 概念:峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计量。 Excel统计函数的应用。 二、主要术语和公式
(一)主要术语
1. 众数:一组数据中出现频数最多的变量值,用Mo表示。 2. 中位数:一组数据排序后处于中间位置上的变量值,用Me表示。 3. 四分位数:一组数据排序后处于25%和75%位置上的值。 4. 平均数:一组数据相加后除以数据的个数而得到的结果。 5. 几何平均数:n个变量值乘积的n次方根,用Gm表示。
6. 异众比率:非众数组的频数占总频数的比率。
7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。 8. 极差:也称全距,一组数据的最大值与最小值之差。
9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。 10. 方差:各变量值与其平均数离差平方的平均数。 11. 标准差:方差的平方根。
12. 标准分数:变量值与其平均数的离差除以标准差后的值。
13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。 14. 偏态:数据分布的不对称性。
15. 偏态系数:对数据分布不对称性的度量值。 16. 峰态:数据分布的平峰或尖峰程度。 17. 峰态系数:对数据分布峰态的度量值。
(二)主要公式
名称 公式 中位数 ?x?n?1?????2??Me??????1??x?n??x?n??????1???2??2?????2?n为奇数 n为偶数简单样本平均数 x??xi?1nin 收集于网络,如有侵权请联系管理员删除