第1章 统计与统计数据
一、学习指导
统计学是处理和分析数据的方法和技术, 它几乎被应用到所有的学科检验领域。 先介绍统计学的含义和应用领域, 然后介绍统计数据的类型及其来源, 的一些基本概念。本章各节的主要内容和学习要点如下表所示。
早节 1.1统计及其 应用领域 统计的应用领域 分类数据、顺序数据、数值 型数据 1.2数据的类 型 观测数据和实验数据 截面数据和时间序列数据 数据的间接来源 主要内容 什么是统计学 学习要点 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 1.3数据来源 数据的直接来源 调查方案设计 数据质量 总体和样本 1.4统计中的 几参数和统计量 个基本概念
本章首
最后介绍统计中常用
数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 变量 、主要术语
1. 2. 3. 4. 5. 6. 7. 8. 9.
统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计:研究数据收集、处理和描述的统计学分支。
推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 分类数据:只能归于某一类别的非数字型数据。 顺序数据:只能归于某一有序类别的非数字型数据。 数值型数据:按数字尺度测量的观察值。 观测数据:通过调查或观测而收集到的数据。 实验数据:在实验中控制实验对象而收集到的数据。 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查, 断总并根据样本调查结果来推
体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。 13?总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示
一、学习指导
数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,
然后介绍不
同类型数据的整理与图示方法, 最后介绍图表的合理使用问题。 要点如下表所示。
早节 数据审核 数据排序 2.1数据的预处理 数据筛选 主要内容 本章各节的主要内容和学习
学习要点 数据审核的目的。 原始数据和二手数据的审核内容。 数据排序的目的。 分类数据和数值型数据的排序方法。 数据筛选的目的。 用Excel进行数据筛选。 数据透视表 数据透视表的用途。 用Excel进行数据透视。 欢迎下载 2
概念:频数,频数分布,比例,百分比,比 率。 用Excel制作分类数据的频数分布表。 2.2品质数据的整 理与展示 顺序数据的整理与图示 概念:累积频数,累积频率。 累积频数分布图。 概念:数据分组,单变量值分组,组距分组, 等数据分组 距分组,不等距分组,组距,组中值。 频数分布表的制作步骤。 用Excel制作频数分布表。 直方图的绘制。 2.3数值型数据的 整理与展示 数值型数据的图示 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。 分类数据的整理与图示 分类数据的图示:条形图,帕累托图,对比 条形图,饼图。 鉴别图形优劣的准则 2.4合理使用图表 统计表的设计 图形应包括的基本特征。 鉴别图形优劣的准则。 统计表的结构。 统计表的设计。 二、主要术语
24. 频数:落在某一特定类别(或组)中的数据个数。 25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。 27. 比率:样本(或总体)中各不同类别数值之间的比值。
28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。 30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 31. 组距:一个组的上限与下限的差。
32. 组中值:每一组的下限和上限之间的中点值,即组中值= (下限值+上限值)/2。 33. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。 34. 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。
35. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数 5个特征值绘制而成的、 反应原始数据
分布的图形。
欢迎下载 3
第3章 数据的概括性度量
一、学习指导
数据分布的特征可以从三个方面进行描述: 一是分布的集中趋势, 反映各数据向其中心 值靠拢或聚集的程度; 二是分布的离散程度, 反映各数据远离其中心值的趋势; 三是分布的 形状,反映数据分布偏斜程度和峰度。 本章将从数据的不同类型出发, 分别介绍集中趋势测 度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。
早节 众数 主要内容 学习要点 概念:众数。 众数的特点。 概念:中位数,四分位数。 中位数和四分位数的中位数和分位数 3.1集中趋势 的度量 平均数 特点。 中位数和四分位数的计算。 概念:平均数,简单平均数,加权平均数, 几何平均数。 简单平均数和加权平均数的计算。 平均数的性质。 几何平均数的计算和应用场合。 众数、中位数和平均数 的比较 异众比率 四分位差 众数、中位数和平均数在分布上的关系。 众数、中位数和平均数的特点及应用场合。 概念:异众比率。 异众比率的计算和应用场合。 概念:四分位差。 四分位差的计算和应用场合。 概念:极差,平均差,方差,标准差。 极差的计算和特点。 方差和标准差 3.2离散程度 的度量 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。 概念:标准分数。 标准分数的计算和应用。 经验法则。 切比雪夫不等式。 概念:离散系数。 离散系数 离散系数的计算。 离散系数的用途。 3.3偏态与峰 态的度量 相对位置的度量 偏态及其测度 概念:偏态,偏态系数。 偏态系数的计算。 偏态系数数值的意义。 欢迎下载 4
概念:峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计峰态及其测度 量。 Excel统计函数的应用。 二、主要术语和公式
(一)主要术语 1. 表示。 2. 3. 4. 5. 6. 7. 8. 9.
众数:一组数据中出现频数最多的变量值,用 M。
中位数:一组数据排序后处于中间位置上的变量值,用 四分位数:一组数据排序后处于
Me表示。
25唏口 75%位置上的值。
平均数:一组数据相加后除以数据的个数而得到的结果。 几何平均数:n个变量值乘积的n次方根,用Gm表示。 异众比率:非众数组的频数占总频数的比率。
四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。 极差:也称全距,一组数据的最大值与最小值之差。
平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。
10. 方差:各变量值与其平均数离差平方的平均数。 11. 标准差:方差的平方根。
12. 标准分数:变量值与其平均数的离差除以标准差后的值。
13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。 14. 偏态:数据分布的不对称性。
15. 偏态系数:对数据分布不对称性的度量值。 16. 峰态:数据分布的平峰或尖峰程度。 17. 峰态系数:对数据分布峰态的度量值。 (二)主要公式 名称 公式 X n 1 n为奇数 ~~2~ 中位数 Me 1 ■- X n X n -1 2 T 2 2 n为偶数 n 简单样本平均数 Xi i 1 X n 欢迎下载 5