.
第1章 统计与统计数据
一、学习指导
统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要容和学习要点如下表所示。
章节 1.1 统计及其应用领域 主要容 什么是统计学 统计的应用领域 分类数据、顺序数据、数值型数据 观测数据和实验数据 截面数据和时间序列数据 数据的间接来源 学习要点 ? 概念:统计学,描述统计,推断统计。 ? 统计在工商管理中的应用。 ? 统计的其他应用领域。 ? 概念:分类数据,顺序数据,数值型数据。 ? 不同数据的特点。 ? 概念:观测数据,实验数据。 ? 概念:截面数据,时间序列数据。 ? 统计数据的间接来源。 ? 二手数据的特点。 ? 概念:抽样调查,普查。 ? 数据的间接来源。 ? 数据的收集方法。 ? 调查方案的容。 ? 概念。抽样误差,非抽样误差。 ? 统计数据的质量。 ? 概念:总体,样本。 ? 概念:参数,统计量。 ? 概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。 1.2 数据的类型 1.3 数据来源 数据的直接来源 调查方案设计 数据质量 总体和样本 1.4 统计中的参数和统计量 几个基本概念 变量 二、主要术语
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计:研究数据收集、处理和描述的统计学分支。
推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 分类数据:只能归于某一类别的非数字型数据。 顺序数据:只能归于某一有序类别的非数字型数据。 数值型数据:按数字尺度测量的观察值。 观测数据:通过调查或观测而收集到的数据。
实验数据:在实验中控制实验对象而收集到的数据。 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间上收集到的数据。
1 / 46
.
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推
断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章 数据的图表展示
一、学习指导
数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要容和学习要点如下表所示。 章节 主要容 数据审核 数据排序 2.1 数据的预处理 数据筛选 数据透视表 学习要点 ? 数据审核的目的。 ? 原始数据和二手数据的审核容。 ? 数据排序的目的。 ? 分类数据和数值型数据的排序方法。 ? 数据筛选的目的。 ? 用Excel进行数据筛选。 ? 数据透视表的用途。 ? 用Excel进行数据透视。 2 / 46
.
2.2 品质数据的整理与展示 分类数据的整理与图示 ? 概念:频数,频数分布,比例,百分比,比率。 ? 用Excel制作分类数据的频数分布表。 ? 分类数据的图示:条形图,帕累托图,对比条形图,饼图。 ? 概念:累积频数,累积频率。 ? 累积频数分布图。 ? 概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。 ? 频数分布表的制作步骤。 ? 用Excel制作频数分布表。 ? ? ? ? ? ? ? ? ? 直方图的绘制。 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。 顺序数据的整理与图示 数据分组 2.3 数值型数据的整理与展示 数值型数据的图示 鉴别图形优劣的准则 2.4 合理使用图表 统计表的设计 ? 图形应包括的基本特征。 ? 鉴别图形优劣的准则。 ? 统计表的结构。 ? 统计表的设计。 二、主要术语
24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35.
频数:落在某一特定类别(或组)中的数据个数。 频数分布:数据在各类别(或组)中的分配。
比例:一个样本(或总体)中各个部分的数据与全部数据之比。 比率:样本(或总体)中各不同类别数值之间的比值。
累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 组距:一个组的上限与下限的差。
组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。
3 / 46