统计学基础知识要点
第一章:引言
1,什么是统计?统计方法可以分为哪两类?统计学是收集、分析、表达和解释数据的科学。统计方法可分为描述性统计平方值根据收集方法,观察数据是在没有人为控制的情况下获得的。通过控制实验对象收集的数据。根据所描述的对象和一个地区所有人口的平均年龄,“平均年龄”是一个参数。统计是用于描述样本特征的一般数字度量例如,应该调查一个地区所有人口的平均年抽样方法和推断统计方法。2.统计数据可以分为哪些类型?不同类型数据的特征是什么? 根据不同的测量尺度分为分类数据、顺序数据和数值数据。根据统计数据的收集方法,分为观测数据和实验数据。根据所描述的对象与时间的关系,将其分为区间数据和时间序列数据。根据测量尺度,分时:在分数数据中,不同类别之间有一个相等的并列,不同类别之间的顺序可以任意改变;序列数据可以在类别之间进行比较。数值数据结果表明,具体数字
是分时的:截面数据描述了某一时刻现象的变化;时间序列数据描述了现象随时间的变化。
3,举例说明人口、样本、参数、统计和变量的概念。
群体是一个集合,包括所有被研究的个体。例如,如果你想检查一批灯泡的使用寿命,那这组灯泡就是整体。样本是从群体中提取的一些元素的集合。例如,从一批灯泡中随机选择100个灯泡,这100个灯泡形成一个样本参数是用于描述总体特征的通用数值度量。例如,
为了调查256岁以上岁的人,样本中的“平均年龄”是一个统计数字。变量是说明现象某些特征的概念。例如,商品的销售额是不确定的,它是
变量。第2章:数据收集1。调查计划包括哪些方面?
调查的目的是实现调查的具体目标。调查对象和单位是根据调查目的确定的总体或调查范围。调查项目和问卷是解决调查内容的。 2年,间接数据来源(次要数据)主要是公开发表或公开报道的数据; 数据的直接来源是调查或观察和实验3.统计调查方法:抽样调查、普查、统计报表等。抽样调查是从调查对象的人群中随机选取一部分单间房间之间的空隙。误差的主要类型有抽样误差和非抽样误差 采样误差主要指推断样本数据时产生的随机误差(无法消除);非具体目标;调查对象和调查单位,调查对象是根据调查目的确定的总体或调查范围,调查单位是构成调查对象的各个单位;一种数据收集方法 ,将调查项目作为调查样本,根据样本的调查结果推断总体数量特征。特点:经济、及时、适应性广、准确性高人口普查是为特定目的专门组织的一次性综合调查。我国的人口普查主要包括人口普查、工业普查、农业普查等。统计报表是按照国家有关法律法规的规定,自上而下统一排列,自下而上逐级提供基本统计数据的调查方法。除 外,还有重点调查和典型调查。
4、统计数据误差通常指统计数据与客观实际的
抽样误差是人为因素造成的(理论上可以消除)5、统计数据质量评价标准
:准确性,即最低抽样误差或随机误差;准确度,即最小非抽样误差或偏差;相关性,即满足用户
在决策、管理和研究方面的需求;及时性,即在尽可能短的时间内获取和发布数据;一致性,即保持时间序列的可比性;在满足上述标准的前提下,最低成本,即最经济的数据获取方式是
。6.数据收集方法包括调查研究和观察实验7.统计调查计划的内容是什么?
调查的目的是达到
和问卷,这是调查的具体内容。其他事项,即澄清调查所用的方法和手段、调查时间、调查机构
及实施细则第三章:数据整理和显示1。通过调查获得的原始 数据应主要从完整性和准确性两个方面进行审查 2,分类数据和顺序数据主要排序,而数值数据主要按
排序3.数据分组步骤:确定分组的数量和距离,最后制作频率分布表 。分组统计时,“不包括上限”,相邻两组不连续,上限 为小数点组中值=(下限+上限)/2
4,频率:属于每个类别的数据数量;频率分布是指每个类别的排列和分别归入其中的相图。最后,设定的代表值不受数据柱状图的约束,数据柱状图主要用于显示分类数据,而直方图主要用于显示数值数据第四章:
极值对数据分布特征度量的影响中位数和其他分位数主要适用于作为顺序数据的集中趋势测量值
平均值是根据数值数据计算的,应该以全频率列出,并以表格形式表示。比例:某一类数据与所有数据的比率;百分比:以比较基数为100计算的比率;比率:不同类别值的比率;分类数据图表包括条形图和饼图5.直方图和条形图的区别:条形图使用条形图的长度来表示每个类别的频率,而宽度是固定的。直方图使用面积表示每组的频率,矩形的高度表示每组的频率或频率,宽度表示每组的组距离,因此其高度和宽度是有意义的。其次,直方图的矩形通常是连续排列的,从哪个方面可以测量
1和一组数据的分布特征?
1是分布的集中趋势,它反映了每个数据对其中心值的收敛或聚集程度;第二是分布的分散程度,这反映了数据偏离其中心值的趋势。第三是分布的形状,它反映了数据分布的偏度和峰度。2.简要描述模式、中值和平均值的特征、应用和关系
模式是一组数据分布的峰值,不受极值的影响。它的缺点是它不是唯一的。模式主要用作分类数据的集中趋势测量值中位数是一组数据的中位数
,它具有极好的数学性质。它的缺点是容易受数据极值的影响。平均值主要适合作为数值数据的集中趋势测量值
关系:如果数据分布是对称的,模式、中值和平均值必须相等,即mo = me = xbar如果数据是左偏分布,则表示数据有一个最小值,三者之间的关系是:xbar ,则mo 首先,范围、平均差值、平方 差值和标准偏差是反映数据分散程度的绝对值,它们的值取决于原
始变量值本身的水平的影响。第二,它们与原始变量值的测量单位相同。它们采用两种类型的数据,即不同的数据组和非分组数据。这些值不能单独由另一个变量写入。) 样本方差和标准差计算公式(同上)(
7)。对于分类数据,方差比主要用于衡量离散过程。当变量x取某个值时,变量y的值可能有几个值
2,简要描述了相关系数的值及其意义,并说明了用相关度的测量单位测量的变量的值,和离差度的测量值也是不同的因此,为了消除 变量值水平和不同测量单位对离差度测量值的影响,需要计算离差系数4.平均值是衡量集中度趋势的最重要指标。它主要适用于数值数据,但不适用于分类数据和序列数据。5.四分位偏差主要用于衡量序列数据的离散程度。数值数据也可以用来计算四分位偏差,但不适用于分类数据。
6,方差是方差值及其平均偏差的平均值方差的平方根是标准差方差、标准差计算公式(256±199度;对于顺序数据,四分位偏差主要用于测量离差的程度。对于数值数据,方差或标准偏差主要用于测量离散度
8,经验法则:68%-1;95%-2%;99%-3
第5章:采样和参数估计1。常见的概率抽样方法包括简单随机抽样、分层抽样、系统抽样、整群抽样 2、置信水平(P115)
第7章:相关和回归分析1。解释相关性的含义并解释其特征相关性