第五章数据分布特征的描述习题参考答案
一、名词解释
集中趋势指标:集中趋势指标是指一组数据向某一中心值靠拢的倾向,测度集中趋势指标就是寻找数据一般水平的代表值或中心值。这个代表值或中心值就是集中趋势指标。
数值平均数:数值平均数是将总体各单位数量标志值通过一定的数学公式计算出来所得到的集中趋势指标。具体有算术平均数、调和平均数和几何平均数三种。
位置平均数:位置平均数是通过查找位置,所找到位置对应的数值作为集中趋势指标。具体有众数和中位数两种。
离中趋势指标:离中趋势指标又称标志变动度,是反映总体各单位数量标志值差异程度的综合指标,用来反映总体各单位数量标志值的变动范围和离散程度。
极差:极差也称全距,是总体各单位数量标志值的最大值与最小值之差,反映总体各单位数量标志值的变动范围,常用R表示。
平均差:平均差是总体各单位数量标志值与其算术平均数离差绝对值的算术平均数。常用“A.D”表示。它综合反映了总体各单位数量标志值的变动程度。
方差:方差是总体各单位数量标志值与其算术平均数离差平方的算术平均数,通常以
?2表示。
标准差:标准差是方差的平方根,也是测度数量标志值的差异程度的指标。标准差又称均方差,一般用?表示。
离散系数:离散系数通常指标准差系数,是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。
偏态:偏态是指数据分布的偏斜方向和程度。
峰度:峰度是指次数分布曲线顶峰的尖平程度,是次数分布的又一重要特征。
二、单项选择题
1~5:D C D C C 6~10:B C C D A
三、判断题(正确的打“√”,错误的打“×”)
1~5: √×××× 6~10: √√× 四、简答题
1、计算和应用集中趋势指标时应注意哪些问题?
答:众数是一种位置代表值,易理解,不受极端值的影响。任何类型的数据资料都可以计算,但主要适合于作为定类数据的集中趋势测度值,即使资料有开口组仍然能够使用众数。
众数不适合于进一步代数运算。有的资料众数根本不存在,当资料中包括多个众数时,很难对它进行比较和说明,应用不如算术平均数广泛。
中位数也是一种位置代表值,不受极端值的影响。除了数值型数据,定序数据也可以计算,而且主要适合于作为定序数据的集中趋势测度值,而且开口组资料也不影响计算。中位数不适于进一步代数运算,应用不如算术平均数广泛。
算术平均数的含义通俗易懂、直观清晰,全部数据都要参加运算,因此它是一个可靠的具有代表性的量。任何一组数据都有一个算术平均数,而且只有一个算术平均数。用统计方法推断几个样本是否取自同一总体时,必须使用算术平均数。因为具有优良的数学性质,适合于代数方法的演算。算术平均数是实际中应用最广泛的集中趋势测度值,主要适合于作为定距和定比数据的集中趋势测度值,最容易受极端值的影响。对于偏态分布的数据,算术平均数的代表性较差;资料有开口组时,按相邻组组距计算假定性很大,代表性降低。
2、什么是集中趋势指标?有哪些具体种类?有何作用? 答:集中趋势指标是指一组数据向某一中心值靠拢的倾向,测度集中趋势指标就是寻找数据一般水平的代表值或中心值。这个代表值或中心值就是集中趋势指标。集中趋势指标按照计算方法的不同,可以分为数值平均数和位置平均数。数值平均数是将总体各单位数量标志值通过一定的数学公式计算出来所得到的集中趋势指标。具体有算术平均数、调和平均数和几何平均数三种。位置平均数是通过查找位置,所找到位置对应的数值作为集中趋势指标。具体有众数和中位数两种。集中趋势指标按照平均的是时间还是空间的不同,可以分为静态平均数和动态平均数。静态平均数所反映的是同一总体不同单位数量标志值在同一时间的一般水平。动态平均数所反映的是同一总体在不同时间上发展变化的一般水平。一般有平均比率、平均速度等。
3、加权算术平均数和加权调和平均数有何区别与联系? 答:加权调和平均数是加权算术平均数的变形。它与加权算术平均数在实质上是相同的,而仅有形式上的区别,即表现为变量对称的区别、权数对称的区别和计算位置对称的区别。加权调和平均数适用于已分组资料中只掌握每组标志总量(m)而缺少对应组单位数(f)的情况。
4、算术平均数与强度相对数有何区别?
答:算术平均数与强度相对数的区别主要是:1)性质不同。算术平均数是同一总体的标志总量与总体单位总量之比,其分子分母有依附关系,分母量是分子量的承担者,分子分母不能互换;强度相对数是两个不同总体而有联系的总量之比,其分子分母没有依附关系,作为分子的指标数值并不随着作为分母的指标数值的变动而变动。有的强度相对数有正指标与逆指标之分,其分子与分母可以互换。②作用不同。算术平均数反映同质总体各单位标志值的一般水平;强度相对数反映的是某现象总体总量在另一有联系的总体范围内的关系程度和密集程度。
5、在什么情况下需用几何平均数反映被研究现象的集中趋势? 答:几何平均数常用于计算已知时间序列中每个比率或每个速度水平的平均水平,例如平均发展速度、复利下的平均年利率、连续作业的车间求产品的平均合格率等。
6、简述算术平均数、中位数、众数三者之间的关系。
答:算术平均数、众数和中位数之间的关系与次数分布数列有关。在次数分布完全对称
时,算术平均数、众数和中位数都是同一数值。在次数分布非对称时,算术平均数、众数和中位数不再是同一数值了,而具有相对固定的关系。在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大;在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小。
7、什么是标准差系数?为什么有了标准差还要计算标准差系数? 答:标准差系数是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。有了标准差还要计算标准差系数是因为标准差数值的大小一方面取决于原数量标志值本身水平高低的影响。另一方面,它们与数量标志值的计量单位相关,采用不同计量单位计量的数量标志值,其离中趋势指标值也就不同。因此,对于平均水平不同或计量单位不同的不同总体的数量标志值,是不能直接用标准差直接进行比较的。为了消除变量值水平高低和计量单位不同对标准差指标值的影响,需要计算标准差系数。
8、什么是是非标志?其平均数和标准差是什么? 答:是非标志是指在社会经济统计中有时把某种社会经济现象的全部总体单位,分为具有某一标志的单位和不具有某一标志的单位两组。是非标志是一个模糊的逻辑词语,表示一个物类有或者没有某种特征,而这种特征是物质或者精神或者两者皆有的。
是非标志的平均数是具有某一标志的单位在总体中的成数。
是非标志的标准差就是具有某一标志的单位在总体中的成数与不具有某一标志的单位在总体中的成数乘积的平方根,也就是以这两个成数为变量的几何平均数。
9、什么是离中趋势指标?有哪些具体种类?有何作用? 答:离中趋势指标又称标志变动度,是反映总体各单位数量标志值差异程度的综合指标,用来反映总体各单位数量标志值的变动范围和离散程度。
离中趋势指标是衡量对应集中趋势指标代表性大小的尺度。一般来讲,数量标志值分布越分散,离中趋势指标值越大,则集中趋势指标的代表性越小。反之,数量标志值分布越集中,离中趋势指标值越小,则集中趋势指标的代表性越大。常用的变异指标有:极差、平均差、方差、标准差和离散系数等。
10、如何对任意两个总体集中趋势指标的代表性进行比较?
答:通过分别计算两个总体的标准差系数,再比较两个标准差系数的大小,值越大说明对应总体集中趋势指标的代表性越小。反义,其代表性越大。
五、计算题 1、解:x??xf?f?480000?16000 30 2、解:x甲m??m?x甲甲?750000?728000?420000?3.11 750000728000420000??3.02.84.2 x乙??mm?x乙乙?375000?448000?882000?3.44
375000448000882000??3.02.84.2乙农贸市场蔬菜平均价格高。因为乙农贸市场价格高的蔬菜对应的权重较大,所以平均数较大。
xf?3、解:(1)x??f?2383000?4618.22 516 (2)
?f?1?517?258.5
22 中位数所在组为4000~5000,按照下限公式计算中位数
?f Me?L1?2?Sm?1fm?i?4563.64
众数所在组为4000~5000,按照众数下限公式计算众数
?1 M0?L??i?4363.64
?1??2 (3)由以上计算结果可以看出,x?Me?M0,所以职工家庭收入呈右偏分布。
m16980???106.13% 4、解:平均计划完成程度=
m16000?x5、解:该零件的平均合格率=498%?95%?92%?90%?93.70%
6、解:不正确
三个车间产品产量的平均计划完成程度=
180?250?315745??124.17%
180250315600??9005%
三个车间平均单位成本=
?xf?f?13140?17.64 7457、解:x甲??xf?f?5280?75.4 7022?甲??x?x???f?f?6687.2?95.5370 ?甲?95.53?9.77V?甲?
?甲x甲9.77?12.96u.4V?乙??乙x乙=
12?15.38% 78 所以甲班平均考试成绩代表性更高。
8、解:(1)x甲x640????64
n10 x乙??x?700?70
n10 (2)
R甲?120-20?100R乙?75-65?10
A?D甲x?x???24n
A?D乙?2.2?甲???x?x?n?2?889?29.82?乙?7.8?2.79 ?甲29.82V甲?x甲64
?46.59%V乙??乙x乙?2.79?3.99p从以上结果可以看出,甲班组的标准差系数大于乙班组的标准差系数,乙班组的该月平均每人产量的代表性更大。