计分析打下良好的基础。
资料的审核工作包含两方面的内容:一是检查出问卷中的问题,二是重新向被调查者核实。
为了确保调查资料的真实性、准确性,除了要对原始资料进行上述审核工作外,通常还要进行复查的工作。所谓资料的复查,指的是研究者带调查资料收回后,又由他人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量。
复查的基本做法是:由研究者自己或者由研究者重新选择另外的调查员,调查员所调查过的样本中,随机抽取5%——15%的个案重新进行调查。一方面核实原来的调查员是否真的对个案进行过调查(有的调查员会由于各种原因自编自填问卷答案,而实际并没有发送给被调查者或访问被调查者);另一方面可将两次调查的结果进行对比,以检查第一次调查的质量。在市场调查中,这种复查工作更是必不可少的。
通过审核和复查,研究者可以发现并纠正原始资料中所存在的一些错误,可以剔除一些无法进行再调查但又有明显错误的问卷,还可以普遍了解整个资料收集工作的质量,从而对资料的真实性和准确性具有更大的信心。
三、资料的编码
要对实地调查中所收回的成百上千份问卷进行分析,还必须进行一项资料的转换工作。这是因为,现代社会调查的资料统计分析工作已全部由计算机来承担了。而计算机所使用的语言与我们在问卷中所得的资料通常有很大的差异。
为了便于用计算机来处理和分析调查资料,研究者需要先完成下列几项工作任务。
1. 问卷编码
在前面介绍问卷设计时,我们曾指出,编码就是给每个问题及答案一个数字作为它的答案。从资料的处理看,编码就是用阿拉伯数字在代替问卷中每一个问题的回答,或者说是将问卷中的文字答转换成数字的过程。下面,我们举例说明编码的过程与方法。 [1] 答案代码的确定。
通常,调查问卷在设计时就已将答案的代码确定好了。 [2]问题栏码的确定
除了将问卷中问题的答案进行编码外,还需要给每一个问题分配栏码,即指定该问题的编码值共几位,以及它们在整个数据文件中所处的位置。
栏码的指定方法是从问卷的第一项目或问题开始,先根据每一个项目或问题答案数码的位数,来确定该项目或问题所占有的宽度,再根据前后顺序来确定其在整个数据排列中所处的位置,这样从头依次往后排列。表9-1就是这种栏码指定的一个例子。
表9-1 栏码分配表 项目或问题 宽度 栏码 城区编号 1 1 个案编号 4 2-5 1. 你的性别: 1 6 ① 男 ②女 2.你的年龄——周岁 2 7-8 1 9 3.你的文化程度: ① 小学及以下 ② 初中 ③ 高中或中专 ④ 大专以上 4.你的婚姻状况: ① 未婚 ② 已婚 ③ 离婚 ④ 丧偶 ⑤ 其他 5.请问你有几个孩子?——个 [3]编码手册(编码簿)
1 10 1 11
在编码手册中,研究者要将需要编码的项目和问题一一列出来,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其他特殊规定等等。整个编码手册的格式要规范统一,指示要明确,且容易理解,便于操作。下面结合下面的例子进行介绍。
表9-2 编码手册(节选) 项目名称 变量含义 宽栏码 答案赋值 名 度 区 V 城区 1 1 1=武昌 2=汉阳 3=江汉 4=江岸 5=青山 6=礁口 7=洪山 根据问卷上的编码填写 1=男 2=女 按实际填答年龄填写,大于99岁的填99 1=小学及以下 2=初中 3=高中及中专 4=大专以上 | 根据实际数字填写 根据实际数字填写,10 000元及以上者填9999 | 1=完全清楚 2=大部分清楚 3=小部分清楚 4=不清楚 同上 同上 同上 1=每周一两次 2=每月一两次 3=半年一两次 4=一年一两次 5=从来不去 | 将所填的小时数乘上60加上所填的分钟数,以总数计 将所填的小时数乘上60加上所填的分钟数,以总数计 个案号 问题A1 问题A2 问题A3 | 问题A8 问题A9 | 问题C1 ID A1 A2 A3 | A8 A9 | C11 C12 C13 C14 个案号 4 性别 年龄 文化程度 | 个人收入 全家收入 | 有几人 叫什么 在哪里工作 性格特点 串门 1 2 1 | 4 4 | 1 1 1 1 1 2-5 6 7-8 9 | 16-19 20-23 | 39 40 41 42 43 问题C2 C2 | 问题F2 | F21 F22 | 平日看电视的时间 周日看电视的时间 | 3 3 | 120-122 123-125 | | | | | | 有了编码手册,不同的调查员(或专门的编码员)就可以按照同样的标准和方法对收回的问卷进行编码。表9-3就是一份问卷资料编码的结果(部分)。
表9-3问卷资料编码的结果 区 汉阳 2 编号 A1
0387 你的性别:① 男 ∨②女 0387 2
A2 A3 你的年龄39周岁 你的文化程度: ① 小学及以下 ② 初中 ∨③高中或中专 ④ 大专以上 你的职业属于下列哪一类: ①生产运输工人和有关人员 ∨ ② 商业人员 ③党政企事业单位负责人 ④ 服务业人员 ⑤党政企事业单位一般工作人员 ⑥ 个体经营人员 ⑦各类专业技术人员 ⑧ 离退休人员 ⑨其他职业人员(请写明) 39 3 A4 2 A5 你的婚姻状况: ① 未婚 ∨② 已婚 ③ 离婚 ④ 丧偶 ⑤ 其他 2 A6 (此题未婚及无孩子者不填) 请问你有几个孩子? 1 个 其中有几个和你住在一起? 1 个 你们家住在一起的有几口人 4 口人 总共是几代人 3 代人 你每月的收入(包括工资、奖金、补贴等) 总共有多少元 480元 你们家一个月的总收入大约是多少元 1100元 1 1 4 3 0480 1100 A7 A8 A9 2. 数据录入 经过前述的编码处理,调查所收回的问卷中的一个个具体答案都已成功地、系统地转换成由0-9这10个阿拉伯数字构成的数码,接下来的任务就是将这些数码输入计算机内,以便进行统计分析了。
数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入计算机;另一种是先将问卷上编好码的数据转录到专门的登录表上,然后再从登录表上将数据输入计算机。登录表的横栏为问题及变量名,且都有给定的栏码,纵栏为不同的个案记录数据,表9-4就是登录表的一部分。
表9-4 数据登录表(部分) 城区 个案号 A1 A2 A3 A4 A5 A61 A62 … 1 个案1 2 个案2 4 个案3 3 个案4 6 个案5 1 个案6 3 ┇ 2-5 0387 0441 1024 0036 0189 0816 6 2 2 1 1 2 2 7-8 39 41 50 28 30 44 9 3 2 2 3 4 1 10 2 3 5 7 1 6 11 2 4 2 1 1 2 12 1 1 2 0 0 2 13 1 0 1 0 0 1 ┇ ┇ ┇ ┇ ┇ ┇ ┇ ┇ ┇ ┇ 无论是直接录入计算机还是转录到登录表后再录入计算机,都有一个用何种软件来输入,以及最终建立一种什么样的数据文件以便于统计分析的问题。
目前运用较普遍的统计分析软件主要有SPSS、SAS、SYSTAT等,尤其SPSS应用更为广泛。由于SPSS统计软件可以调用多种数据编辑软件编辑而成的数据文件,
由于一项问卷调查的数据总量(每份问卷的栏码总数乘以全部问卷,即为输入数码或字符总数)往往是很大的,故实践中常常是有多人共同输入来完成的。因此,研究者必须对数
据的输入工作进行精心组织和安排。具体说来,他要做好以下几方面工作。
① 挑选和培训输入人员。
② 统一规定数据输入格式和数据文件名。
③ 每个输入人员独立完成各自所输的那一部分问卷,不同输入人员的问卷相互之间,以及同一个输入人员已输和未输的问卷之间,千万不要混淆搞乱,以免造成漏输或重复输入,影响数据质量。
第三节 在每个输入人员完成各自所负责的问卷输入任务后,由研究者把他们的数据合起来
形成一个总的数据文件,以供统计分析时调用。
四、资料的汇总
1.总体汇总 2.分组汇总
第三节 资料的分组
一、资料分组的含义和作用
所谓资料分组也成为统计分组,是指根据社会调查研究的目的和要求,按照一定的标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。
1.可以找出总体内部各个部分之间的差异 2.可以深入了解现象总体的内部结构 3.可以显示社会现象之间的依存关系
二、分组标志的选择 三、分组的类型
1.简单分组和复合分组
2.品质标志分组和数量标志分组
第四节 统计表与统计图的制作
统计表与统计图都是调查资料经过整理、汇总、分组统计后所得结果的表现形式,在社会调查报告中也经常会用到它们。因此,我们在这一小节里对统计表与统计图的类型、特点、制作要求等等作一介绍。
一、统计表的结构、种类和制作方法
1.统计表的结构
从统计表的结构上看,通常都由表号、总标题、横行标题、纵栏标题、数字注释和资料来源等要素构成。
2.统计表的种类
按主项的分组方法可分为简单分组表、复合分组表、组距分组表
3.统计表的制作
统计表的制作原则是:科学、规范、简明、实用、美观。具体地说,在制作统计表时,应注意以下几个方面:
首先,表的标题要简短明了,要能确切地说明表中数据的内容,使人一目了然。
其次,表的纵栏标题与横行标题要准确反映变量取值的含义,它们的排列顺序也应具有一定的逻辑结构。
第三,表中的数据资料必须注明计量单位。
第四,对于一般频数分布表,则应列出合计栏,以便获得整体情况的资料。 最后,各种表格均应以横线为主,能够不用竖线则尽量不用。
二、统计图的种类及制作方法
统计图也是研究者用来简化和反映调查资料的一种常用的方法和形式。统计图主要有条形图、圆形图和折线图三种。 1.条形图
条形图又称矩形图,它是以宽度相等、长度不等的长条来表示不同的统计数字,如表
示频数或百分比的多少等等。例如,调查得到的表9-5的资料:
表9-5 调查对象的文化程度分布
小学及以下 初中 高中或中专 大专以上 合计
频数(人)
50 100 250 100 500
比重(%)
10 20 50 20 100
人数3002001000小学及以下初中文化程度高中或中专大专以上我们可以将表9-5的资料用条形图表示出来。
从图9-1中,可以十分清楚地看到调查样本中不同文化程度的分布情况,形象鲜明。这种条形图由于只有一组对象,故又称为简单条形图。如果把两组或两组以上的对象的条形并列在一起,共同构成一个条形图,则既可以进行每组中条形图的比较,又可以对各组的同类条形图进行比较。这种条形图称为复合条形图。图9-2就是复合条形图的一个例子。
图9-1 调查对象文化程度分布图
100806040200独生子女非独生子女
图9-2 样本中各年级独生子女比重分布图
图9-2形象地反映出随着年级的升高,独生子女所占的比重逐渐减小而非独生子女比重逐渐增大的趋势。
一年级二年级三年级四年级五年级六年级