.
第二节 调查资料的录入和整理
数据录入
.
.
数据录入是指将问卷或编码表中的每一个项目对应的代码转化成计算机能够识别的形式的过程。这个过程需要数据录入装置(计算机)和一个存储介质(数据库软件、磁盘)。市场调查发达的国家在数据的采集中使用CATI、CAPI的方式很普遍,因此键盘录入的过程已在访问的时候就已经完成了。而且对于简单的问卷调查,使用调查卡进行光学扫描录入也能从时间上节约不少成本。但是国内目前主要还是纸面问卷调查的形式居多,所以在问卷完成后,还需要对问卷进行录入的操作。
大多数问卷信息通过智能录入系统进行,即使用相关的数据库软件包。数据库软件不仅可以存储数据,而且在录入过程中,通过事先的数据库结构的编辑,可以对录入员录入的过程进行逻辑检查,避免数据录入过程中出现某种类型的错误,如录入无效的编码或者是太广的编码,同时对于跳答问题的录入也能进行很好的控制,减少错误的条约模式。
数据库软件的录入检查的范围,限制在最常见的逻辑错误上,对于在选项范围内,因为录入员的疏忽而出错的信息,往往是不能察觉,而录入员在问卷的输入过程中,因为速度非常快,即使是非常老练的录入员,也会出现录入错误的情况。
为了保证数据录入的准确性,有必要对录入的结果进行核查,核查的方式主要有双机录入或三机录入。所谓双机录入的方式,是将同一份问卷分别由两个录入员进行两次录入,将两次的结果进行逐个比较,相同的部分是被认为没有错误的,如果出现不同的部分,检查问
.
.
卷,及时修正。所谓三机录入,即将同一份问卷由不同的录入员录入3次,将3次的结果通过计算机进行比较,采用“2排1”的选择,如果 2个结果是相同的,排除那个不同的答案。三机录入的方式可以减少翻阅问卷的人工。
无论是双机录入还是三机录入,都会增加调查的时间和费用成本,而且是成倍地增加。但是为求得数据的收集录入各个环节的准确性,越来越多的企业和市场调查公司要求数据的正确录入的操作。
如将在图15-1问卷的编码中出现的问题进行录入,问卷编号,城市编码,调查员编号,Q1、Q2、Q3LLQ12-1、Q12-2、Q12-3、Q13、Q14,对应的数据库结构见图15-2。这样,输入时每份问卷按数据库中指定的位置输入相应变量的取值,一行数字就是一份问卷。结果所有问卷次依输入完毕就形成一个数据库。
(1) 问卷编码是001号,城市是北京市,12号调查员完成的问卷,圈选的结果是:Q1
男性;Q230岁;Q3大学专科;LL Q12
圈选的2 3 5;Q13 非常同意;Q14不同意;
(2) 问卷编码是005号,城市是上海市,2号调查员完成的问卷,圈选的结果是:Q1女性;Q222岁;Q3大学本科;LL Q12
.
.
圈选的1 3;Q13 不同意;Q14非常同意; 对应的数据库1)0011121304……23552;2)0052022225……13045 数据的整理
如果在录入过程中,没有实行双机录入(三机录入)的措施,在录入完成之后,有必要对数据进行全面的整理检查。数据整理主要是尽可能的处理错误或不合理的信息以及进行一致性的检查。虽然经过回收问卷、编码过程以及录入的重重检查,但是数据的整理过程是使用计算机进行的,对数据的矫正将更为彻底。
数据整理可使用SPSS或SAS统计软件进行,可以很方便的寻找出超出选项范围、极端值或逻辑上不一样的数据。通常的做法是首先对所有变量进行频数的计算,对连续性的变量进行均值、标准差、最
小值、最大值等统计分析,超出范围的数据和极端的数值很容易检查出来。例如,图15-1问卷的编码的调查中,关于年龄的填写,假定缺失值为“0”,如果出现小于16,或者大于60的数值就是超出范围的。根据对应的问卷编号,变量编码找出问卷,进行核实。
数据整理是对数据进行的最后一道检查程序,这一步完成后,数
.
.
据应该是“整齐、干净的”,然后进入下一步,对数据进行统计处理分析。 本章小结
1.回收问卷:数据资料的处理过程是从回收第一份问卷开始的,按照事先调查方案的计划,尽量确保每份问卷都是有效问卷(所谓“有效”问卷,指的是在调查过程中按照正确的方式执行完成的问卷)。问卷回收以后,督导员必须按照调查的要求,仔细的检查问卷。检查问卷的目的在于将有错误填写,或者是挑出不完整或不规范的问卷,保证数据的准确性。
2.问卷编码:编码是指对一个问题的不同答案进行分组和确定数字代码的过程。大多数问卷的大多数问题都是封闭式的,在调查之前就已经完成了编码的过程,即每一组问题的不同答案的数字编码已经确定。而开放式问题,因为不知道会得到什么答案,或者是希望得到比列出的封闭式的选项更详尽的答案,所以在调查结束后,必须对这些开放式的问题进行事后编码。开放题的事后编码的工作量很大,无法预知会出现多少个新的代码和答案,而且有些答案是非常类似的,必须决定是否合并成一类呢,还是分成不同的代码。
3.数据录入:数据录入是指将问卷或编码表中的每一个项目对应的代码转化成计算机能够识别的形式的过程。这个过程需要数据录入装置(计算机)和一个存储介质(数据库软件、磁盘)。为了保证数据录入的准确性,有必要对录入的结果进行核查,核查的方式主要有双机录入或三机录入。
.