【技术实现步骤摘要】
一种评估大型面对面调查中调查员误差的方法
[0001]本专利技术涉及数据质量控制
,具体的说,是一种评估大型面对面调查中调查员误差的方法。
技术介绍
[0002]在大型流行病学调查中,常通过面对面调查的方式收集信息。然而,面对面调查这种数据收集方式难免会引入调查员误差,进而影响数据质量和研究结果的可靠性。传统的流行病学调查专注于通过完善调查设计、加强调查员培训等措施进行数据质量控制,然而由于缺乏切实可行的数据质量评估手段以及受制于有限的人力物力,上述常规的数据质量控制措施并不能保证数据质量。
技术实现思路
[0003]本专利技术的目的在于提供一种评估大型面对面调查中调查员误差的方法,用于解决现有技术中的数据质量控制缺乏数据质量评估手段以及受制于有限的人力物力数据质量控制措施得不到质量保证的问题。
[0004]本专利技术通过下述技术方案解决上述问题:
[0005]一种评估大型面对面调查中调查员误差的方法,包括:
[0006]步骤S1:通过电子信息平台采集基线调查的问卷数据和录音数据 ...
【技术保护点】
【技术特征摘要】
1.一种评估大型面对面调查中调查员误差的方法,其特征在于,包括:步骤S1:通过电子信息平台采集基线调查的问卷数据和录音数据,并按照调查对象生成问卷数据和录音数据的索引;步骤S2:基线调查完成后,导出问卷数据,预处理后采用Fast
‑
MCD算法识别离群调查对象,具体包括:步骤S21:问卷数据包含n行p列,表示包含n个调查对象,每个调查对象包含p个变量的信息,则从n个调查对象中抽取h个样本数据,其中h的取值必须满足h取值0.8n;步骤S22:计算这h个样本数据的样本均值协方差阵和协方差行列式基于和进一步计算n个调查对象的马氏距离:步骤S23:将n个调查对象的马氏距离从小到大排序,选出距离最小的h个调查对象,再计算这h个调查对象的样本均值协方差阵协方差行列式以及h个调查对象的马氏距离;步骤S24:按照步骤S21~步骤S23进行迭代计算,若第m次的则以由第m次的样本计算得到的均值和协方差作为最终的均值和协方差的稳健估计量,记作步骤S25:基于稳健估计量,计算所有调查对象的马氏距离:步骤S26:将马氏距离大于预设值的调查对象判定为离群点;步骤S3:根据调查员误差评估规则,对离群调查对象进行录音核查:质控员登录电子信息平台,根据唯一索引检索离群点对应的调查对象的问卷数据和录音文件,判断该调查对象的问卷数据与录音是否一致,若不一致则说明调查员未能准确捕捉和记录调查对象的回答,即存在调查员误差;记录核查结果,核查结果归为五类:正确、提问方式错误、未问/未追问、录入错误以及无法核实,其中,提问方式错误...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。