样本可信度的验证方法、装置、存储介质及处理器制造方法及图纸

技术编号:19480261 阅读:20 留言:0更新日期:2018-11-17 10:33
本发明专利技术公开了一种样本可信度的验证方法、装置、存储介质及处理器。该方法包括:获取第一参数信息、第二参数信息和第三参数信息,其中,第一参数信息为单位样本对预设调查问卷的答复次数,第二参数信息为每次答复过程中针对预设调查问卷中配置的多个属性选项提交的属性值,第三参数信息为多个属性选项中每个属性选项配置的答案种类;根据第一参数信息、第二参数信息和第三参数信息对单位样本的可信度进行验证。本发明专利技术解决了相关技术中所提供的调查问卷处理方式可信度较低的技术问题。

【技术实现步骤摘要】
样本可信度的验证方法、装置、存储介质及处理器
本专利技术涉及数据统计领域,具体而言,涉及一种样本可信度的验证方法、装置、存储介质及处理器。
技术介绍
调查问卷是以问题形式系统地记载调查内容的一种载体。调查问卷的作用通常包括以下三点:第一、帮助研究者加深对研究课题的认知;第二、为问题设计提供丰富的素材;第三、形成对目标总体的清除概念。目前,相关技术中所提供的调查问卷处理方式通常引导样本自身填写属性资料。然而,出于被调查对象是否愿意如实回答问题、被调查对象个人隐私等因素考虑,此种处理方式在大多数情况下无法准确获知属性内容的可信度。而且,属性资料的填写过程支持随时改动,易导致属性内容缺乏稳定性。由此可见,相关技术中所提供的调查问卷处理方式存在如下缺陷:缺陷一,依靠样本自身填写属性,可信度低。缺陷二,样本属性波动性大。缺陷三,样本属性没有得到精确划分。缺陷四,不支持快速选择在特定属性指定范围值的样本。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术至少部分实施例提供了一种样本可信度的验证方法、装置、存储介质及处理器,以至少解决相关技术中所提供的调查问卷处理方式可信度较低的技术问题。根据本专利技术其中一实施例,提供了一种样本可信度的验证方法,包括:获取第一参数信息、第二参数信息和第三参数信息,其中,第一参数信息为单位样本对预设调查问卷的答复次数,第二参数信息为每次答复过程中针对预设调查问卷中配置的多个属性选项提交的属性值,第三参数信息为多个属性选项中每个属性选项配置的答案种类;根据第一参数信息、第二参数信息和第三参数信息对单位样本的可信度进行验证。可选地,根据第一参数信息、第二参数信息和第三参数信息对单位样本的可信度进行验证包括:根据第一参数信息、第二参数信息和第三参数信息获取多个属性选项中每个属性选项的参考属性值以及参考属性值的可信度;采用每个属性选项的参考属性值以及参考属性值的可信度与单位样本实际在预设应用中输入的属性值进行比对,对单位样本的可信度进行验证。可选地,多个属性选项至少包括:性别属性、教育程度属性、婚姻状况属性、有无子女属性以及收入状况属性,根据第一参数信息、第二参数信息和第三参数信息获取每个属性选项的参考属性值以及参考属性值的可信度包括:当第三参数信息的取值小于第一预设阈值时,计算第一参数信息的取值与第二参数信息的取值之间的比值;根据比值与第二预设阈值之间的比较关系获取每个属性选项的参考属性值以及参考属性值的可信度。可选地,多个属性选项至少还包括:年龄属性,根据第一参数信息、第二参数信息和第三参数信息获取每个属性选项的参考属性值以及参考属性值的可信度包括:从第二参数信息中提取最大属性值和最小属性值;当最大属性值与最小属性值的差值大于第三预设阈值时,参考属性值为第二参数信息中剔除最大属性值和最小属性值之后的剩余属性值的平均值,参考属性值的可信度最低;当最大属性值与最小属性值的差值小于或等于第三预设阈值时,根据一致性占比确定参考属性值以及参考属性值的可信度,其中,一致性占比由答复相同年龄属性值的次数与第一参数信息确定。可选地,在根据第一参数信息、第二参数信息和第三参数信息获取每个属性选项的参考属性值以及参考属性值的可信度之后,还包括:获取第四参数信息,其中,第四参数信息为预设时间周期内单位样本所在地理位置的参考属性信息以及地址位置的可信度信息;从第四参数信息中选取最高的地址位置代码一致性占比来确定参考属性信息以及地址位置的可信度信息;或者,当第四参数信息中存在多个相同的地址位置代码一致性占比时,选取最高的设备标识一致性占比来确定参考属性信息以及地址位置的可信度信息;或者,当第四参数信息中存在多个相同的地址位置代码一致性占比并且相同的地址位置代码一致性占比对应的设备标识一致性占比也相同时,选取更新版本最多的地址位置代码一致性占比来确定参考属性信息以及地址位置的可信度信息。可选地,在每个属性选项配置的答案种类中通过自定义方式设定每个属性选项同时选取多种类别答案。可选地,在根据第一参数信息、第二参数信息和第三参数信息对单位样本的可信度进行验证之后,还包括:根据可信度验证结果对单位样本进行分类;按照分类结果确定对单位样本的信息投放方式。根据本专利技术其中一实施例,还提供了一种样本可信度的验证装置,包括:获取模块,用于获取第一参数信息、第二参数信息和第三参数信息,其中,第一参数信息为单位样本对预设调查问卷的答复次数,第二参数信息为每次答复过程中针对预设调查问卷中配置的多个属性选项提交的属性值,第三参数信息为多个属性选项中每个属性选项配置的答案种类;验证模块,用于根据第一参数信息、第二参数信息和第三参数信息对单位样本的可信度进行验证。可选地,验证模块包括:第一获取单元,用于根据第一参数信息、第二参数信息和第三参数信息获取多个属性选项中每个属性选项的参考属性值以及参考属性值的可信度;验证单元,用于采用每个属性选项的参考属性值以及参考属性值的可信度与单位样本实际在预设应用中输入的属性值进行比对,对单位样本的可信度进行验证。可选地,多个属性选项至少包括:性别属性、教育程度属性、婚姻状况属性、有无子女属性以及收入状况属性,获取模块包括:计算单元,用于当第三参数信息的取值小于第一预设阈值时,计算第一参数信息的取值与第二参数信息的取值之间的比值;第二获取单元,用于根据比值与第二预设阈值之间的比较关系获取每个属性选项的参考属性值以及参考属性值的可信度。可选地,多个属性选项至少还包括:年龄属性,获取模块包括:提取单元,用于从第二参数信息中提取最大属性值和最小属性值;处理单元,用于当最大属性值与最小属性值的差值大于第三预设阈值时,参考属性值为第二参数信息中剔除最大属性值和最小属性值之后的剩余属性值的平均值,参考属性值的可信度最低;当最大属性值与最小属性值的差值小于或等于第三预设阈值时,根据一致性占比确定参考属性值以及参考属性值的可信度,其中,一致性占比由答复相同年龄属性值的次数与第一参数信息确定。可选地,上述获取模块,还用于获取第四参数信息,其中,第四参数信息为预设时间周期内单位样本所在地理位置的参考属性信息以及地址位置的可信度信息;上述装置还包括:处理模块,用于从第四参数信息中选取最高的地址位置代码一致性占比来确定参考属性信息以及地址位置的可信度信息;或者,当第四参数信息中存在多个相同的地址位置代码一致性占比时,选取最高的设备标识一致性占比来确定参考属性信息以及地址位置的可信度信息;或者,当第四参数信息中存在多个相同的地址位置代码一致性占比并且相同的地址位置代码一致性占比对应的设备标识一致性占比也相同时,选取更新版本最多的地址位置代码一致性占比来确定参考属性信息以及地址位置的可信度信息。可选地,在每个属性选项配置的答案种类中通过自定义方式设定每个属性选项同时选取多种类别答案。可选地,上述装置还包括:分类模块,用于根据可信度验证结果对单位样本进行分类;确定模块,用于按照分类结果确定对单位样本的信息投放方式。根据本专利技术其中一实施例,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述样本可信度的验证方法。根据本专利技术其中一实施例,还提供了一种处理器,该处理器用于运行程序,其本文档来自技高网...

【技术保护点】
1.一种样本可信度的验证方法,其特征在于,包括:获取第一参数信息、第二参数信息和第三参数信息,其中,所述第一参数信息为单位样本对预设调查问卷的答复次数,所述第二参数信息为每次答复过程中针对所述预设调查问卷中配置的多个属性选项提交的属性值,所述第三参数信息为所述多个属性选项中每个属性选项配置的答案种类;根据所述第一参数信息、所述第二参数信息和所述第三参数信息对所述单位样本的可信度进行验证。

【技术特征摘要】
1.一种样本可信度的验证方法,其特征在于,包括:获取第一参数信息、第二参数信息和第三参数信息,其中,所述第一参数信息为单位样本对预设调查问卷的答复次数,所述第二参数信息为每次答复过程中针对所述预设调查问卷中配置的多个属性选项提交的属性值,所述第三参数信息为所述多个属性选项中每个属性选项配置的答案种类;根据所述第一参数信息、所述第二参数信息和所述第三参数信息对所述单位样本的可信度进行验证。2.根据权利要求1所述的方法,其特征在于,根据所述第一参数信息、所述第二参数信息和所述第三参数信息对所述单位样本的可信度进行验证包括:根据所述第一参数信息、所述第二参数信息和所述第三参数信息获取所述多个属性选项中每个属性选项的参考属性值以及所述参考属性值的可信度;采用每个属性选项的参考属性值以及所述参考属性值的可信度与所述单位样本实际在预设应用中输入的属性值进行比对,对所述单位样本的可信度进行验证。3.根据权利要求2所述的方法,其特征在于,所述多个属性选项至少包括:性别属性、教育程度属性、婚姻状况属性、有无子女属性以及收入状况属性,根据所述第一参数信息、所述第二参数信息和所述第三参数信息获取每个属性选项的参考属性值以及所述参考属性值的可信度包括:当所述第三参数信息的取值小于第一预设阈值时,计算所述第一参数信息的取值与所述第二参数信息的取值之间的比值;根据所述比值与第二预设阈值之间的比较关系获取每个属性选项的参考属性值以及所述参考属性值的可信度。4.根据权利要求2所述的方法,其特征在于,所述多个属性选项至少还包括:年龄属性,根据所述第一参数信息、所述第二参数信息和所述第三参数信息获取每个属性选项的参考属性值以及所述参考属性值的可信度包括:从所述第二参数信息中提取最大属性值和最小属性值;当所述最大属性值与所述最小属性值的差值大于第三预设阈值时,所述参考属性值为所述第二参数信息中剔除最大属性值和最小属性值之后的剩余属性值的平均值,所述参考属性值的可信度最低;当所述最大属性值与所述最小属性值的差值小于或等于第三预设阈值时,根据一致性占比确定所述参考属性值以及所述参考属性值的可信度,其中,所述一致性占比由答复相同年龄属性值的次数与所述第...

【专利技术属性】
技术研发人员:余璇马倩刘杨张佳祥
申请(专利权)人:精硕科技北京股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1