一种基于工人绩效的众包真值推理方法技术

技术编号:40065417 阅读:23 留言:0更新日期:2024-01-16 23:20
本发明专利技术公开了一种基于工人绩效的众包真值推理方法,包括如下步骤:读取众包数据,所述众包数据包括众包任务集合和众包答案集合;以众包答案集合作为基础数据,通过EEMA算法计算排序后的工人序列W;以工人序列W、众包任务集合、众包答案集合作为数据,使用head‑tail‑2算法计算出众包任务的真值。该方法在图挖掘算法的基础上考虑了节点的权值,即工人的绩效,这样可以使得提取出的专家集合更精确,即提取出可靠性更高的专家,同时算法可以对众包工人进行排序,排序靠前的工人准确率更高。

【技术实现步骤摘要】

本专利技术涉及软件测试领域,尤其涉及一种基于工人绩效的众包真值推理方法


技术介绍

1、crh框架是用于在相互冲突的数据源中识别真实信息(即真值)。每个数据源都具有不同数据类型的各种属性,该框架通过在统一模型中对多个属性进行建模来对数据源可靠性进行准确估计。对问题进行建模时使用了优化框架,其中真值和数据源可靠性被定义为两组未知变量。目标是最大限度地减少真值和多数据源观测之间的总体加权偏差,其中每个数据源都是根据其可靠性进行加权的。数据源的可靠性就对应于我们的工人绩效。

2、我们采用基于图挖掘的技术对该问题进行处理。众包工人对众包任务进行回答并给出众包答案,该众包答案可以构成一个答案矩阵。使用一张完全无向图可以对答案矩阵进行存储,节点代表工人,边权代表相邻节点(工人)之间的相同答案数量。边权较大的两个节点更有可能是专家,从而他们会具有更高的绩效。我们将工人的绩效与节点的度数进行乘积运算,那么通过图挖掘技术可以对众包工人按照工人绩效进行排序。

3、在少数专家被大量普通工人和恶意工人淹没的情况下,大多数答案聚合算法(例如多数投票)无法识别本文档来自技高网...

【技术保护点】

1.一种基于工人绩效的众包真值推理方法,其特征在于包括:

2.根据权利要求1所述的一种基于工人绩效的众包真值推理方法,其特征在于:所述通过EEMA算法计算排序后的工人序列W时:

3.根据权利要求1所述的一种基于工人绩效的众包真值推理方法,其特征在于:使用head-tail-2算法计算出众包任务的真值时:

【技术特征摘要】

1.一种基于工人绩效的众包真值推理方法,其特征在于包括:

2.根据权利要求1所述的一种基于工人绩效的众包真值推理方法,其特征在于:所述通过eema算法计...

【专利技术属性】
技术研发人员:陈荣崔宏斌陈慧张志康李博张诗琪
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1