System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,尤其是涉及一种增量真值推断方法、装置以及电子设备。
技术介绍
1、目前,数据标注是人工智能算法研究的重要准备工作,但通常面临量大而过程枯燥的问题。数据众包依靠大量散户标注者完成任务,为数据标注提供了一个更加经济、高效的解决方案。现实中,对于特定数据标注任务,标注者可能不具备足够的相应专业知识或技能,因此常规做法是为每个任务均分配多个标注者,然后通过真值推断算法从标注结果中推断出真实标签。准确的真值推断算法是数据质量的重要保障,同时高效的推断算法才能应对数据众包平台频繁的真值推断需求。
2、现有的真值推断模型通常基于给定的数据众包任务标注结果,采用无监督算法进行训练(即任务真实的真值未知),准确性较低;当面临新任务时,需要先进行模型训练,再进行新任务的真值推断,影响了在线推断的效率。
技术实现思路
1、本公开的目的在于提供一种增量真值推断方法、装置以及电子设备,以提高真值推断的准确性和效率。
2、第一方面,本公开实施例提供了一种增量真值推断方法,包括:
3、根据当前任务的标注结果,以及各个标注者的标注者参数和正确率,确定所述当前任务的输入特征;其中,所述标注者参数包括能力向量和偏好矩阵;
4、根据所述当前任务的输入特征和训练后的真值推断模型,确定所述当前任务的真值推断结果;其中,所述真值推断模型是基于历史任务的众包标注数据和真值数据进行有监督的初始化训练得到的,且基于近期任务的众包标注数据对标注者参数进行无监督的增量
5、第二方面,本公开实施例又提供了一种增量真值推断装置,包括:
6、第一确定模块,用于根据当前任务的标注结果,以及各个标注者的标注者参数和正确率,确定所述当前任务的输入特征;其中,所述标注者参数包括能力向量和偏好矩阵;
7、第二确定模块,用于根据所述当前任务的输入特征和训练后的真值推断模型,确定所述当前任务的真值推断结果;其中,所述真值推断模型是基于历史任务的众包标注数据和真值数据进行有监督的初始化训练得到的,且基于近期任务的众包标注数据对标注者参数进行无监督的增量训练实现更新的。
8、第三方面,本公开实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述的增量真值推断方法。
9、第四方面,本公开实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述的增量真值推断方法。
10、本公开实施例带来了以下有益效果:
11、本公开实施例提供的一种增量真值推断方法、装置以及电子设备,能够根据当前任务的标注结果,以及各个标注者的标注者参数和正确率,确定当前任务的输入特征;其中,标注者参数包括能力向量和偏好矩阵;然后根据当前任务的输入特征和训练后的真值推断模型,确定当前任务的真值推断结果;其中,真值推断模型是基于历史任务的众包标注数据和真值数据进行有监督的初始化训练得到的,且基于近期任务的众包标注数据对标注者参数进行无监督的增量训练实现更新的。这样分离真值推断模型的训练过程和推断过程,在推断时不需要使用新任务数据先训练再推断,可以提高在线推断的效率;使用有监督的方式对模型做初始化训练,并对标注者参数的增量式更新,可以提高真值推断的准确性。
12、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
本文档来自技高网...【技术保护点】
1.一种增量真值推断方法,其特征在于,包括:
2.根据权利要求1所述的增量真值推断方法,其特征在于,所述根据当前任务的标注结果,以及各个标注者的标注者参数和正确率,确定所述当前任务的输入特征,包括:
3.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据所述当前任务的标注结果,以及每个所述标注者的偏好矩阵和正确率,计算得到每个所述标注者给出的标注的似然概率,包括:
4.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据各个所述标注者给出的标注的似然概率和能力向量,确定每个所述标注者给出的标注的表示向量,包括:
5.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据各个所述标注者给出的标注的表示向量,确定所述当前任务的输入特征,包括:
6.根据权利要求1所述的增量真值推断方法,其特征在于,所述真值推断模型包括任务编码器、真值编码器和真值解码器,所述真值解码器分别与所述任务编码器和所述真值编码器连接;所述根据所述当前任务的输入特征和训练后的真值推断模型,确定所述当前任务的真值推断结果,包括:
< ...【技术特征摘要】
1.一种增量真值推断方法,其特征在于,包括:
2.根据权利要求1所述的增量真值推断方法,其特征在于,所述根据当前任务的标注结果,以及各个标注者的标注者参数和正确率,确定所述当前任务的输入特征,包括:
3.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据所述当前任务的标注结果,以及每个所述标注者的偏好矩阵和正确率,计算得到每个所述标注者给出的标注的似然概率,包括:
4.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据各个所述标注者给出的标注的似然概率和能力向量,确定每个所述标注者给出的标注的表示向量,包括:
5.根据权利要求2所述的增量真值推断方法,其特征在于,所述根据各个所述标注者给出的标注的表示向量,确定所述当前任务的输入特征,包括:
6.根据权利要求1所述的增量真值推断方法,其特征在于,所述真值推断模型包括任务编码器、真值编码器和真值解码器,所述真值解码器分别与所述任务编码器和所述真值编码器连接;所述根据所述当前任务的输入特征和训练后的真值推断模型,确定所述当前任务的真值推断结果,包括:
7.根据权利要求6所述的增量真值推断方法,其特征在于,所述任务编码器通过如下公式计算得到任务j的任务参数βj、αj:
8.根据权利要求6所述的增量真值推断方法,其特征在于,所述当前任务的任务参数包括...
【专利技术属性】
技术研发人员:刘昊俣,汪飞,吴润泽,林敏敏,许璐,周红叶,吕唐杰,范长杰,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。