【技术实现步骤摘要】
本专利技术涉及计算机,具体而言,涉及一种标签聚合模型训练方法、聚合方法、装置、设备及介质。
技术介绍
1、数据众包平台依靠众包工作者即标注员能够高效地提供大量带标签的数据,由于众包工作者对任务进行标注的质量存在差异,需要采用标签聚合方法来推断真实标签。
2、现有的标签聚合方法主要是无监督标签聚合,无监督标签聚合在推断每个样本标签时,需要当前目标样本的标注数据和大量历史标注数据共同训练无监督模型,训练完成后使用此无监督模型得到当前目标样本的样本标签。
3、但是无监督标签聚合在每次推断样本标签时均需要先开展训练,会耗费大量的时间成本,效率较低。
技术实现思路
1、本专利技术的目的在于,针对上述现有技术中的不足,提供一种标签聚合模型训练方法、聚合方法、装置、设备及介质,以便通过有监督的训练方式实现对标签聚合模型的训练,在推理过程中可以直接按照训练好的标签聚合模型推断真实标签,节省了时间成本,提高了标签聚合效率。
2、为实现上述目的,本申请实施例采用的技术方案如
3本文档来自技高网...
【技术保护点】
1.一种标签聚合模型训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述多个标注员的身份信息、所述多个历史任务的历史人工标签、所述多个历史任务的历史真实标签,构建所述多个历史任务的标注准确率特征和标注员身份特征,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述多个历史任务的标注准确率特征,包括:
4.如权利要求3所述的方法,其特征在于,所述根据每个标注员针对所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标
...【技术特征摘要】
1.一种标签聚合模型训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述多个标注员的身份信息、所述多个历史任务的历史人工标签、所述多个历史任务的历史真实标签,构建所述多个历史任务的标注准确率特征和标注员身份特征,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述多个历史任务的标注准确率特征,包括:
4.如权利要求3所述的方法,其特征在于,所述根据每个标注员针对所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述每个标注员针对所述多个历史任务的准确率向量,包括:
5.如权利要求2所述的方法,其特征在于,所述根据所述多个人员集合中标注员的身份信息,生成所述每个历史任务的标注员身份特征,包括:
6.如权利要求5所述的方法,其特征在于,所述根据所述多个人员集合中标注员的身份信息,生成所述每个历史任务的标注员身份特征,还包括:
7.如权利要求6所述的方法,其特征在于,所述采用预设神经网络模型对每个历史任务的标注准确率特...
【专利技术属性】
技术研发人员:刘昊俣,汪飞,林敏敏,吴润泽,朱仁煜,许璐,周红叶,吕唐杰,范长杰,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。