标签聚合模型训练方法、聚合方法、装置、设备及介质制造方法及图纸

技术编号:40085500 阅读:23 留言:0更新日期:2024-01-23 15:23
本申请提供一种标签聚合模型训练方法、聚合方法、装置、设备及介质,涉及计算机技术领域。该方法包括:获取历史任务数据集,历史任务数据集包括:多个标注员的身份信息、多个标注员针对多个历史任务的历史人工标签、历史任务的历史真实标签;根据多个标注员的身份信息、多个历史任务的历史人工标签和历史真实标签,构建多个历史任务的标注准确率特征和标注员身份特征;采用预设神经网络模型对每个历史任务的标注准确率特征和标注员身份特征进行特征提取并聚合,输出每个历史任务的历史预测标签;根据每个历史任务的历史真实标签和历史预测标签,对预设神经网络模型进行参数调整,得到标签聚合模型。本申请可以节省时间成本,提高标签聚合效率。

【技术实现步骤摘要】

本专利技术涉及计算机,具体而言,涉及一种标签聚合模型训练方法、聚合方法、装置、设备及介质


技术介绍

1、数据众包平台依靠众包工作者即标注员能够高效地提供大量带标签的数据,由于众包工作者对任务进行标注的质量存在差异,需要采用标签聚合方法来推断真实标签。

2、现有的标签聚合方法主要是无监督标签聚合,无监督标签聚合在推断每个样本标签时,需要当前目标样本的标注数据和大量历史标注数据共同训练无监督模型,训练完成后使用此无监督模型得到当前目标样本的样本标签。

3、但是无监督标签聚合在每次推断样本标签时均需要先开展训练,会耗费大量的时间成本,效率较低。


技术实现思路

1、本专利技术的目的在于,针对上述现有技术中的不足,提供一种标签聚合模型训练方法、聚合方法、装置、设备及介质,以便通过有监督的训练方式实现对标签聚合模型的训练,在推理过程中可以直接按照训练好的标签聚合模型推断真实标签,节省了时间成本,提高了标签聚合效率。

2、为实现上述目的,本申请实施例采用的技术方案如下:

3本文档来自技高网...

【技术保护点】

1.一种标签聚合模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述多个标注员的身份信息、所述多个历史任务的历史人工标签、所述多个历史任务的历史真实标签,构建所述多个历史任务的标注准确率特征和标注员身份特征,包括:

3.如权利要求2所述的方法,其特征在于,所述根据所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述多个历史任务的标注准确率特征,包括:

4.如权利要求3所述的方法,其特征在于,所述根据每个标注员针对所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述每个标注...

【技术特征摘要】

1.一种标签聚合模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述多个标注员的身份信息、所述多个历史任务的历史人工标签、所述多个历史任务的历史真实标签,构建所述多个历史任务的标注准确率特征和标注员身份特征,包括:

3.如权利要求2所述的方法,其特征在于,所述根据所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述多个历史任务的标注准确率特征,包括:

4.如权利要求3所述的方法,其特征在于,所述根据每个标注员针对所述多个历史任务的历史人工标签和所述多个历史任务的历史真实标签,计算所述每个标注员针对所述多个历史任务的准确率向量,包括:

5.如权利要求2所述的方法,其特征在于,所述根据所述多个人员集合中标注员的身份信息,生成所述每个历史任务的标注员身份特征,包括:

6.如权利要求5所述的方法,其特征在于,所述根据所述多个人员集合中标注员的身份信息,生成所述每个历史任务的标注员身份特征,还包括:

7.如权利要求6所述的方法,其特征在于,所述采用预设神经网络模型对每个历史任务的标注准确率特...

【专利技术属性】
技术研发人员:刘昊俣汪飞林敏敏吴润泽朱仁煜许璐周红叶吕唐杰范长杰
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1