训练数据标注任务的分配方法及装置、计算设备制造方法及图纸

技术编号:27616984 阅读:23 留言:0更新日期:2021-03-10 10:49
一种训练数据标注任务的分配方法及装置、存储介质和计算设备,所述方法包括:接收任务创建信息,所述任务创建信息指示多个训练数据标注任务以及每个训练数据标注任务的类型;对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端;将每种类型的训练数据标注任务分配给与其匹配的任务执行终端。通过本发明专利技术的方案,可以高效率地将大量的训练数据标注任务自动分配给各个任务执行终端,提高分配的效率。的效率。的效率。

【技术实现步骤摘要】
训练数据标注任务的分配方法及装置、计算设备


[0001]本专利技术涉及计算机
,尤其涉及一种训练数据标注任务的分配方法及装置、存储介质、计算设备。

技术介绍

[0002]训练数据标注是指对文本、图片、语音等训练数据进行描述或标记的过程(例如,在人脸样本图像上标注左眼外眼角、右眼外眼角等位置),以便将标注好的训练数据用于机器学习。随着人工智能等领域的技术发展,数据标注需求方(例如人工智能等领域的科技公司)对于训练数据标注的需求越来越大,数据标注需求方会将大量需要进行标注的训练数据发送至数据标注平台,针对数据标注需求方发送的训练数据,数据标注平台需要创建大量的训练数据标注任务,并由多个数据标注执行方(例如,专门进行数据标注的执行主体)的任务执行终端对训练数据进行标注。
[0003]因此,亟需一种训练数据标注任务的分配方法,能够高效率地分配大量的训练数据标注任务,从而进一步提高训练数据标注任务完成的效率。

技术实现思路

[0004]本专利技术解决的技术问题是提供一种训练数据标注任务的分配方法,能够高效率地分配大量的训练数据标注任务,从而进一步提高训练数据标注任务完成的效率。
[0005]为解决上述技术问题,本专利技术实施例提供一种训练数据标注任务的分配方法,所述方法包括:接收任务创建信息,所述任务创建信息指示多个训练数据标注任务以及每个训练数据标注任务的类型;对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端;将每种类型的训练数据标注任务分配给与其匹配的任务执行终端。/>[0006]可选的,将每种类型的训练数据标注任务分配给与其匹配的任务执行终端包括:对于每种类型的训练数据标注任务,根据与该类型匹配的任务执行终端的数量,将该类型的训练数据标注任务进行划分,以得到各个任务执行终端需要完成的训练数据标注任务;对于每一任务执行终端,将其需要完成的训练数据标注任务添加至其任务列表中。
[0007]可选的,将每种类型的训练数据标注任务分配给与其匹配的任务执行终端还包括:监听各个任务执行终端的状态信息,当其状态信息指示其处于空闲状态时,从其任务列表中选择下一个训练数据标注任务;将所述下一个训练数据标注任务对应的训练数据发送至所述任务执行终端。
[0008]可选的,所述任务列表包括第一进度信息,所述第一进度信息为已完成的训练数据标注任务的数量占需要完成的训练数据标注任务的数量的比例,所述方法还包括:监听各个任务执行终端的第一进度信息;当任一任务执行终端的第一进度信息达到第一预设阈值时,判断是否需要对待完成任务进行重新分配,其中,所述待完成任务为第一类型终端未完成的训练数据标注任务,所述第一类型终端为与所述第一终端匹配的类型相同的全部任务执行终端,所述第一终端为所述第一进度信息达到所述第一预设阈值的任务执行终端;
如果是,则将所述待完成任务重新分配给所述第一类型终端。
[0009]可选的,判断是否需要对所述待完成任务进行重新分配包括:统计所述待完成任务的数量,并根据所述第一类型终端的数量计算所述待完成任务数量的均值;将所述第一终端未完成的训练数据标注任务的数量与所述均值进行比较,如果所述第一终端未完成的训练数据标注任务的数量与所述均值满足预设条件,则判断需要对所述待完成任务进行重新分配。
[0010]可选的,所述任务列表还包括第二进度信息,将所述待完成任务重新分配给所述第一类型终端包括:读取所述第一类型终端的第二进度信息,其中,所述第二进度信息为预设时间内完成的训练数据标注任务的数量;根据所述第一类型终端的第二进度信息,将所述待完成任务进行划分,以更新所述第一类型终端对应的需要完成的训练数据标注。
[0011]可选的,所述任务执行终端具有类型标签,对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端包括:对于每种类型的训练数据标注任务,查找具有与该类型相同的类型标签和/或空白标签的任务执行终端,以得到与该类型匹配的任务执行终端。
[0012]可选的,根据所述第一类型终端的第二进度信息,将所述待完成任务进行划分之前,还包括:如果所述第一类型终端中的至少一个任务执行终端的类型标签为空白标签,且所述至少一个任务执行终端的第二进度信息达到第二预设阈值时,则将所述至少一个任务执行终端的类型标签修改为与第一类型相同的类型标签,其中,所述第一类型为所述第一终端匹配的类型。
[0013]可选的,如果所述第一类型终端中的至少一个任务执行终端的类型标签为不空白标签,且所述至少一个任务执行终端的第二进度信息小于所述第二预设阈值,则剔除所述至少一个任务执行终端的类型标签,其中,所述第一类型为所述第一终端匹配的类型。为了解决上述技术问题,本专利技术实施例还提出一种训练数据标注任务的分配装置,所述装置包括:接收模块,用于接收任务创建信息,所述任务创建信息指示多个训练数据标注任务以及每个训练数据标注任务的类型;识别模块,用于对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端;分配模块,用于将每种类型的训练数据标注任务分配给与其匹配的任务执行终端。
[0014]本专利技术实施例还提出一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述训练数据标注任务的分配方法的步骤。
[0015]本专利技术实施例还提出一种计算设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述训练数据标注任务的分配方法的步骤。
[0016]与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例提供一种训练数据标注任务的分配方法,所述方法包括:接收任务创建信息,所述任务创建信息指示多个训练数据标注任务以及每个训练数据标注任务的类型;对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端;将每种类型的训练数据标注任务分配给与其匹配的任务执行终端。本专利技术实施例中,接收到的任务创建信息中包括各个训练数据标注任务的类型,数据标注平台可以根据训练数据标注任务的类型分别查找匹配的任务执行终端,在分配训练数据标注任务时,可以将各个训练数据标注任务分配给与该任务的类
型匹配的任务执行终端,从而可以高效率地将大量的训练数据标注任务分配给合适的任务执行终端,以便提高标注效率。
[0017]进一步地,本专利技术实施例中数据标注平台还可以监听各个任务执行终端的第一进度信息,当任一任务执行终端的第一进度信息达到第一预设阈值时,也即,当任一任务执行终端的完成进度较快时,进一步比较该任务执行终端的进度与匹配同一类型的全部任务执行终端的平均进度,如果两者满足预设条件,也即两者差异较大时,则将上述全部任务执行终端未完成的任务重新分配给匹配的任务执行终端。由此,本专利技术实施例的方案可以根据完成进度动态调整分配给各个任务执行终端的任务数量,使得训练数据标注任务的分配更为合理,可以进一步提高标注效率。
附图说明
[0018]图1是本专利技术实施例中一种训练数据标注任务的分配方法的应用场景示意图。
[本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种训练数据标注任务的分配方法,其特征在于,所述方法包括:接收任务创建信息,所述任务创建信息指示多个训练数据标注任务以及每个训练数据标注任务的类型;对于每种类型的训练数据标注任务,识别与该类型匹配的任务执行终端;将每种类型的训练数据标注任务分配给与其匹配的任务执行终端。2.根据权利要求1所述的训练数据标注任务的分配方法,其特征在于,将每种类型的训练数据标注任务分配给与其匹配的任务执行终端包括:对于每种类型的训练数据标注任务,根据与该类型匹配的任务执行终端的数量,将该类型的训练数据标注任务进行划分,以得到各个任务执行终端需要完成的训练数据标注任务;对于每一任务执行终端,将其需要完成的训练数据标注任务添加至其任务列表中。3.根据权利要求2所述的训练数据标注任务的分配方法,其特征在于,将每种类型的训练数据标注任务分配给与其匹配的任务执行终端还包括:监听各个任务执行终端的状态信息,当其状态信息指示其处于空闲状态时,从其任务列表中选择下一个训练数据标注任务;将所述下一个训练数据标注任务对应的训练数据发送至所述任务执行终端。4.根据权利要求2所述的训练数据标注任务的分配方法,其特征在于,所述任务列表包括第一进度信息,所述第一进度信息为已完成的训练数据标注任务的数量占需要完成的训练数据标注任务的数量的比例,所述方法还包括:监听各个任务执行终端的第一进度信息;当任一任务执行终端的第一进度信息达到第一预设阈值时,判断是否需要对待完成任务进行重新分配,其中,所述待完成任务为第一类型终端未完成的训练数据标注任务,所述第一类型终端为与第一终端匹配的类型相同的全部任务执行终端,所述第一终端为所述第一进度信息达到所述第一预设阈值的任务执行终端;如果是,则将所述待完成任务重新分配给所述第一类型终端。5.根据权利要求4所述的训练数据标注任务的分配方法,其特征在于,判断是否需要对所述待完成任务进行重新分配包括:统计所述待完成任务的数量,并根据所述第一类型终端的数量计算所述待完成任务数量的均值;将所述第一终端未完成的训练数据标注任务的数量与所述均值进行比较,如果所述第一终端未完成的训练数据标注任务的数量与所述均值满足预设条件,则判断需要对所述待完成任务进行重新分配。6.根据权利要求4所述的训练数据标注任务的分配方法,其特征在于,所述任务列表还...

【专利技术属性】
技术研发人员:刘静修季俊张言
申请(专利权)人:北京芯翌智能信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1