模型训练方法、系统、装置、设备和存储介质制造方法及图纸

技术编号:33990837 阅读:20 留言:0更新日期:2022-07-02 09:38
本发明专利技术实施例提供一种模型训练方法、系统、装置、设备和存储介质,该方法包括:处理设备根据标注任务中第一数据对应的人工标注结果训练标注模型。再利用此模型对标注任务中的第二数据进行辅助标注,以输出第二数据对应的辅助标注结果,以供人工修正。再根据人工修正后的标注结果优化标注模型。最终,处理设备输出优化后的第二标注模型,同时还输出标注任务对应的标注结果。可见,上述方法可以实现模型训练和标注任务的同时进行,降低了人工标注的工作量。并且由于标注模型是根据标注任务训练得到的,因此,优化后的标注模型是适用于此标注任务的最佳标注模型,不会出现因不存在适用的标注模型,而只能选择人工标注的情况。而只能选择人工标注的情况。而只能选择人工标注的情况。

【技术实现步骤摘要】
模型训练方法、系统、装置、设备和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模型训练方法、系统、装置、设备和存储介质。

技术介绍

[0002]近年来,人工智能技术已经应用到众多领域,比如自动驾驶、人脸识别、人机对话等等。人工智能的实现依靠的是通过机器学习或者深度学习训练得到的各种模型,比如目标检测模型、语音识别模型、人脸识别模型、语言模型等。而利用标注后的训练样本对模型进行有监督训练则是一种较为成熟的模型训练方法,这也就使得样本标注成为人工智能领域必不可少的一项工作。
[0003]在实际应用中,由于模型适用的场景多种多样,因此,使得训练样本的标注需要也多种多样。

技术实现思路

[0004]本专利技术实施例提供一种模型训练方法、装置、设备和存储介质,用以保证标注模型与标注任务的匹配。
[0005]本专利技术实施例提供一种模型训练方法,包括:
[0006]接收包含第一数据和第二数据的标注任务;
[0007]根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;
[0008]将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;
[0009]根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;
[0010]输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。
[0011]本专利技术实施例提供一种模型训练装置,包括:
[0012]接收模块,用于接收包含第一数据和第二数据的标注任务;
[0013]训练模块,用于根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;
[0014]输入模块,用于将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;
[0015]调整模块,用于根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;
[0016]输出模块,用于输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。
[0017]本专利技术实施例提供一种电子设备,包括:处理器和存储器;其中,所述存储器用于
存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
[0018]接收包含第一数据和第二数据的标注任务;
[0019]根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;
[0020]将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;
[0021]根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;
[0022]输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。
[0023]本专利技术实施例提供了一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器至少执行以下的动作:
[0024]接收包含第一数据和第二数据的标注任务;
[0025]根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;
[0026]将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;
[0027]根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;
[0028]输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。
[0029]本专利技术实施例提供一种模型训练系统,包括:通信连接的第一处理设备和第二处理设备
[0030]所述第一处理设备,用于接收包含第一数据和第二数据的标注任务;以及根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;根据接收到的所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;
[0031]所述第二处理设备,用于获取所述第一标注模型,将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;发送修正后标注结果至所述第一处理设备;以及输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。
[0032]在本专利技术提供的模型训练方法,处理设备接收标注任务,先根据标注任务中第一数据对应的人工标注结果训练第一标注模型。再利用此模型对标注任务中的第二数据进行辅助标注,以输出可供人工修正的、对应于第二数据的辅助标注结果。处理设备可以根据第二数据对应的修正后标注结果调整第一标注模型的模型参数,得到第二标注模型。最终,处理设备输出适用于此标注任务的第二标注模型同时,还可以输出第二数据对应的修正后标注结果,再结合第一数据对应人工标注结果,也即是完成了标注任务。
[0033]可见,上述方法可以实现模型训练和标注任务的同时进行,并且降低人工标注的工作量。另外,由于标注模型是使用标注任务中的数据训练完成的,因此,训练得到的第二标注模型是适用于此标注任务的最佳标注模型,不会出现因不存在适用的标注模型,而只能选择人工标注的情况。
附图说明
[0034]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1为本专利技术实施例提供的一种模型训练方法的流程图;
[0036]图2为本专利技术实施例提供的另一种模型训练方法的流程图;
[0037]图3为本专利技术实施例提供的一种模型训练系统的结构示意图;
[0038]图4为本专利技术实施例提供的模型训练方法应用在音频转换场景下的示意图;
[0039]图5为本专利技术实施例提供的一种模型训练装置的结构示意图;
[0040]图6为与图5所示实施例提供的模型训练装置对应的电子设备的结构示意图。
具体实施方式
[0041]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式。除非上下文清楚地表示其他含义,“多个”一般包含至少两本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:接收包含第一数据和第二数据的标注任务;根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,包括:若目标标注结果的数量与所述辅助标注结果的数量的比值大于或等于第一预设阈值,则根据所述修正后标注结果和所述人工标注结果,调整所述标第一注模型的模型参数,其中,所述目标标注结果为所述辅助标注结果中被人工修正的标注结果。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述目标标注结果的数量与所述辅助标注结果的数量的比值小于所述第一预设阈值,则比较所述比值与所述第二预设阈值,所述第一预设阈值大于所述第二预设阈值;若所述比值小于所述第二预设阈值,则输出适用于所述标注任务的所述第一标注模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述比值大于所述第二预设阈值,则获取所述标注任务中的第三数据;将所述第三数据输入所述第一标注模型,以由所述第一标注模型输出所述第三数据对应的辅助标注结果,以供人工修正;所述根据所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,包括:根据所述第二数据和所述第三数据各自对应的修正后标注结果以及所述人工标注结果,调整所述标第一注模型的模型参数。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:所述第一数据的数量和/或所述第一数据中正样本和负样本的分布比例满足预设条件。6.根据权利要求5所述的方法,其特征在于,所述第二数据的数量和所述第三数据的数量均为预设阈值。7.根据权利要求1所述的方法,其特征在于,所述标注任务包括对音频、文本、图像、视频中的至少一项进行标注。8.一种模型训练系统,其特征在于,包括:通信连接的第一处理设备和第二处理设备所述第一处理设备,用于接收包含第一数据和第二数据的标注任务;以及根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型;根据接收到的所述第二数据对应的修正后标注结果,调整所述第一标注模型的模型参数,以得到第二标注模型;所述第二处理设备,用于获取所述第一标注模型,将所述第二数据输入所述第一标注模型,由所述第一标注模型输出所述第二数据对应的辅助标注结果,以供人工修正;发送修
正后标注结果至所述第一处理设备;以及输出所述人工标注结果、所述修正后标注结果以及适用于所述标注任务的所述第二标注模型。9.根据权利要求8所述的系统,其特征在于,所述第一处理设备具体用于,若所述第一数据的数量和/或所述第一数据中正样本和负样本的分布比例满足预设条件,则根据所述第一数据对应的人工标注结果进行训练,得到第一标注模型。10.根据权利要求8所述的系统,其特征在于,所述第一处理设备还用于,发送标注模型的训练状态;以及若所述训练状态为训练完成,则将所述第一标注模型对应的可执...

【专利技术属性】
技术研发人员:谢韬高倩邵长东
申请(专利权)人:科沃斯商用机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1