深度模型训练方法及装置、电子设备及存储介质制造方法及图纸

技术编号:21091043 阅读:24 留言:0更新日期:2019-05-11 10:30
本发明专利技术实施例公开了一种深度模型训练方法及装置、电子设备及存储介质。所述深度学习模型训练方法,包括:获取第一模型输出的第n+1第一标注信息,所述第一模型已经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;将所述第二模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第一模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。

Deep Model Training Method and Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
深度模型训练方法及装置、电子设备及存储介质
本专利技术涉及信息
,尤其涉及一种深度模型训练方法及装置、电子设备及存储介质。
技术介绍
深度学习模型可以通过训练集的训练之后,具有一定的分类或识别能力。所述训练集通常包括:训练数据及训练数据的标注数据。但是一般情况下,标注数据都需要人工进行手动标注。一方面纯手动标注所有的训练数据,工作量大、效率低,且标注过程中存在人工错误;另一方面,若需要实现高精度的标注,例如以图像领域的标注为例,需要实现像素级分割,纯人工标注要达到像素级分割,难度非常大且标注精度也难以保证。故基于纯人工标注的训练数据进行深度学习模型的训练,会存在训练效率低、训练得到的模型因为训练数据自身精度低导致模型的分类或识别能力精度达不到预期。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种深度模型训练方法及装置、电子设备及存储介质。本专利技术的技术方案是这样实现的:一种深度学习模型训练方法,包括:获取第一模型输出的第n+1第一标注信息,所述第一模型经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;将所述第一模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第二模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。基于上述方案,所述方法包括:确定n是否小于N,N为最大训练轮数;所述获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息;包括:若n小于N,获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息。基于上述方案,所述获取所述训练数据及所述训练数据的初始标注信息,包括:获取包含有多个分割目标的训练图像及所述分割目标的外接框;所述基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集,包括:基于所述外接框,在所述外接框内绘制与所述分割目标形状一致的标注轮廓;基于所述训练数据及所述标注轮廓,生成所述第一模型的第一训练集及所述第二模型的第一训练集。基于上述方案,所述基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集,还包括:基于所述外接框,生成具有重叠部分的两个所述分割目标的分割边界;基于所述训练数据及所述分割边界,生成所述第一模型的第一训练集和所述第二模型的第一训练集。基于上述方案,所述基于所述外接框,在所述外接框内绘制与所述分割目标形状一致的标注轮廓,包括:基于所述外接框,在所述外接框内绘制与细胞形状一致的所述外接框的内接椭圆。一种深度学习模型训练装置,包括:标注模块,用于获取第一模型输出的第n+1第一标注信息,所述第一模型经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;第一生成模块,用于基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;训练模块,用于将所述第二模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第一模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。基于上述方案,所述装置包括:确定模块,用于确定n是否小于N,N为最大训练轮数;所述标注模块,用于若n小于N,获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息。基于上述方案,所述装置包括:获取模块,用于获取所述训练数据及所述训练数据的初始标注信息;第二生成模块,用于基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集。基于上述方案,所述获取模块,具体用于获取包含有多个分割目标的训练图像及所述分割目标的外接框;所述第二生成模块,具体用于基于所述外接框,在所述外接框内绘制与所述分割目标形状一致的标注轮廓;基于所述训练数据及所述标注轮廓,生成所述第一模型的第一训练集及所述第二模型的第一训练集。基于上述方案,所述第一生成模块,具体用于基于所述外接框,生成具有重叠部分的两个所述分割目标的分割边界;基于所述训练数据及所述分割边界,生成所述第一模型的第一训练集和所述第二模型的第一训练集。基于上述方案,所述第二生成模块,具体用于基于所述外接框,在所述外接框内绘制与细胞形状一致的所述外接框的内接椭圆。一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令;所述计算机可执行指令被执行后,能够实现前述任意一个技术方案提供的深度学习模型训练方法。一种电子设备,包括:存储器;处理器,与所述存储器连接,用于通过执行存储在所述存储器上的计算机可执行指令实现前述任意一个技术方案提供的深度学习模型训练方法。本专利技术实施例提供的技术方案,会利用深度学习模型前一轮训练完成之后对训练数据进行标注获得标注信息,该标注信息用作另外一个模型的下一轮训练的训练样本,可以利用非常少的初始人工标注的训练数据进行模型训练,然后利用逐步收敛的第一模型和第二模型识别输出的标注数据作为另一个模型下一轮的训练样本。由于深度学习模型在前一轮训练过程中模型参数会依据大部分标注正确的数据生成,而少量标注不正确或者标注精度低的数据对深度学模型的模型参数影响小,如此反复迭代多次,深度学模型的标注信息会越来越精确。利用越来越精确的标注信息作为训练数据,则会使得深度学习模型的训练结果也越来越好。由于模型利用自身的标注信息构建训练样本,如此,减少了人工手动标注的数据量,减少了人工手动标注所导致的效率低及人工错误,具有模型训练速度快及训练效果好的特点,且采用这种方式训练的深度学习模型,具有分类或识别精确度高的特点。此外,在本实施例中同时训练至少两个模型,减少了单一模型在学习了一个错误的特征之后通过反复迭代导致最终深度学习模型的学习异常现象。在本实施例中会将一个模型的前一轮训练之后对训练数据进行标注的结果,用于另一个模型的下一轮学习,如此,可以利用两个模型为彼此准备下一轮训练数据导致的反复迭代加强某些错误,从而能够减少模型学习出错的现象,提升深度学习模型的训练效果。附图说明图1为本专利技术实施例提供的第一种深度学习模型训练方法的流程示意图;图2为本专利技术实施例提供的第二种深度学习模型训练方法的流程示意图;图3为本专利技术实施例提供的第三种深度学习模型训练方法的流程示意图;图4为本专利技术实施例提供的一种深度学习模型训练装置的结构示意图;图5为本专利技术实施例提供的一种训练集的变化示意图;图6为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式以下结合说明书附图及具体实施例对本专利技术的技术方案做进一步的详细阐述。如图1所示,本实施例提供一种深度学习模型训练方法,包括:步骤S110:获取第一模型输出的第n+1第一标注信息,所述第一模型已经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;步骤S120:基于所述训练本文档来自技高网...

【技术保护点】
1.一种深度学习模型训练方法,其特征在于,包括:获取第一模型输出的第n+1第一标注信息,所述第一模型经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;将所述第二模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第一模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。

【技术特征摘要】
1.一种深度学习模型训练方法,其特征在于,包括:获取第一模型输出的第n+1第一标注信息,所述第一模型经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;将所述第二模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第一模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。2.根据权利要求1所述的方法,其特征在于,所述方法包括:确定n是否小于N,N为最大训练轮数;所述获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息,包括:若n小于N,获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息。3.根据权利要求1或2所述的方法,其特征在于,所述方法包括:获取所述训练数据及所述训练数据的初始标注信息;基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集。4.根据权利要求3所述的方法,其特征在于,所述获取所述训练数据及所述训练数据的初始标注信息,包括:获取包含有多个分割目标的训练图像及所述分割目标的外接框;所述基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集,包括:基于所述外接框,在所述外接框内绘制与所述分割目标形状一致的标注轮廓;基于所述训练数据及所述标注轮廓,生成所述第一模型的第一训练集及所述第二模型的第一训练集。5.根据权利要求4所述的方法,其特征在于,所述基于所述初始标注信息,生成所述第一模型的第一训练集...

【专利技术属性】
技术研发人员:李嘉辉
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1