本发明专利技术提出了一种模型训练方法、训练装置、电子设备和可读存储介质,其中,模型训练方法,包括:获取N个图像数据,根据N个图像数据生成第一数据集,N为大于1的整数;将N个图像数据中的第一特征更新为第二特征,并根据更新后的N个图像数据生成第二数据集;根据第一数据集和第二数据集得到目标数据集,通过目标数据集训练检测模型。本发明专利技术平衡了用于训练模型的数据集中的各个不同种类的特征的数量比例,由于本申请仅对第一特征更新转化为第二特征,不会对图像数据中其他图像特征产生影响,提高了最终训练得到的检测模型对待检测物体的识别准确性。确性。确性。
【技术实现步骤摘要】
模型训练方法、训练装置、电子设备和可读存储介质
[0001]本专利技术属于检测模型
,具体而言,涉及一种模型训练方法、训练装置、电子设备和可读存储介质。
技术介绍
[0002]环境复杂且凌乱的建筑工地会给城市建设的发展带来一定的消极影响,需要花费一定的人力和时间去实时监控是否有未覆盖的易扬尘物品。而随着深度学习的不断发展,视频自动监控代替了传统的人眼监控,节省了人力成本和时间成本,而相关技术中的检测模型对待检测物体的识别不够准确。
技术实现思路
[0003]本专利技术旨在解决现有技术或相关技术中存在的技术问题之一。
[0004]为此,本专利技术的第一方面提出了一种模型训练方法。
[0005]本专利技术的第二方面提出了一种模型训练装置。
[0006]本专利技术的第三方面提出了一种电子设备。
[0007]本专利技术的第四方面提出了一种可读存储介质。
[0008]有鉴于此,根据本专利技术的第一方面提出一种模型训练方法,包括:获取N个图像数据,根据N个图像数据生成第一数据集,N为大于1的整数;将N个图像数据中的第一特征更新为第二特征,并根据更新后的N个图像数据生成第二数据集;根据第一数据集和第二数据集得到目标数据集,通过目标数据集训练检测模型。
[0009]本专利技术提供模型训练方法用于电子设备,电子设备获取N个图像数据,N为大于1的整数,具体来说,电子设备通过拍摄装置直接采集多个图像数据,或接收其他电子设备发送的多个图像数据。将多个图像数据进行标注生成第一数据集,通过多个图像数据生成的第一数据集,能够保证第一数据集中的特征数量较大,从而提高后续训练模型的效果。在生成数据集的过程中,需要先识别多个图像数据中的图像特征,图像特征包括第一特征、第二特征、第三特征等多个图像特征,并将不同的图像特征分别进行标记。在生成第一数据集后,对多个图像数据中的第一特征进行更新,使N个图像数据中的第一特征均转化为第二特征,并通过更新后的多个图像数据生成第二数据集。将第一数据集与第二数据集作为目标数据集训练模型,从而得到检测模型。在第一数据集中的第一特征数量较少的情况下,如果仅通过第一数据集训练模型,从而增加模型对目标特征的误检率,降低模型对关键类别特征的检测效果。本专利技术通过将多个图像数据中的第一特征更新为第二特征,并通过更新后的多个图像数据生成第二数据集,将第一数据集与第二数据集进行组合形成目标数据集,平衡了用于训练模型的数据集中的各个不同种类的特征的数量比例,由于本申请仅对第一特征更新转化为第二特征,不会对图像数据中其他图像特征产生影响,提高了最终训练得到的检测模型对待检测物体的识别准确性。
[0010]具体来说,图像数据为施工场地的图像,通过对图像数据中的毡布、裸土、绿草和
黄草进行标注,得到第一数据集。图像数据中的绿草为第一特征,黄草为第二特征,提取图像数据中的绿草特征,并将绿草通过色彩转换,更新为黄草,并将绿草的标注也统一修改为黄草,通过更新后的图像数据得到第二数据集。将第一数据集与第二数据集结合作为目标数据集,训练检测模型,使检测模型能够有效对毡布、裸土、绿草和黄草进行识别,进而降低了检测模型对处于未覆盖状态的裸土的误检率。
[0011]通过HSV(Hue,Saturation,Value,颜色模型)的值重新量化的方式,将施工场地的图像中的绿草特征替换为黄草特征。具体地,获取黄色的HSV的范围,其中,H的范围值为26至34,S的范围值为43至255,V的范围值为46至255。将绿草特征在施工场地的图像中所处的位置的所有元素均替换为黄色HSV范围内的值,并将该位置的标注也统一修改为黄草对应的标注。
[0012]另外,根据本专利技术提供的上述技术方案中的模型训练方法,还可以具有如下附加技术特征:
[0013]在一种可能的设计中,根据N个图像数据生成第一数据集,包括:通过第一标记和第二标记,对N个图像数据中的第一特征和第二特征进行标注,以得到第一数据集。
[0014]在该设计中,通过对多个图像数据中的第一特征和第二特征进行标注,从而得到包括多个图像数据中多个第一特征和多个第二特征的第一数据集。
[0015]具体来说,图像数据中包括绿草、黄草、毡布和裸土等图像特征。通过“g_grass”标注绿草、通过“y_grass”标注黄草、通过“fugai”标注毡布,以及通过“weifugai”标注裸土,其中,绿草为第一特征,黄草为第二特征,“g_grass”为第一标记,“y_grass”为第二标记。通过多个中不同的标记对图像中所需识别的图像特征进行标记,能够保证第一数据集中包括训练需要多种图像特征。
[0016]在一种可能的设计中,将N个图像数据中的第一特征更新为第二特征,包括:识别N个图像数据中带有第一特征的M个待处理图像数据,M≤N;将M个待处理图像数据中的第一特征替换为第二特征,并将第一标记替换为第二标记,以得到M个目标图像数据;通过M个目标图像数据,更新N个图像数据。
[0017]在该设计中,对N个图像数据中的第一特征更新为第二特征的过程中,需要对N个图像数据中待处理图像数据进行识别,待处理图像数据中包括第二特征,待处理图像数据的数量为M个,且待处理图像数据的数量小于等于图像数据的数量。提取待处理图像数据中的第一特征,并将第一特征替换为第二特征,同时对第一特征对应的第一标记也进行相应替换,完成对M个待处理图像数据更新,得到更新后的M个目标图像数据,并根据更新后的M个目标图像数据得到第二数据集。通过第一数据集和第二数据集训练检测模型,实现了平衡用于训练模型的数据集中的各个不同种类的特征的数量比例,降低检测模型的误检率,提高检测模型对目标特征的检测准确性。
[0018]在一些实施例中,直接通过更新后的M个目标图像数据生成第二数据集。
[0019]在另外一些实施例中,将M个目标图像数据替换N个图像数据中的M个待处理图像数据,从而得到第二数据集。
[0020]本专利技术通过识别N个图像数据中的M个待处理图像数据,其中仅对包括第一特征的图像数据进行更新处理,减少了更新图像数据过程中的数据处理量。并且在更新待处理图像数据中的第一特征的过程中,同时对第一特征对应的第一标记替换为第二标记,使更新
后的N个图像特征处于数据集标注完成状态,无需对更新后的N个图像特征再次进行标记,减少了标注数据集的步骤。
[0021]具体来说,对N个图像数据进行遍历,在检测到图像数据中包括第一特征,则将该图像数据中的第一特征更新为第二特征,同时对第一特征的对应的第一标记替换为第二标记。最后将该图像数据另存为更新的图像数据,即对其进行重新命名,以区分更新前的图像数据。
[0022]在一种可能的设计中,将M个待处理图像数据中的第一特征替换为第二特征,包括:获取第一特征在M个目标图像数据中的位置信息和像素矩阵;根据像素矩阵,按照设定颜色模型生成第二特征;根据位置信息,将M个图像数据中的第一特征替换为第二特征。
[0023]在该设计中,确定第一标记在目标图像数据中的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取N个图像数据,根据所述N个图像数据生成第一数据集,N为大于1的整数;将所述N个图像数据中的第一特征更新为第二特征,并根据更新后的N个图像数据生成第二数据集;根据所述第一数据集和所述第二数据集得到目标数据集,通过所述目标数据集训练检测模型。2.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述N个图像数据生成第一数据集,包括:通过第一标记和第二标记,对所述N个图像数据中的所述第一特征和所述第二特征进行标注,以得到所述第一数据集。3.根据权利要求2所述的模型训练方法,其特征在于,所述将所述N个图像数据中的第一特征更新为第二特征,包括:识别所述N个图像数据中带有所述第一特征的M个待处理图像数据,M≤N;将所述M个待处理图像数据中的所述第一特征替换为第二特征,并将所述第一标记替换为所述第二标记,以得到M个目标图像数据;通过所述M个目标图像数据,更新所述N个图像数据。4.根据权利要求3所述的模型训练方法,其特征在于,所述将所述M个待处理图像数据中的所述第一特征替换为所述第二特征,包括:获取所述第一特征在所述M个目标图像数据中的位置信息和像素矩阵;根据所述像素矩阵,按照设定颜色模型生成所述第二特征;根据所述位置信息,将所述M个图像数据中的所述第一特征替换为所述第二特征。5.根据权利要求1至4中任一项所述的模型训练方法,其特征在于,所述通过所述目标数据集训练检测模型,包括:提取所述目标数据集中每个所述图像数据的特征向量;通...
【专利技术属性】
技术研发人员:罗安华,邢军华,
申请(专利权)人:深圳中兴网信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。