目标检测数据集生成方法、装置、设备及存储介质制造方法及图纸

技术编号:31811774 阅读:17 留言:0更新日期:2022-01-08 11:14
本发明专利技术属于目标检测技术领域,公开了一种目标检测数据集生成方法、装置、设备及存储介质。该方法包括:遍历预设背景图文件夹路径,获取遍历到的当前背景图;根据当前背景图对应的文件名生成空白标注文件;将当前背景图以及空白标注文件存储至初始数据集中,得到目标数据集。通过上述方式,根据背景图以及空白标注文件生成数据集,在面对目标检测识别错误的情况时,将识别错误的背景图存储至预设背景图文件夹路径即可通过本发明专利技术的数据集生成流程生成目标数据集,避免了人工标注,数据集生成效率高,快速响应模型优化工作。快速响应模型优化工作。快速响应模型优化工作。

【技术实现步骤摘要】
目标检测数据集生成方法、装置、设备及存储介质


[0001]本专利技术涉及目标检测
,尤其涉及一种目标检测数据集生成方法、装置、设备及存储介质。

技术介绍

[0002]当前在面对目标检测识别错误的情况时,一般采用人工的方式对图像进行标注,例如,当图像中有正确的目标时,将正确的目标标注出来,加入到数据集中;如果图像中没有正确的目标,图像完全是一张背景图,则人为的在图像上贴上一个目标,再将目标框出来,加入到数据集。但是当有大量的背景图时,人工标注工作量大,数据集生成效率低,模型优化工作耗时长。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种目标检测数据集生成方法、装置、设备及存储介质,旨在解决在面对目标检测识别错误的情况时,人工标注工作量大,数据集生成效率低,模型优化工作耗时长的技术问题。
[0005]为实现上述目的,本专利技术提供了一种目标检测数据集生成方法,所述方法包括以下步骤:
[0006]遍历预设背景图文件夹路径,获取遍历到的当前背景图;
[0007]根据所述当前背景图对应的文件名生成空白标注文件;
[0008]将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集。
[0009]可选地,所述将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集之后,所述方法还包括:
[0010]根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。
[0011]可选地,所述根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型之前,所述方法还包括:
[0012]确定训练代码对应的文件读取格式;
[0013]根据所述文件读取格式对所述目标数据集中的所述空白标注文件进行格式转换,得到调整后的目标数据集;
[0014]所述根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型,包括:
[0015]根据所述调整后的目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。
[0016]可选地,所述根据所述调整后的目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型,包括:
[0017]加载所述调整后的目标数据集,获取所述调整后的目标数据集中的训练图像以及训练标注文件;
[0018]根据所述训练图像生成模型输入特征;
[0019]根据所述训练标注文件生成模型预测结果;
[0020]根据所述模型输入特征以及所述模型预测结果对预设目标检测模型进行训练,得到训练好的目标检测模型。
[0021]可选地,所述将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集之前,所述方法还包括:
[0022]获取各类别分别对应的多个正样本图像;
[0023]根据所述正样本图像以及所述正样本图像对应的标注文件生成初始数据集。
[0024]可选地,所述遍历预设背景图文件夹路径,获取遍历到的当前背景图之前,所述方法还包括:
[0025]从预设数据集中搜索包含误识别标签的若干样本图像;
[0026]根据所述若干样本图像对应的标注文件分别获取各样本图像对应的检测框信息;
[0027]根据所述检测框信息从所述若干样本图像中分别截取对应的区域,得到若干初始图像;
[0028]从预设背景图文件夹路径获取初始背景图;
[0029]将所述若干初始图像分别与所述初始背景图进行融合,得到若干融合背景图;
[0030]分别对所述若干融合背景图进行命名,并将所述若干融合背景图存储于所述预设背景图文件夹路径。
[0031]可选地,所述遍历预设背景图文件夹路径,获取遍历到的当前背景图之前,所述方法还包括:
[0032]根据训练好的第一目标检测模型对若干待识别的图像进行识别;
[0033]在识别到目标图像为背景图时,将所述目标图像存储于预设背景图文件夹路径。
[0034]可选地,所述根据训练好的第一目标检测模型对若干待识别的图像进行识别之后,所述方法还包括:
[0035]在识别到当前图像中存在人体时,获取所述当前图像对应的人体检测框;
[0036]根据所述人体检测框生成当前标注文件;
[0037]根据所述当前图像以及所述当前标注文件生成初始数据集。
[0038]可选地,所述在识别到当前图像中存在人体时,获取所述当前图像对应的人体检测框之后,所述方法还包括:
[0039]根据所述人体检测框从所述当前图像中去除目标人体,得到待处理背景图;
[0040]对所述待处理背景图进行背景填充处理,得到目标背景图;
[0041]将所述目标背景图存储于预设背景图文件夹路径。
[0042]可选地,所述将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集,包括:
[0043]将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到待核验数据
集;
[0044]获取当前误识别标签,并确定所述当前误识别标签对应的误识别图像标识信息;
[0045]根据所述误识别图像标识信息从所述待核验数据集查找误识别图像以及误识别标注文件;
[0046]从所述待核验数据集对所述误识别图像以及所述误识别标注文件进行删除,得到目标数据集。
[0047]此外,为实现上述目的,本专利技术还提出一种目标检测数据集生成装置,所述目标检测数据集生成装置包括:
[0048]获取模块,用于遍历预设背景图文件夹路径,获取遍历到的当前背景图;
[0049]标注文件生成模块,用于根据所述当前背景图对应的文件名生成空白标注文件;
[0050]数据集生成模块,用于将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集。
[0051]可选地,所述目标检测数据集生成装置还包括训练模块;
[0052]所述训练模块,用于根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。
[0053]可选地,所述目标检测数据集生成装置还包括格式转换模块;
[0054]所述转换模块,用于确定训练代码对应的文件读取格式,根据所述文件读取格式对所述目标数据集中的所述空白标注文件进行格式转换,得到调整后的目标数据集;
[0055]所述训练模块,还用于根据所述调整后的目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。
[0056]可选地,所述训练模块,还用于加载所述调整后的目标数据集,获取所述调整后的目标数据集中的训练图像以及训练标注文件,根据所述训练图像生成模型输入特征,根据所述训练标注文件生成模型预测结果,根据所述模型输入特征以及所述模型预测结果对预设目标检测模型进行训练,得到训练好的目标检测模型。
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测数据集生成方法,其特征在于,所述目标检测数据集生成方法包括:遍历预设背景图文件夹路径,获取遍历到的当前背景图;根据所述当前背景图对应的文件名生成空白标注文件;将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集。2.如权利要求1所述的目标检测数据集生成方法,其特征在于,所述将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集之后,所述方法还包括:根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。3.如权利要求2所述的目标检测数据集生成方法,其特征在于,所述根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型之前,所述方法还包括:确定训练代码对应的文件读取格式;根据所述文件读取格式对所述目标数据集中的所述空白标注文件进行格式转换,得到调整后的目标数据集;所述根据所述目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型,包括:根据所述调整后的目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型。4.如权利要求3所述的目标检测数据集生成方法,其特征在于,所述根据所述调整后的目标数据集对预设目标检测模型进行训练,得到训练好的目标检测模型,包括:加载所述调整后的目标数据集,获取所述调整后的目标数据集中的训练图像以及训练标注文件;根据所述训练图像生成模型输入特征;根据所述训练标注文件生成模型预测结果;根据所述模型输入特征以及所述模型预测结果对预设目标检测模型进行训练,得到训练好的目标检测模型。5.如权利要求1所述的目标检测数据集生成方法,其特征在于,所述将所述当前背景图以及所述空白标注文件存储至初始数据集中,得到目标数据集之前,所述方法还包括:获取各类别分别对应的多个正样本图像;根据所述正样本图像以及所述正样本图像...

【专利技术属性】
技术研发人员:林楚然王福泉程力行袁振华贾东风
申请(专利权)人:奇酷软件深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1