基于验证图片的多目标数据训练集生成方法技术

技术编号：37458281 阅读：10 留言：0更新日期：2023-05-06 09:30

本发明专利技术公开了基于验证图片的多目标数据训练集生成方法，采用经过预训练的目标检测网络模型，对预处理后的未标注图片进行识别，按照识别结果分割出待检测目标区域，对于未标注图片的其余部分根据预设分割策略进行分割，得到分割后的未知分割图片；将根据图片推送策略推送的未知分割图片和已知分割图片进行拼接，生成向用户推送的验证图片；最后在获得用户对验证图片中未知分割图片和已知分割图片的标注结果后，实现对未标注图片的标注，放入训练集。本发明专利技术可以解决训练集人工制作过程中的低效、工作量大的困难，能为模型训练更快速的提供相应的训练集，为人工智能、机器学习领域的进一步发展提供了帮助。进一步发展提供了帮助。进一步发展提供了帮助。

全部详细技术资料下载

【技术实现步骤摘要】
基于验证图片的多目标数据训练集生成方法

[0001]本申请属于神经网络训练
，尤其涉及一种基于验证图片的多目标数据训练集生成方法。

技术介绍

[0002]近年来，随着机器学习、人工智能技术的广泛应用与发展，自动化图像识别也随之兴起，越来越多的行业运用图像识别技术代替传统的人工识别模式，包括人脸识别、物体识别、文字识别等，精准、可靠、高效的识别模型正被大众所认可，逐步取代人力成为大势所趋。神经网络模型能够通过学习图片的局部特征，能在图片内包含有多个目标时精确的定位其在图片中的位置，实现目标检测功能。在目标检测模型训练过程中数据集是研究与验证的基础，足量的数据集能够提升模型的识别能力，提取并分析更多的图像特征。然而现在公开的深度学习数据集类别较少，例如MNIST、ImageNet、Open Images、SVHN、CIFAR
‑
10等深度学习开放数据集，虽拥有数量足够多的训练图片，但所涵盖的类别仅为文字提取、物品检测等，通用性较强但泛化能力较差，且图片内大多只包含单一目标，无法训练出多目标的检测模型，对于目标检测模型的训练难以起到足够的数据支撑作用。因此，在众多其他领域内的研究人员仍需花费大量的时间制作相关数据集来满足模型训练的需求。人工标注数据标签不仅工作量巨大，且工作效率较为低下，一定程度上影响了人工智能在交叉领域内的发展。

技术实现思路

[0003]本申请的目的是提供一种基于验证图片的多目标数据训练集生成方法，以克服多目标检测模型训练集标注工作低效，数据无法大规模泛化的问题。...

【技术保护点】

【技术特征摘要】
1.一种基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，包括：将未标注图片进行预处理，剔除掉图片中的背景噪声；采用经过预训练的目标检测网络模型，对预处理后的未标注图片进行识别，按照识别结果分割出待检测目标区域，对于未标注图片的其余部分根据预设分割策略进行分割，得到分割后的未知分割图片；获取登录用户的用户特征信息，计算得到用户的可信度，根据用户的可信度，选择对应的图片推送策略；将根据图片推送策略推送的未知分割图片和已知分割图片进行拼接，生成向用户推送的验证图片；在获得用户对验证图片中未知分割图片和已知分割图片的标注结果后，若用户对已知分割图片的标注结果可信，则认为用户对未知分割图片的标注结果可信，实现对未标注图片的标注，放入训练集。2.根据权利要求1所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述将未标注图片进行预处理，剔除掉图片中的背景噪声，包括：将未标注的数据集图片进行灰度化后进行高斯滤波；计算梯度值和方向；根据梯度值和方向，对未标注的数据集图片进行非极大值抑制处理；根据选取的双阈值，区分出强边缘点和弱边缘点；通过滞后边界跟踪处理，得到准确边缘，然后进行图片裁剪，得到去除背景噪声后的图片。3.根据权利要求1所述的基于验证图片的多目标数据训练集生成方法，其特征在于，所述基于验证图片的多目标数据训练集生成方法，还包括：对未标注图片中分割的每个未知分割图片的标注结果进行遍历，确定包括待检测目标的感兴趣区域；对每一个感兴趣区域，将感兴趣区域内原先未知分割图片分割框分别向上下左右四个方向进行偏移，重新分割后再次推送...

【专利技术属性】
技术研发人员：邱杰凡，贾逸哲，丰泽辉，张坤，张锦鸿，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人