一种用于目标检测的数据集合成方法技术

技术编号:44008840 阅读:18 留言:0更新日期:2025-01-15 00:56
本发明专利技术提供了一种用于目标检测的数据集合成方法,包含四个主要步骤:建立背景图像库及三维模型库、估计待检测目标的三维姿态信息、场景重建和目标投影以及渲染数据和生成标签。在背景图像库建立阶段,收集了相机的内外参数和光照信息。在进行三维姿态估计时,运用了背景图像、相机参数、目标位置坐标和点云数据进行预测。然后在三维建模软件中重建场景,并投影目标。最后,渲染场景,生成数据集和标签。该方法利用三维建模软件合成数据,并通过估计场景中的三维姿态,解决了合成数据真实性低、标签成本高、难以获取特定场景真实数据等问题,大大提升了目标检测的准确性和稳定性,降低了标注成本,并能模拟特定场景,解决了数据获取的难题。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,特别是涉及一种目标检测数据合成方法。


技术介绍

1、目标检测是计算机视觉领域中的重要任务,用于识别图像或视频中的特定对象并将其定位。在目标检测算法的研发和优化过程中,大量的标记数据是必不可少的。这些标记数据通常由人工标注人员进行手动标注,其过程费时费力且成本较高。为了解决这个问题,许多研究人员开始探索使用合成数据来训练目标检测算法,以减少对真实标记数据的依赖。

2、合成数据是通过在计算机上生成虚拟图像或视频来模拟真实场景的图像或视频。合成数据的创建主要有两种方式,一种是通过贴图方案,另一种是使用三维软件进行模型渲染。然而,这两种目标检测数据合成方法都存一些限制和挑战。

3、专利cn111091167将预先准备的目标图片贴到背景图像上。这种方法的问题在于它往往不能准确模拟光照、阴影以及目标和场景的三维透视关系等效果,因此生成的合成图像往往与真实场景存在明显的差距。

4、专利cn110084304采用三维软件渲染则通过模型渲染生成更真实的合成图像。然而,这种方式需要大量的人工输入,例如设置模型的本文档来自技高网...

【技术保护点】

1.一种用于目标检测的数据集合成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其中在步骤S20中,三维姿态估计模型包括图像处理子网络、相机参数处理子网络和点云处理子网络,这些子网络分别用于处理输入的背景图像、相机内外参数以及待检测目标在图像中的位置坐标和待检测目标的点云数据,提取出特征后并将这些特征拼接在一起,最后输出待检测目标在背景图像上的置信度,以及模型的三维旋转信息和缩放比例。

【技术特征摘要】

1.一种用于目标检测的数据集合成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其中在步骤s20中,三维姿态估计模型包括图像处理子网络、相机参数处理子网络和点云处理子网络,这些子网...

【专利技术属性】
技术研发人员:刘泰廷吴佳昱李杨吴晓青郭涛
申请(专利权)人:南京美基森信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1