The invention provides a method, apparatus, system and storage medium for generating training data, which includes: acquiring an image including a scene as a background image, and acquiring an image including an object to be identified as a foreground image; and affixing the foreground image to a pre-positioned area in the background image to generate a fusion image, and the fused image as a foreground image. Describe the training data. A method, apparatus, system and storage medium for generating training data according to an embodiment of the present invention can quickly generate an image of the object to be recognized in various scenarios by attaching an image including the object to be identified to the background image of various scenarios as a foreground image, thereby realizing low-cost and high-efficiency generation of detection and/or for training to treat the object to be identified. Recognition of training data.
【技术实现步骤摘要】
用于生成训练数据的方法、装置、系统和存储介质
本专利技术涉及物体识别深度学习
,更具体地涉及一种用于生成训练数据的方法、装置、系统和存储介质。
技术介绍
物体识别深度学习检测和识别算法的常规流程是需要大量采集物体在各种场景下的图片,这样就可以保证模型对物体识别的泛化能力(模型效果好)。目前的流程都是通过人工采集和网络爬取来获取物体在各类场景下的图片,通常费时费力,而且项目周期长。
技术实现思路
本专利技术提出了一种关于用于生成训练数据的方案,其通过将包括待识别对象的图像作为前景图像贴合在各类场景的背景图像中,能够快速生成待识别对象在各类场景下的图像,从而能够实现低成本、高效率地生成用于训练对待识别对象的检测和/或识别的训练数据。下面简要描述本专利技术提出的关于用于生成训练数据的方案,更多细节将在后续结合附图在具体实施方式中加以描述。根据本专利技术一方面,提供了一种用于生成训练数据的方法,所述方法包括:获取包括场景的图像作为背景图像,并获取包括待识别对象的图像作为前景图像;以及将所述前景图像贴合在所述背景图像中的预定位置区域以生成融合图像,所述融合图像作为所述训练 ...
【技术保护点】
1.一种用于生成训练数据的方法,其特征在于,所述方法包括:获取包括场景的图像作为背景图像,并获取包括待识别对象的图像作为前景图像;以及将所述前景图像贴合在所述背景图像中的预定位置区域以生成融合图像,所述融合图像作为所述训练数据。
【技术特征摘要】
1.一种用于生成训练数据的方法,其特征在于,所述方法包括:获取包括场景的图像作为背景图像,并获取包括待识别对象的图像作为前景图像;以及将所述前景图像贴合在所述背景图像中的预定位置区域以生成融合图像,所述融合图像作为所述训练数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在实施所述贴合之前,将所述前景图像的属性和所述背景图像的属性对齐。3.根据权利要求2所述的方法,其特征在于,所述属性包括颜色和/或角度。4.根据权利要求1或2所述的方法,其特征在于,所述将所述前景图像贴合在所述背景图像中的预定位置区域以生成融合图像是基于泊松克隆算法。5.根据权利要求4所述的方法,其特征在于,所述将所述前景图像贴合在所述背景图像中的预定位置区域以生成融合图像包括:分别计算所述前景图像的梯度场和所述背景图像的梯度场;基于所述前景图像的梯度场和所述背景图像的梯度场计算待生成图像的梯度场;基于所述待生成图像的梯度场计算所述待生成图像的散度;以及求解泊松重建方程的系数矩阵,并基于所述系数矩阵和所述待生成图像的散度计算所述待生成图像的每个像素点的像素值,以生成所述待生成图像作为所述融合图像。6.根据权利要求1或2...
【专利技术属性】
技术研发人员:李广,
申请(专利权)人:北京旷视科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。