训练样本的生成方法、目标检测方法和装置制造方法及图纸

技术编号:20427568 阅读:17 留言:0更新日期:2019-02-23 09:20
本说明书实施例提供一种训练样本的生成方法、目标检测方法和装置,训练样本的生成方法包括:首先获取第一图像,第一图像中包括至少一个干扰物体,以及获取第二图像,第二图像中包括目标检测物体,目标检测物体具有四个顶点,然后以第一图像作为背景图像以及以第二图像作为前景图像,将第一图像和第二图像进行合成处理,得到合成图像,再获取合成图像中四个顶点的位置信息,最后根据合成图像和四个顶点的位置信息,生成神经网络模型的一组训练样本,神经网络模型用于从图像中检测目标物体的顶点。该方法有利于获得大量的训练样本,从而使用训练好的神经网络模型针对不同的背景环境下的图像目标检测的鲁棒性好。

【技术实现步骤摘要】
训练样本的生成方法、目标检测方法和装置
本说明书一个或多个实施例涉及图像处理领域,尤其涉及训练样本的生成方法、目标检测方法和装置。
技术介绍
当前,常常需要在图像中检测具有规则几何形状的物体,例如,在图像中检测具有四边形轮廓的物体(简称四边形物体),比如身份证、书籍等。现有的解决方案是通过传统的边缘检测算法,比如霍夫直线检测算法,从图像中得到四个线段,然后两两计算线段所在直线相交的交点,从而得到四边形物体的四个顶点的坐标。在图像的背景稍微复杂的情况下,经过边缘检测算法对图像处理后,不仅会得到四个线段,还会有不少干扰线段。现有的方案,通过人为设定的规则来排除这些干扰线段,比如为线段所形成的四边形的长宽比、面积的大小、相邻线段的角度等设定相应阈值,通过是否满足相应的阈值来确定四边形物体对应的四个线段。上述方法需要根据不同的背景环境来设置算法的阈值,因而在不同的背景环境下鲁棒性较差。因此,希望能有改进的方案,针对不同的背景环境下的图像目标检测的鲁棒性好。
技术实现思路
本说明书一个或多个实施例描述了一种训练样本的生成方法、目标检测方法和装置,针对不同的背景环境下的图像目标检测的鲁棒性好。第一方面,提供了一种训练样本的生成方法,方法包括:获取第一图像,所述第一图像中包括至少一个干扰物体;获取第二图像,所述第二图像中包括目标检测物体,所述目标检测物体具有四个顶点;以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像;获取所述合成图像中所述四个顶点的位置信息;根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,所述神经网络模型用于从图像中检测目标物体的顶点。在一种可能的实施方式中,以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像,包括:以所述第一图像作为背景图像,以所述第二图像作为前景图像,通过改变所述第二图像的尺寸和/或所述第二图像的位置,将所述第一图像和所述第二图像进行多次合成处理,得到多个合成图像。进一步地,所述获取所述合成图像中所述四个顶点的位置信息,包括:获取人工输入的所述第二图像中所述四个顶点的位置信息;根据生成合成图像时所述第二图像的尺寸的变化,和/或所述第二图像的位置变化,确定所述合成图像中所述四个顶点的位置信息。进一步地,所述获取所述合成图像中所述四个顶点的位置信息,包括:获取人工输入的一个合成图像中所述四个顶点的位置信息;根据另一个合成图像相对于该合成图像中所述第二图像的尺寸的变化,和/或另一个合成图像相对于该合成图像中所述第二图像的位置变化,确定所述另一个合成图像中所述四个顶点的位置信息。在一种可能的实施方式中,所述干扰物体包括具有干扰线段的物体。在一种可能的实施方式中,所述目标检测物体为四边形物体。在一种可能的实施方式中,所述根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,包括:通过边缘检测算法对所述合成图像进行处理,生成包括所述目标检测物体的边缘信息的黑白图像;将所述黑白图像和所述四个顶点的位置信息,作为神经网络模型的一组训练样本。第二方面,提供了一种目标检测方法,方法包括:获取待检测图像,所述待检测图像中包含具有四个顶点的目标检测物体;将所述待检测图像输入预先训练的神经网络模型,通过所述神经网络模型的输出得到所述目标检测物体的四个顶点的位置信息,其中所述神经网络模型利用权利要求1的方法生成的训练样本训练得到。在一种可能的实施方式中,获取待检测图像包括:获取原始图像,所述原始图像中包含具有四个顶点的目标检测物体;利用边缘检测算法对所述原始图像进行处理,得到包含所述目标检测物体的边缘信息的黑白图像作为所述待检测图像。在一种可能的实施方式中,所述神经网络模型包含卷积神经网络(convolutionalneuralnetwork,CNN)。第三方面,提供了一种训练样本的生成装置,装置包括:获取单元,用于获取第一图像,所述第一图像中包括至少一个干扰物体;获取第二图像,所述第二图像中包括目标检测物体,所述目标检测物体具有四个顶点;合成单元,用于以所述获取单元获取的第一图像作为背景图像以及以所述获取单元获取的第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像;所述获取单元,还用于获取所述合成单元得到的合成图像中所述四个顶点的位置信息;生成单元,用于根据所述合成单元得到的合成图像和所述获取单元获取的四个顶点的位置信息,生成神经网络模型的一组训练样本,所述神经网络模型用于从图像中检测目标物体的顶点。第四方面,提供了一种目标检测装置,装置包括:获取单元,用于获取待检测图像,所述待检测图像中包含具有四个顶点的目标检测物体;检测单元,用于将所述获取单元获取的待检测图像输入预先训练的神经网络模型,通过所述神经网络模型的输出得到所述目标检测物体的四个顶点的位置信息,其中所述神经网络模型利用第三方面的装置生成的训练样本训练得到。第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面和/或第二方面的方法。第六方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面和/或第二方面的方法。通过本说明书实施例提供的方法和装置,首先获取第一图像,所述第一图像中包括至少一个干扰物体,以及获取第二图像,所述第二图像中包括目标检测物体,所述目标检测物体具有四个顶点,然后以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像,再获取所述合成图像中所述四个顶点的位置信息,最后根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,所述神经网络模型用于从图像中检测目标物体的顶点,这种训练样本的生成方法有利于获得大量的训练样本,有利于模型的构建,从而使用训练好的神经网络模型针对不同的背景环境下的图像目标检测的鲁棒性好。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的训练样本的生成方法流程图;图3为本说明书实施例提供的一种合成图像生成方式示意图;图4示出根据一个实施例的目标检测方法流程图;图5示出根据一个实施例的训练样本的生成装置的示意性框图;图6示出根据一个实施例的目标检测装置的示意性框图。具体实施方式下面结合附图,对本说明书提供的方案进行描述。图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及对待检测图像中的具有规则几何形状的物体进行目标检测,例如,对待检测图像中具有四个顶点的目标检测物体进行目标检测,上述具有四个顶点的目标检测物体可称为四边形物体。参见图1,本说明书实施例提供了一种目标检测方法,该目标检测方法基于神经网络模型进行目标检测,将待检测图像输入预先训本文档来自技高网...

【技术保护点】
1.一种训练样本的生成方法,所述方法包括:获取第一图像,所述第一图像中包括至少一个干扰物体;获取第二图像,所述第二图像中包括目标检测物体,所述目标检测物体具有四个顶点;以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像;获取所述合成图像中所述四个顶点的位置信息;根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,所述神经网络模型用于从图像中检测目标物体的顶点。

【技术特征摘要】
1.一种训练样本的生成方法,所述方法包括:获取第一图像,所述第一图像中包括至少一个干扰物体;获取第二图像,所述第二图像中包括目标检测物体,所述目标检测物体具有四个顶点;以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像;获取所述合成图像中所述四个顶点的位置信息;根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,所述神经网络模型用于从图像中检测目标物体的顶点。2.如权利要求1所述的方法,其中,以所述第一图像作为背景图像以及以所述第二图像作为前景图像,将所述第一图像和所述第二图像进行合成处理,得到合成图像,包括:以所述第一图像作为背景图像,以所述第二图像作为前景图像,通过改变所述第二图像的尺寸和/或所述第二图像的位置,将所述第一图像和所述第二图像进行多次合成处理,得到多个合成图像。3.如权利要求2所述的方法,其中,所述获取所述合成图像中所述四个顶点的位置信息,包括:获取人工输入的所述第二图像中所述四个顶点的位置信息;根据生成合成图像时所述第二图像的尺寸的变化,和/或所述第二图像的位置变化,确定所述合成图像中所述四个顶点的位置信息。4.如权利要求2所述的方法,其中,所述获取所述合成图像中所述四个顶点的位置信息,包括:获取人工输入的一个合成图像中所述四个顶点的位置信息;根据另一个合成图像相对于该合成图像中所述第二图像的尺寸的变化,和/或另一个合成图像相对于该合成图像中所述第二图像的位置变化,确定所述另一个合成图像中所述四个顶点的位置信息。5.如权利要求1所述的方法,其中,所述干扰物体包括具有干扰线段的物体。6.如权利要求1所述的方法,其中,所述目标检测物体为四边形物体。7.如权利要求1所述的方法,其中,所述根据所述合成图像和所述四个顶点的位置信息,生成神经网络模型的一组训练样本,包括:通过边缘检测算法对所述合成图像进行处理,生成包括所述目标检测物体的边缘信息的黑白图像;将所述黑白图像和所述四个顶点的位置信息,作为神经网络模型的一组训练样本。8.一种目标检测方法,所述方法包括:获取待检测图像,所述待检测图像中包含具有四个顶点的目标检测物体;将所述待检测图像输入预先训练的神经网络模型,通过所述神经网络模型的输出得到所述目标检测物体的四个顶点的位置信息,其中所述神经网络模型利用权利要求1的方法生成的训练样本训练得到。9.如权利要求8所述的方法,其中,获取待检测图像包括:获取原始图像,所述原始图像中包含具有四个顶点的目标检测物体;利用边缘检测算法对所述原始图像进行处理,得到包含所述目标检测物体的边缘信息的黑白图像作为所述待检测图像。10.如权利要求8所述的方法,其中,所述神经网络模型包含卷积神经网络CNN。11.一种训练样本的生成装置,所述装置包括:获取单元,用于获取第一图像,所述第一图像中包括至少一个干扰物体;获取第二图像,所述第二图像中包括目标检测物体,所述目标检...

【专利技术属性】
技术研发人员:钱佳景王康管维刚
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1