基于深度学习的影像样本数据的获取方法及装置制造方法及图纸

技术编号:26766705 阅读:21 留言:0更新日期:2020-12-18 23:43
本申请公开了一种基于深度学习的影像样本数据的获取方法及装置。其中,该方法包括:将标注数据与标注数据对应的影像数据进行重叠,其中,在标注数据与影像样本数据的重叠区域,标注数据的各个数据点与对齐的影像数据的数据点匹配;从重叠区域中裁剪出最大的预定形状的区域作为可用区域;对可用区域进行瓦片栅格化,得到N个预定大小的瓦片;按照预定的验证数据比例,从N个瓦片中选取M个瓦片作为验证数据瓦片;将可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据。

【技术实现步骤摘要】
基于深度学习的影像样本数据的获取方法及装置
本申请属于影像处理
领域,具体涉及一种基于深度学习的影像样本数据的获取方法及装置。
技术介绍
在进行影像的分类、分割以及检测等时,通常将基于样本数据进行面向影像的深度学习训练。在深度学习训练时,一般将原始样本数据划分为训练样本数据集合与验证样本数据集合,其中,验证样本数据所占的比例是预定设定的,例如,20%。通过训样本练数据集合进行深度学习训练,通过验证样本数据集合预测评估深度学习的训练结果的准确性。在相关技术中,训练样本数据集合和验证样本数据集合主要是基于人工制作的独立的影像样本文件库,以文件的方式拆分形成所述的训练样本数据集合与验证样本数据集合,其中影像样本文件库中样本文件可以为一张图片,例如,一幅定制裁剪好的方块图片(512*512像素)等。本申请专利技术人在实现本专利技术实施例中技术方案的过程中,发现在相关技术中,为了制作样本库,首先需要制作独立的影像样本文件,如果是大文件需要裁剪,之后再根据一定的策略(例如随机比例)划分训练样本数据集与验证样本数据集。当原始影像文件很大,且影像内的样本标准相对样本文件较小时,需要人工进行采集、裁剪;且对于不同类别的样本需要人工按类别划分。因此,人工的工作量极大,效率不高。
技术实现思路
本申请实施例提供一种基于深度学习的影像样本数据的获取方法及装置,能够解决相关技术中样本数据获取的工作量大、效率低的问题。为了解决上述技术问题,本申请是这样实现的:第一方面,本申请实施例提供了一种基于深度学习的影像样本数据的获取方法,包括:将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像样本数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配;从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域;对所述可用区域进行瓦片栅格化,得到N个预定大小的瓦片,其中,N为大于1的整数;按照预定的验证数据比例,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,其中,M为大于0的整数,且M<N;将所述可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据,其中,所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。第二方面,本申请实施例提供了一种基于深度学习的影像样本数据的获取装置,包括:重叠模块,用于将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配;第一裁剪模块,用于从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域;栅格化模块,用于对所述可用区域进行瓦片栅格化,得到N个预定大小的瓦片,其中,N为大于1的整数;选取模块,用于按照预定的验证数据比例,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,其中,M为大于0的整数,且M<N;第二裁剪模块,用于将所述可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据,其中,所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。在本申请实施例中,将标注数据与该标注数据对应的影像数据进行匹配对齐,然后使用预定形状,裁剪出最大的可用区域,通过对可用区域进行瓦片栅格化得到N个预定大小的瓦片,从中选取出验证数据瓦片,再将可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据。从而可以将影像数据自动裁剪成样本数据,并划分出训练样本数据集和验证样本数据集,进而减少人工的工作量,提高效率。附图说明图1是本申请实施例提供的基于深度学习的影像样本数据的获取方法的一种流程示意图;图2示出本申请实施例中一种可用区域确定的示意图;图3示出本申请实施例中一种可用区域栅格化的示意图;图4示出本申请实施例中一种验证数据瓦片选取的示意图;图5是本申请实施例提供的基于深度学习的影像样本数据的获取方法的另一种流程示意图;图6是本申请实施例提供的基于深度学习的影像样本数据的获取装置的一种结构示意图;图7是本申请实施例提供的电子设备的一种结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的基于深度学习的影像样本数据的获取方法进行详细地说明。图1为本申请实施例提供的一种基于深度学习的影像样本数据的获取方法的流程示意图,如图1所示,该方法可以包括以下步骤S100至步骤S108。步骤S100,将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像样本数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配。在本申请实施例中,在步骤S100中,将待处理的影像数据与其标注数据进行匹配对齐,即标注数据与影像数据是重叠关系,标注数据与影像数据重叠的数据点匹配。在本申请实施例中,标注数据可以是对影像数据进行标记得到的标记影像,即标注数据为影像数据作为样本的样本标记数据。标注数据可以为矢量数据也可以为像素数据,其中,矢量数据是一种图形数据结构,其在假定描述区域为连续空间的基础上,通过记录坐标,对空间对象进行点、线、面数据处理和表达的方式;而像素数据是以规则像元阵列表示空间对象的数据结构,阵列中每个数据表示空间对象的属性特征,或者说像素数据就是像素阵列,每个像素的行号、列号用于确定位置,而像素包含的信息值用于本文档来自技高网...

【技术保护点】
1.一种基于深度学习的影像样本数据的获取方法,其特征在于,包括:/n将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配;/n从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域;/n对所述可用区域进行瓦片栅格化,得到N个预定大小的瓦片,其中,N为大于1的整数;/n按照预定的验证数据比例,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,其中,M为大于0的整数,且M<N;/n将所述可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据,其中,所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。/n

【技术特征摘要】
1.一种基于深度学习的影像样本数据的获取方法,其特征在于,包括:
将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配;
从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域;
对所述可用区域进行瓦片栅格化,得到N个预定大小的瓦片,其中,N为大于1的整数;
按照预定的验证数据比例,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,其中,M为大于0的整数,且M<N;
将所述可用区域的影像数据和标注数据进行瓦片裁剪,将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据,将裁剪出来的其它瓦片数据作为训练样本数据,其中,所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。


2.根据权利要求1所述的方法,其特征在于,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,包括:
从N个所述瓦片中随机选取M个所述瓦片作为验证数据瓦片。


3.根据权利要求1所述的方法,其特征在于,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,包括:
采用空间均匀分布的方式,从N个所述瓦片中选取M个瓦片作为验证数据瓦片。


4.根据权利要求3所述的方法,其特征在于,采用空间均匀分布的方式,从N个所述瓦片中选取M个瓦片作为验证数据瓦片,包括:
若所述预定形状为矩形,则从所述可用区域的长度方向选取m个瓦片,从所述可用区域的宽度方向上选择h个瓦片,其中,M<=w*h,且w/h~=W/H,W为所述可用区域的长度方向上的瓦片的数量,H为所述可用区域的宽度方向上的瓦片的数量。


5.根据权利要求1至4任一项所述的方法,其特征在于,对所述可用区域进行瓦片栅格化,得到N个预定大小的瓦片,包括:
按照所述预定大小对所述可用区域进行瓦片栅格化,舍弃栅格化后小于所述预定大小的区域,得到N个所述预定大小的瓦片。


6.根据权利要求1至4任一项所述的方法,其特征在于,所述标注数据为一个单通道的图像,所述图像的每个像素的值用于指示影像像素的类别值。


7.一种基于深度学习的影像样本数据的获取装置,其特征在于,包括:
重叠模块,用于将标注数据与所述标注数据对应的影像数据进行重叠,其中,在所述标注数据与所述影像数据的重叠区域,所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配;
第一裁剪模块,用于从所述...

【专利技术属性】
技术研发人员:吴鹏志每春辉
申请(专利权)人:西安泽塔云科技股份有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1