基于深度学习的影像样本数据的获取方法及装置制造方法及图纸

技术编号：26766705 阅读：21 留言：0更新日期：2020-12-18 23:43

本申请公开了一种基于深度学习的影像样本数据的获取方法及装置。其中，该方法包括：将标注数据与标注数据对应的影像数据进行重叠，其中，在标注数据与影像样本数据的重叠区域，标注数据的各个数据点与对齐的影像数据的数据点匹配；从重叠区域中裁剪出最大的预定形状的区域作为可用区域；对可用区域进行瓦片栅格化，得到N个预定大小的瓦片；按照预定的验证数据比例，从N个瓦片中选取M个瓦片作为验证数据瓦片；将可用区域的影像数据和标注数据进行瓦片裁剪，将裁剪出来的与验证数据瓦片对应的瓦片数据作为验证样本数据，将裁剪出来的其它瓦片数据作为训练样本数据。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的影像样本数据的获取方法及装置
本申请属于影像处理
领域，具体涉及一种基于深度学习的影像样本数据的获取方法及装置。
技术介绍
在进行影像的分类、分割以及检测等时，通常将基于样本数据进行面向影像的深度学习训练。在深度学习训练时，一般将原始样本数据划分为训练样本数据集合与验证样本数据集合，其中，验证样本数据所占的比例是预定设定的，例如，20％。通过训样本练数据集合进行深度学习训练，通过验证样本数据集合预测评估深度学习的训练结果的准确性。在相关技术中，训练样本数据集合和验证样本数据集合主要是基于人工制作的独立的影像样本文件库，以文件的方式拆分形成所述的训练样本数据集合与验证样本数据集合，其中影像样本文件库中样本文件可以为一张图片，例如，一幅定制裁剪好的方块图片(512*512像素)等。本申请专利技术人在实现本专利技术实施例中技术方案的过程中，发现在相关技术中，为了制作样本库，首先需要制作独立的影像样本文件，如果是大文件需要裁剪，之后再根据一定的策略(例如随机比例)划分训练样本数据集与验证样本数据集。当原始影像文件很大，且影像内的样本标准相对样本文件较小时，需要人工进行采集、裁剪；且对于不同类别的样本需要人工按类别划分。因此，人工的工作量极大，效率不高。
技术实现思路
本申请实施例提供一种基于深度学习的影像样本数据的获取方法及装置，能够解决相关技术中样本数据获取的工作量大、效率低的问题。为了解决上述技术问题，本申请是这样实现的：第一方面，本申请实施例提供了...

【技术保护点】
1.一种基于深度学习的影像样本数据的获取方法，其特征在于，包括：/n将标注数据与所述标注数据对应的影像数据进行重叠，其中，在所述标注数据与所述影像数据的重叠区域，所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配；/n从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域；/n对所述可用区域进行瓦片栅格化，得到N个预定大小的瓦片，其中，N为大于1的整数；/n按照预定的验证数据比例，从N个所述瓦片中选取M个瓦片作为验证数据瓦片，其中，M为大于0的整数，且M<N；/n将所述可用区域的影像数据和标注数据进行瓦片裁剪，将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据，将裁剪出来的其它瓦片数据作为训练样本数据，其中，所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。/n

【技术特征摘要】
1.一种基于深度学习的影像样本数据的获取方法，其特征在于，包括：
将标注数据与所述标注数据对应的影像数据进行重叠，其中，在所述标注数据与所述影像数据的重叠区域，所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配；
从所述重叠区域中裁剪出最大的预定形状的区域作为可用区域；
对所述可用区域进行瓦片栅格化，得到N个预定大小的瓦片，其中，N为大于1的整数；
按照预定的验证数据比例，从N个所述瓦片中选取M个瓦片作为验证数据瓦片，其中，M为大于0的整数，且M<N；
将所述可用区域的影像数据和标注数据进行瓦片裁剪，将裁剪出来的与所述验证数据瓦片对应的瓦片数据作为验证样本数据，将裁剪出来的其它瓦片数据作为训练样本数据，其中，所述其它瓦片数据为裁剪出来的瓦片数据中除所述验证数据以外的瓦片数据。

2.根据权利要求1所述的方法，其特征在于，从N个所述瓦片中选取M个瓦片作为验证数据瓦片，包括：
从N个所述瓦片中随机选取M个所述瓦片作为验证数据瓦片。

3.根据权利要求1所述的方法，其特征在于，从N个所述瓦片中选取M个瓦片作为验证数据瓦片，包括：
采用空间均匀分布的方式，从N个所述瓦片中选取M个瓦片作为验证数据瓦片。

4.根据权利要求3所述的方法，其特征在于，采用空间均匀分布的方式，从N个所述瓦片中选取M个瓦片作为验证数据瓦片，包括：
若所述预定形状为矩形，则从所述可用区域的长度方向选取m个瓦片，从所述可用区域的宽度方向上选择h个瓦片，其中，M<＝w*h，且w/h～＝W/H，W为所述可用区域的长度方向上的瓦片的数量，H为所述可用区域的宽度方向上的瓦片的数量。

5.根据权利要求1至4任一项所述的方法，其特征在于，对所述可用区域进行瓦片栅格化，得到N个预定大小的瓦片，包括：
按照所述预定大小对所述可用区域进行瓦片栅格化，舍弃栅格化后小于所述预定大小的区域，得到N个所述预定大小的瓦片。

6.根据权利要求1至4任一项所述的方法，其特征在于，所述标注数据为一个单通道的图像，所述图像的每个像素的值用于指示影像像素的类别值。

7.一种基于深度学习的影像样本数据的获取装置，其特征在于，包括：
重叠模块，用于将标注数据与所述标注数据对应的影像数据进行重叠，其中，在所述标注数据与所述影像数据的重叠区域，所述标注数据的各个数据点与对齐的所述影像数据的数据点匹配；
第一裁剪模块，用于从所述...

【专利技术属性】
技术研发人员：吴鹏志，每春辉，
申请(专利权)人：西安泽塔云科技股份有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人