数据扩增方法、装置、设备和计算机可读介质制造方法及图纸

技术编号:25951128 阅读:14 留言:0更新日期:2020-10-17 03:43
本发明专利技术公开了数据扩增方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:定位训练图像中的物品图像,并获知所述物品图像的长度和宽度;在所述训练图像中,基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,得到外扩图像;基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像;将所述分割图像作为训练模型的输入数据。该实施方式能够提高被训练模型的准确性。

【技术实现步骤摘要】
数据扩增方法、装置、设备和计算机可读介质
本专利技术涉及计算机
,尤其涉及一种数据扩增方法、装置、设备和计算机可读介质。
技术介绍
深度学习中训练模型需要大量的数据,而获取、标注数据是一个非常耗费人力和物力的工作。为了充分挖掘出数据的潜力,数据扩增就成为训练模型的重要手段。传统的图像数据扩增方法包括随机切块(crop)、旋转、调整亮度、饱和度、调整灰度直方图等。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:应用上述图像数据扩增方法影响训练模型的准确性。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据扩增方法、装置、设备和计算机可读介质,能够提高被训练模型的准确性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种数据扩增方法,包括:定位训练图像中的物品图像,并获知所述物品图像的长度和宽度;在所述训练图像中,基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,得到外扩图像;基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像;将所述分割图像作为训练模型的输入数据。所述基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像,包括:基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,构建分割矩形;在所述外扩图像中,以所述分割矩形覆盖所述物品图像,将所述分割矩形所在的区域,作为所述分割图像。所述基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,构建分割矩形,包括:将大于或等于所述物品图像的长度,且小于或等于所述外扩图像的长度的边长,作为所述分割矩形的长边;将大于或等于所述物品图像的宽度,且小于或等于所述外扩图像的宽度的边长,作为所述分割矩形的短边;由所述分割矩形的长边和所述分割矩形的短边,构建所述分割矩形。所述基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,包括:基于所述物品图像的长度,按照预设长度比例外扩所述物品图像的背景区域长度;基于所述物品图像的宽度,按照预设宽度比例外扩所述物品图像的背景区域宽度。所述预设长度比例与所述预设宽度比例相同。所述将所述分割图像作为训练模型的输入数据,包括:根据预设数学期望和预设标准差,生成符合高斯分布的预设角度;所述分割图像旋转所述预设角度后,作为训练模型的输入数据。所述长度和所述宽度,以所占用像素点衡量。根据本专利技术实施例的第二方面,提供了一种数据扩增装置,包括:定位模块,用于定位训练图像中的物品图像,并获知所述物品图像的长度和宽度;外扩模块,用于在所述训练图像中,基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,得到外扩图像;切分模块,用于基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像;输出模块,用于将所述分割图像作为训练模型的输入数据。根据本专利技术实施例的第三方面,提供了一种数据扩增电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。上述专利技术中的一个实施例具有如下优点或有益效果:因为定位训练图像中的物品图像,并获知物品图像的长度和宽度;在训练图像中,基于物品图像的长度外扩物品图像的背景区域长度,基于物品图像的宽度外扩物品图像的背景区域宽度,得到外扩图像;基于物品图像的长度,外扩图像的长度,物品图像的宽度,以及外扩图像的宽度,切分外扩图像得到分割图像;将分割图像作为训练模型的输入数据。由于分割图像所包括物品图像,与实际采集的物品图像一致,以分割图像作为训练模型的输入数据,能够提高被训练模型的准确性。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的数据扩增方法的主要流程的示意图;图2是根据本专利技术实施例的训练图像的示意图;图3是根据本专利技术实施例的外扩图像的示意图;图4是根据本专利技术实施例的另一个外扩图像的示意图;图5是根据本专利技术实施例的又一个外扩图像的示意图;图6是根据本专利技术实施例的分割图像的流程的示意图;图7是根据本专利技术实施例的分割图像的示意图;图8是根据本专利技术实施例的数据扩增装置的主要结构的示意图;图9是本专利技术实施例可以应用于其中的示例性系统架构图;图10是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在识别物品图像的过程中,为了提高训练模型识别物品的能力,可以利用预设模型去掉除物品之外的背景,仅保留物品的物品图像作为训练数据。一般保留物品的物品图像随机切块以扩增数据。随机切块会产生大量物品的局部图像,缺少物品的完整图像,进而导致物品视觉外观的表征特性出现偏差。以大量物品的局部图像训练模型,会影响训练模型识别物品的准确性。为了解决影响训练模型识别物品准确性的技术问题,可以采用以下本专利技术实施例中的技术方案。参见图1,图1是根据本专利技术实施例的数据扩增方法主要流程的示意图,在物品图像的基础上获得外扩图像,切分外扩图像得到分割图像。如图1所示,具体包括以下步骤:S101、定位训练图像中的物品图像,并获知物品图像的长度和宽度。训练图像中包括物品图像和背景。基于图像识别可以定位在训练图像中的物品图像。作为一个示例,图像识别具体可以包括:图像预处理、特征提取和图像识别。参见图2,图2是根据本专利技术实施例的训练图像的示意图。可以理解的是,训练图像中包括物品图像。也就是说,物品图像是训练图像的一部分,训练图像包括物品图像和背景。在训练图像中,定位物品图像进而获知物品图像的具体坐标。示例性的,可以根据物品图像最高点的纵坐标,以及物品图像最低点的纵坐标之间的差,获知物品图像的长度;根本文档来自技高网...

【技术保护点】
1.一种数据扩增方法,其特征在于,包括:/n定位训练图像中的物品图像,并获知所述物品图像的长度和宽度;/n在所述训练图像中,基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,得到外扩图像;/n基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像;/n将所述分割图像作为训练模型的输入数据。/n

【技术特征摘要】
1.一种数据扩增方法,其特征在于,包括:
定位训练图像中的物品图像,并获知所述物品图像的长度和宽度;
在所述训练图像中,基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,得到外扩图像;
基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像;
将所述分割图像作为训练模型的输入数据。


2.根据权利要求1所述数据扩增方法,其特征在于,所述基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,切分所述外扩图像得到分割图像,包括:
基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,构建分割矩形;
在所述外扩图像中,以所述分割矩形覆盖所述物品图像,将所述分割矩形所在的区域,作为所述分割图像。


3.根据权利要求2所述数据扩增方法,其特征在于,所述基于所述物品图像的长度,所述外扩图像的长度,所述物品图像的宽度,以及所述外扩图像的宽度,构建分割矩形,包括:
将大于或等于所述物品图像的长度,且小于或等于所述外扩图像的长度的边长,作为所述分割矩形的长边;
将大于或等于所述物品图像的宽度,且小于或等于所述外扩图像的宽度的边长,作为所述分割矩形的短边;
由所述分割矩形的长边和所述分割矩形的短边,构建所述分割矩形。


4.根据权利要求1所述数据扩增方法,其特征在于,所述基于所述物品图像的长度外扩所述物品图像的背景区域长度,基于所述物品图像的宽度外扩所述物品图像的背景区域宽度,包括:
基于所述物品图像的...

【专利技术属性】
技术研发人员:于伟王林芳梅涛
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1