一种应用于图像旋转的图像保真的方法及装置制造方法及图纸

技术编号:19823827 阅读:20 留言:0更新日期:2018-12-19 15:26
本发明专利技术实施例公开了一种应用于图像旋转的图像保真的方法及装置,首先确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形,然后确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域,根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,最后根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。该方法及装置将旋转后引入的未知像素值区域截取在保真图像之外,获取保真样本图像,可继续用于扩充训练样本数量,丰富样本特征,提高深度学习算法模型的识别和泛化能力。

【技术实现步骤摘要】
一种应用于图像旋转的图像保真的方法及装置
本专利技术涉及数据增强技术,更具体的说,是涉及一种应用于图像旋转的图像保真的方法及装置。
技术介绍
深度学习是机器学习中一种基于对数据进行表征学习的方法。目前,深度学习技术已经逐渐应用到各领域,在各行业发挥重要作用。将深度学习应用到OCR(OpticalCharacterRecognition,光学字符识别)领域,检测图像中的文字区域及识别文字内容,也是目前深度学习的一个应用方向。然而,由于没有大规模可用的文字检测识别数据集,且获取大量带标注的训练数据成本高,因此需要采用计算机视觉领域的数据增强技术对图像进行旋转、平移、缩放、加噪、模糊等几种操作及组合,生成大量样本,使得机器学习模型具备强大的识别和泛化能力。例如,图1示出了一张用于身份识别的文字样本经过数据增强生成七张训练图像,依次为原始图像、旋转图像、平移图像、放大图像、模糊图像、加噪图像、旋转模糊图像和旋转加噪图像。图像旋转是数据增强技术的关键部分,然而,现有技术中,图像旋转后通常会引入一些未知像素值,如图1(b)所示,图像旋转后重要信息区域(文本信息)外接矩形包含未知像素值,即黑色填充区域。这就导致旋转后的图像失真,影响深度学习模型的训练。目前图像旋转引入的未知像素值区域如何处理尚无很好的解决方案。
技术实现思路
有鉴于此,本专利技术提供了一种应用于图像旋转的图像保真的方法及装置,以克服现有技术中图像旋转引入未知像素值而导致的图像失真的问题。为实现上述目的,本专利技术提供如下技术方案:一种应用于图像旋转的图像保真的方法,包括:确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形;确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域;根据所述目标外接矩形与所述未知像素区域的位置关系,确定保真边界;根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。可选的,所述根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,包括:判断所述目标外接矩形是否与所述未知像素区域重叠;根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界。可选的,所述根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界,包括:在所述目标外接矩形与所述未知像素区域存在重叠时,确定最小外接矩形不与所述未知像素区域重叠的关键信息区域,并将所述最小外接矩形的边界确定为保真边界;在所述目标外接矩形与所述未知像素区域不存在重叠时,将所述目标外接矩形的边界确定为保真边界。可选的,所述判断所述目标外接矩形是否与所述未知像素区域重叠,包括:判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠。可选的,所述判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠,包括:当公式成立,判断所述目标外接矩形左侧与所述未知像素值区域存在重叠,其中Δw1为所述样本图像旋转前所述关键信息区域左边侧距离所述样本图像左边侧的垂直距离,α为旋转角度,x0'和x3'为旋转后所述关键信息区域左侧两个顶点的横坐标值;当公式成立,判断所述目标外接矩形右侧与所述未知像素值区域存在重叠,其中Δw2为所述样本图像旋转前所述关键信息区域右边侧距离所述样本图像右边侧的垂直距离,x1'和x2'为旋转后所述关键信息区域右侧两个顶点的横坐标值;当公式成立,判断所述目标外接矩形上侧与所述未知像素值区域存在重叠,其中Δh1为所述样本图像旋转前所述关键信息区域上边侧距离所述样本图像上边侧的垂直距离,y0'和y1'为旋转后所述关键信息区域上侧两个顶点的纵坐标值;当公式成立,判断所述目标外接矩形下侧与所述未知像素值区域存在重叠,其中Δh2为所述样本图像旋转前所述关键信息区域下边侧距离所述样本图像下边侧的垂直距离,y2'和y3'为旋转后所述关键信息区域下侧两个顶点的纵坐标值。可选的,所述根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,包括:当所述目标外接矩形在左侧与所述未知像素值区域存在重叠时,采用公式确定左侧的保真边界,当所述目标外接矩形在左侧与所述未知像素值区域不存在重叠时,采用公式确定左侧的保真边界,其中lef为所述样本图像在旋转后左侧的保真边界;当所述目标外接矩形在右侧与所述未知像素值区域存在重叠时,采用公式确定右侧的保真边界,当所述目标外接矩形在右侧与所述未知像素值区域不存在重叠时,采用公式确定右侧的保真边界,其中rig为所述样本图像在旋转后右侧的保真边界。可选的,所述根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,,包括:当所述目标外接矩形在上侧与所述未知像素值区域存在重叠时,采用公式确定上侧的保真边界,当所述目标外接矩形在上侧与所述未知像素值区域不存在重叠时,采用公式确定上侧的保真边界,其中top为所述样本图像在旋转后上侧的保真边界;当所述目标外接矩形在下侧与所述未知像素值区域存在重叠时,采用公式确定下侧的保真边界,当所述目标外接矩形在下侧与所述未知像素值区域不存在重叠时,采用公式确定下侧的保真边界,其中bot为所述样本图像在旋转后下侧的保真边界。一种应用于图像旋转的图像保真的装置,包括:矩形确定模块,用于确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形;未知区域确定模块,用于确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域;边界确定模块,用于根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界;图像截取模块,用于根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一种所述的应用于图像旋转的图像保真的方法。一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任一种所述的应用于图像旋转的图像保真的方法。经由上述的技术方案可知,与现有技术相比,本专利技术实施例公开了一种应用于图像旋转的图像保真的方法及装置,首先确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形,然后确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域,根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,最后根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。该方法及装置将旋转后引入的未知像素值区域截取在保真图像之外,获取保真样本图像,可继续用于扩充训练样本数量,丰富样本特征,提高深度学习算法模型的识别和泛化能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例公开的原始图像样本及其训练图像;图2为本专利技术实施例公开的应用于图像旋转的图像保真的方法流程图;图3为本专利技术实施例公开的关键信息区域示意图;图4为本专利技术实施例公开的旋转坐标示意图本文档来自技高网...

【技术保护点】
1.一种应用于图像旋转的图像保真的方法,其特征在于,包括:确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形;确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域;根据所述目标外接矩形与所述未知像素区域的位置关系,确定保真边界;根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。

【技术特征摘要】
1.一种应用于图像旋转的图像保真的方法,其特征在于,包括:确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形;确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域;根据所述目标外接矩形与所述未知像素区域的位置关系,确定保真边界;根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。2.根据权利要求1所述的应用于图像旋转的图像保真的方法,其特征在于,所述根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,包括:判断所述目标外接矩形是否与所述未知像素区域重叠;根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界。3.根据权利要求2所述的应用于图像旋转的图像保真的方法,其特征在于,所述根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界,包括:在所述目标外接矩形与所述未知像素区域存在重叠时,确定最小外接矩形不与所述未知像素区域重叠的关键信息区域,并将所述最小外接矩形的边界确定为保真边界;在所述目标外接矩形与所述未知像素区域不存在重叠时,将所述目标外接矩形的边界确定为保真边界。4.根据权利要求2所述的应用于图像旋转的图像保真的方法,其特征在于,所述判断所述目标外接矩形是否与所述未知像素区域重叠,包括:判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠。5.根据权利要求4所述的应用于图像旋转的图像保真的方法,其特征在于,所述判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠,包括:当公式成立,判断所述目标外接矩形左侧与所述未知像素值区域存在重叠,其中Δw1为所述样本图像旋转前所述关键信息区域左边侧距离所述样本图像左边侧的垂直距离,α为旋转角度,x0'和x3'为旋转后所述关键信息区域左侧两个顶点的横坐标值;当公式成立,判断所述目标外接矩形右侧与所述未知像素值区域存在重叠,其中Δw2为所述样本图像旋转前所述关键信息区域右边侧距离所述样本图像右边侧的垂直距离,x1'和x2'为旋转后所述关键信息区域右侧两个顶点的横坐标值;当公式成立,判断所述目标外接矩形上侧与所述未知像素值区域存在重叠,其中Δh1为所述样本图像旋转前所述关键信息区域上边侧距离所述样本图像上边侧的垂直距离,y0'和y1'为旋转后所述关键信息区域上侧两个顶点的纵坐标值;当公式成立,判断所述目标外接矩形下侧与所述未知像素值区域存在重叠...

【专利技术属性】
技术研发人员:马文伟王强
申请(专利权)人:泰康保险集团股份有限公司泰康在线财产保险股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1