一种应用于图像旋转的图像保真的方法及装置制造方法及图纸

技术编号：19823827 阅读：20 留言：0更新日期：2018-12-19 15:26

本发明专利技术实施例公开了一种应用于图像旋转的图像保真的方法及装置，首先确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形，然后确定未知像素值区域，所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域，根据所述目标外接矩形与未知像素区域的位置关系，确定保真边界，最后根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。该方法及装置将旋转后引入的未知像素值区域截取在保真图像之外，获取保真样本图像，可继续用于扩充训练样本数量，丰富样本特征，提高深度学习算法模型的识别和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于图像旋转的图像保真的方法及装置
本专利技术涉及数据增强技术，更具体的说，是涉及一种应用于图像旋转的图像保真的方法及装置。
技术介绍
深度学习是机器学习中一种基于对数据进行表征学习的方法。目前，深度学习技术已经逐渐应用到各领域，在各行业发挥重要作用。将深度学习应用到OCR(OpticalCharacterRecognition，光学字符识别)领域，检测图像中的文字区域及识别文字内容，也是目前深度学习的一个应用方向。然而，由于没有大规模可用的文字检测识别数据集，且获取大量带标注的训练数据成本高，因此需要采用计算机视觉领域的数据增强技术对图像进行旋转、平移、缩放、加噪、模糊等几种操作及组合，生成大量样本，使得机器学习模型具备强大的识别和泛化能力。例如，图1示出了一张用于身份识别的文字样本经过数据增强生成七张训练图像，依次为原始图像、旋转图像、平移图像、放大图像、模糊图像、加噪图像、旋转模糊图像和旋转加噪图像。图像旋转是数据增强技术的关键部分，然而，现有技术中，图像旋转后通常会引入一些未知像素值，如图1(b)所示，图像旋转后重要信息区域(文本信息)外接矩形包含未知像素值，即黑色填充区域。这就导致旋转后的图像失真，影响深度学习模型的训练。目前图像旋转引入的未知像素值区域如何处理尚无很好的解决方案。
技术实现思路
有鉴于此，本专利技术提供了一种应用于图像旋转的图像保真的方法及装置，以克服现有技术中图像旋转引入未知像素值而导致的图像失真的问题。为实现上述目的，本专利技术提供如下技术方案：一种应用于图像旋转的图像保真的方法，包括：确定样本图像旋转后的关键信息区域的最...

【技术保护点】
1.一种应用于图像旋转的图像保真的方法，其特征在于，包括：确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形；确定未知像素值区域，所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域；根据所述目标外接矩形与所述未知像素区域的位置关系，确定保真边界；根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。

【技术特征摘要】
1.一种应用于图像旋转的图像保真的方法，其特征在于，包括：确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形；确定未知像素值区域，所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域；根据所述目标外接矩形与所述未知像素区域的位置关系，确定保真边界；根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。2.根据权利要求1所述的应用于图像旋转的图像保真的方法，其特征在于，所述根据所述目标外接矩形与未知像素区域的位置关系，确定保真边界，包括：判断所述目标外接矩形是否与所述未知像素区域重叠；根据所述目标外接矩形与所述未知像素区域的重叠情况，确定保真边界。3.根据权利要求2所述的应用于图像旋转的图像保真的方法，其特征在于，所述根据所述目标外接矩形与所述未知像素区域的重叠情况，确定保真边界，包括：在所述目标外接矩形与所述未知像素区域存在重叠时，确定最小外接矩形不与所述未知像素区域重叠的关键信息区域，并将所述最小外接矩形的边界确定为保真边界；在所述目标外接矩形与所述未知像素区域不存在重叠时，将所述目标外接矩形的边界确定为保真边界。4.根据权利要求2所述的应用于图像旋转的图像保真的方法，其特征在于，所述判断所述目标外接矩形是否与所述未知像素区域重叠，包括：判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠。5.根据权利要求4所述的应用于图像旋转的图像保真的方法，其特征在于，所述判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠，包括：当公式成立，判断所述目标外接矩形左侧与所述未知像素值区域存在重叠，其中Δw1为所述样本图像旋转前所述关键信息区域左边侧距离所述样本图像左边侧的垂直距离，α为旋转角度，x0'和x3'为旋转后所述关键信息区域左侧两个顶点的横坐标值；当公式成立，判断所述目标外接矩形右侧与所述未知像素值区域存在重叠，其中Δw2为所述样本图像旋转前所述关键信息区域右边侧距离所述样本图像右边侧的垂直距离，x1'和x2'为旋转后所述关键信息区域右侧两个顶点的横坐标值；当公式成立，判断所述目标外接矩形上侧与所述未知像素值区域存在重叠，其中Δh1为所述样本图像旋转前所述关键信息区域上边侧距离所述样本图像上边侧的垂直距离，y0'和y1'为旋转后所述关键信息区域上侧两个顶点的纵坐标值；当公式成立，判断所述目标外接矩形下侧与所述未知像素值区域存在重叠...

【专利技术属性】
技术研发人员：马文伟，王强，
申请(专利权)人：泰康保险集团股份有限公司，泰康在线财产保险股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人