图像处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33769808 阅读:15 留言:0更新日期:2022-06-12 14:21
本申请实施例公开了一种图像处理方法、装置、电子设备及存储介质,涉及图像处理、文本识别等领域。该方法包括:将待检测图像输入至预先训练好的特征检测模型中,确定待检测图像对应的贝塞尔曲线的控制点;基于贝塞尔曲线的控制点确定待检测图像对应的曲线检测框;将曲线检测框所对应的图像区域转换为矩形图像区域;矩形图像区域进行文本识别,得到文本识别结果。采用上述技术方案,将基于曲线检测框确定的图像区域转换为矩形图像区域,再对该矩形图像区域进行文本识别,提高了对曲线文本的进行文本识别的准确率。文本识别的准确率。文本识别的准确率。

【技术实现步骤摘要】
图像处理方法、装置、电子设备及存储介质


[0001]本申请实施例涉及图像处理、文本识别领域,尤其涉及一种图像处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,企业的税务核算和内部报销需要处理大量的税务发票,交通票据和收据等等。对于这些票据,传统的人工处理方案是需要专门的财务人员一张一张地整理,工作量大而且容易出错。现有技术中,利用光学字符识别(Optical Character Recognition,简称OCR)技术可以定位票据图片文字区域并对文字内容进行识别,因此财务人员只需上传上传相应的票据照片,提高了处理速度。
[0003]但是,这些票据中往往存在着各种各样的印章,印章的形状多种多样,有正方形、圆形、椭圆形等等。对于圆形和椭圆形的印章,印章的字体为弯曲的文本,基于常规的识别方案无法准确识别这些文本。
[0004]因此,如何检测识别印章中的弯曲文字,成为目前亟需解决的问题。

技术实现思路

[0005]本申请实施例提供一种图像处理方法、装置、电子设备及存储介质,通过将基于曲线检测框确定的图像区域转换为矩形图像区域,再对该矩形图像区域进行文本识别,提高了对曲线文本的进行文本识别的准确率。
[0006]一方面,本申请实施例提供一种图像处理方法,该方法包括:
[0007]将待检测图像输入至预先训练好的特征检测模型中,确定上述待检测图像对应的贝塞尔曲线的控制点;
[0008]基于上述贝塞尔曲线的控制点确定上述待检测图像对应的曲线检测框;
[0009]将上述曲线检测框所对应的图像区域转换为矩形图像区域;
[0010]对上述矩形图像区域进行文本识别,得到文本识别结果。
[0011]一方面,本申请实施例提供了一种图像处理装置,该装置包括:
[0012]第一确定模块,用于将待检测图像输入至预先训练好的特征检测模型中,确定上述待检测图像对应的贝塞尔曲线的控制点;
[0013]第二确定模块,用于基于上述贝塞尔曲线的控制点确定上述待检测图像对应的曲线检测框;
[0014]转换模块,用于将上述曲线检测框所对应的图像区域转换为矩形图像区域;
[0015]识别模块,用于对上述矩形图像区域进行文本识别,得到文本识别结果。
[0016]在一种可行的实施例中,上述第一确定模块具体用于:
[0017]基于上述特征检测模型对上述待检测图像进行检测框的回归预测,得到上述待检测图像对应的贝塞尔曲线的控制点。
[0018]在一种可行的实施例中,上述第一确定模块具体用于:
[0019]基于上述特征检测模型对上述待检测图像进行特征提取,输出上述待检测图像对应的检测框控制点的偏移值,将上述偏移值作为上述待检测图像对应的贝塞尔曲线的控制点。
[0020]在一种可行的实施例中,上述转换模块具体用于:
[0021]利用上述曲线检测框对应的贝塞尔曲线的参数化表示,将上述曲线检测框对应的图像区域恒等映射为上述矩形图像区域。
[0022]在一种可行的实施例中,上述装置还包括:
[0023]预处理模块,用于在上述将待检测图像输入至预先训练好的特征检测模型中之前,对原始图像进行灰度化和二值化操作;
[0024]第三确定模块,用于利用灰度化和二值化后的上述原始图像的红色通道,确定上述待检测图像。
[0025]在一种可行的实施例中,上述特征检测模型是通过训练模块通过以下方式对神经网络模型训练得到的,该训练模块用于:
[0026]获取训练数据集;
[0027]基于上述训练数据集和上述神经网络模型对应的损失函数对上述神经网络模型进行迭代训练,直至上述损失函数收敛,将收敛时的神经网络模型作为上述特征检测模型。
[0028]在一种可行的实施例中,上述训练数据集中的每个训练样本包括样本图像、上述样本图像对应的检测框的标注点,上述训练模块具体用于:
[0029]上述基于上述训练数据集和上述神经网络模型对应的损失函数对上述神经网络模型进行迭代训练,直至上述损失函数收敛,包括:
[0030]基于上述样本图像对应的检测框的标注点确定上述样本图像对应的贝塞尔曲线的真实控制点;
[0031]将各上述样本图像输入至上述神经网络模型中,预测得到每个样本图像对应的贝塞尔曲线的预测控制点;
[0032]基于各上述样本图像对应的贝塞尔曲线的真实控制点和预测控制点,计算上述损失函数的损失值;
[0033]基于上述训练数据集和上述损失值对上述神经网络模型进行迭代训练,直至上述总损失函数收敛。
[0034]一方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,该处理器和存储器相互连接;
[0035]上述存储器用于存储计算机程序;
[0036]上述处理器被配置用于在调用上述计算机程序时,执行上述图像处理方法的任一可选实施方式所提供的方法。
[0037]一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行以实现上述图像处理方法的任一种可能的实施方式所提供的方法。
[0038]一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该
计算机设备执行图像处理方法的任一种可能的实施方式所提供的方法。
[0039]本申请实施例所提供的方案的有益效果在于:
[0040]本申请实施例中,本申请实施例所提供的图像处理方法、装置、电子设备及存储介质,在对待检测图像进行文本识别时,将该待检测图像输入至预先训练好的特征检测模型中,基于该特征检测模型确定出待检测图像对应的贝塞尔曲线的控制点,基于贝塞尔曲线的控制点确定待检测图像对应的曲线检测框,将曲线检测框所对应的图像区域转换为矩形图像区域,对矩形图像区域进行文本识别,得到文本识别结果。采用上述技术方案,由于在对待检测图像进行检测时,采用的是适配于该待检测图像的曲线检测框,提高了文本采集的准确度,然后将曲线检测框确定的图像区域转换为矩形图像区域,再对该矩形图像区域进行文本识别,提高了对曲线文本的进行文本识别的准确率。
附图说明
[0041]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1是本申请实施例所适用的一种图像处理系统的结构示意图;
[0043]图2是本申请实施例提供的一种可选的图像处理方法的流程示意图;
[0044]图3是本申请实施例提供的另一种可选的图像处理方法的流程示意图;
[0045]图4是本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:将待检测图像输入至预先训练好的特征检测模型中,确定所述待检测图像对应的贝塞尔曲线的控制点;基于所述贝塞尔曲线的控制点确定所述待检测图像对应的曲线检测框;将所述曲线检测框所对应的图像区域转换为矩形图像区域;对所述矩形图像区域进行文本识别,得到文本识别结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述待检测图像对应的贝塞尔曲线的控制点,包括:基于所述特征检测模型对所述待检测图像进行检测框的回归预测,得到所述待检测图像对应的贝塞尔曲线的控制点。3.根据权利要求2所述的方法,其特征在于,所述基于所述特征检测模型对所述待检测图像进行检测框的回归预测,得到所述待检测图像对应的贝塞尔曲线的控制点,包括:基于所述特征检测模型对所述待检测图像进行特征提取,输出所述待检测图像对应的检测框控制点的偏移值,将所述偏移值作为所述待检测图像对应的贝塞尔曲线的控制点。4.根据权利要求1所述的方法,其特征在于,所述将所述曲线检测框所对应的图像区域转换为矩形图像区域,包括:利用所述曲线检测框对应的贝塞尔曲线的参数化表示,将所述曲线检测框对应的图像区域恒等映射为所述矩形图像区域。5.根据权利要求1所述的方法,其特征在于,在所述将待检测图像输入至预先训练好的特征检测模型中之前,所述方法还包括:对原始图像进行灰度化和二值化操作;利用灰度化和二值化后的所述原始图像的红色通道,确定所述待检测图像。6.根据权利要求1至5任一项所述的方法,其特征在于,所述特征检测模型是通过以下方式对神经网络模型训练得到的:获取训练数据集;基于所述训练数据集和所述神经网络模型对应的损失函数对所述...

【专利技术属性】
技术研发人员:杨爱东孙兴星叶晓舟欧阳晔
申请(专利权)人:亚信科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1