基于印章的弯曲文字识别方法、系统、设备及存储介质技术方案

技术编号:39293977 阅读:8 留言:0更新日期:2023-11-07 11:01
本发明专利技术提供了基于印章的弯曲文字识别方法、系统、设备及存储介质,该方法包括:输入具有印章图案的图片进行印章图案的图形识别,当印章图案的轮廓轨迹为矩形时,则基于文字识别算法对印章图案进行文本识别,获得印章图案中的文本信息,结束;当印章图案的轮廓轨迹为具有弧形边缘的封闭图案,则基于目标检测算法对图案进行字符分割,获得字符所在的局部图案;至少基于弯曲文本检测与识别算法对局部图案进行识别,获得局部图案中的文本信息。本发明专利技术能够直接识别弯曲和矩形框文本内容,减少文字矫正流程的同时减少因为文字矫正导致文字变形而引起的文本识别准确率下降的问题,提高文字识别精度。字识别精度。字识别精度。

【技术实现步骤摘要】
基于印章的弯曲文字识别方法、系统、设备及存储介质


[0001]本专利技术涉及文本识别领域,具体地说,涉及基于印章的弯曲文字识别方法、系统、设备及存储介质。

技术介绍

[0002]印章文字识别是智能文档处理的一部分,且多用于合同比对、发票报销审核、保险单审核等场景。印章文字识别主要有以下两步:一是首先使用目标检测方法检测出印章位置,二是通过OCR方法进行印章文字识别。目前利用OCR进行印章文字识别的策略主要有两种:
[0003](1)两阶段策略,即弯曲文字检测和弯曲文本识别。
[0004](2)一阶段策略,即端到端文字识别。
[0005]印章从形状上主要分为圆章、方章以及椭圆章。方章在利用目标检测方法后可以直接使用通用OCR进行印章文字识别。而圆章和椭圆章弯曲文本识别一直是难点所在。圆章和椭圆章上圆弧形环绕边缘的弯曲文本和普通字体共存,在识别上存在难度,尤其是对弯曲文本,无法精准识别。而且通常印章文字识别应用场景准确率及时间性能均要求较高。
[0006]目前,针对弯曲印章识别已经有很多方法。但是OCR进行印章识别部分在利用弯曲文本检测模型获取弯曲文本后均是利用文本矫正法将文本拉直,再利用文本识别模型对文本进行识别。但该方法强依赖于文本矫正方法,由于印章之间存在区别,利用该方法存在部分印章拉直效果不好以致后续文字识别效果较差。
[0007]因此,本专利技术提供了一种基于印章的弯曲文字识别方法、系统、设备及存储介质。

技术实现思路

[0008]针对现有技术中的问题,本专利技术的目的在于提供基于印章的弯曲文字识别方法、系统、设备及存储介质,克服了现有技术的困难,能够实现基于搜索数据的旅游市场热点分析,依托大量用户真实搜索数据,通过查询优化,自动获取旅游市场热点信息,进行时令趋势数据的准确预测。
[0009]本专利技术的实施例提供一种基于印章的弯曲文字识别方法,包括以下步骤:
[0010]S110、输入具有印章图案的图片进行所述印章图案的图形识别,当所述印章图案的轮廓轨迹为矩形时,则执行步骤S120,当所述印章图案的轮廓轨迹为具有弧形边缘的封闭图案,则执行步骤S130;
[0011]S120、基于文字识别算法对所述印章图案进行文本识别,获得所述印章图案中的文本信息,结束;
[0012]S130、基于目标检测算法对所述图案进行字符分割,获得字符所在的局部图案;以及
[0013]S140、至少基于弯曲文本检测与识别算法对所述局部图案进行识别,获得所述局部图案中的文本信息。
[0014]优选地,所述步骤S110中,包括:
[0015]S111、输入具有印章图案的图片,识别出所述印章图案,并对所述印章图案的轮廓进行图形识别;
[0016]S112、当所述印章图案的轮廓轨迹为矩形时,执行步骤S120;以及
[0017]S113、当所述印章图案的轮廓轨迹为具有弧形边缘的封闭图案,执行步骤S130。
[0018]优选地,所述步骤S120包括:采用OCR文字识别算法对所述图案进行识别,获得所述图案中的位置和文本信息,结束。
[0019]优选地,所述步骤S130包括:采用YOLO目标检测算法对所述图案进行识别,获得所述图案中的局部图案,对所述局部图案自所述图案中进行分割,获得文字所在的局部图案。
[0020]优选地,所述步骤S140包括:
[0021]S141、对所述局部图案进行图形识别,获得所述局部图案的轮廓轨迹;
[0022]S142、当所述局部图案的轮廓轨迹为矩形时,基于文字识别算法对所述图案进行识别,获得所述图案中的文本信息;以及
[0023]S143、当所述局部图案的轮廓轨迹为具有弧形边缘的封闭图案,基于文本检测与识别算法对所述局部图案进行检测与识别,获得所述图案中的文本信息,结束。
[0024]优选地,所述步骤S143包括:
[0025]S1431、利用弯曲文本检测模型通过神经网络直接对文本轮廓点的傅立叶变换进行建模,预测弯曲文本检转换为矩形文本后的轮廓点;
[0026]S1432、再使用傅立叶,求得最后的文本轮廓;以及
[0027]S1433、利用基于CRNN的文字识别模型进行文字识别。
[0028]优选地,所述步骤S143包括:
[0029]S1435、采集所述局部图案临近的所述封闭图案的局部弧形边缘,基于所述局部弧形边缘转换为直线边缘的拉伸形变关系,所述拉伸形变关系为所述局部弧形边缘图案的每个像素点通过形变拉伸转换为直线边缘图案中对应像素点的位置关系和映射关系;
[0030]S1436、对所述局部图案进行字符定位,获得每个字符所对应的扇形字符图案区域,所述字符所占的区域对应的圆心角与所述所对应的扇形字符图案区域对应的圆心角相等;
[0031]S1437、基于所述扇形字符图案区域获得的对应的弧线段落,至少基于所述弧线段落对应的局部弧形边缘的拉伸形变关系,将所述扇形字符图案区进行拉伸形变,获得矩形字符区域;
[0032]S1438、基于所述扇形字符图案区的排列顺序依次排列所述矩形字符区域,获得矩形文本区域;以及
[0033]S1439、对矩形文本区域进行文本识别,获得所述图案中的文本信息,结束。
[0034]本专利技术的实施例还提供一种基于印章的弯曲文字识别系统,用于实现上述的基于印章的弯曲文字识别方法,所述基于印章的弯曲文字识别系统包括:
[0035]印章图形识别模块,输入具有印章图案的图片进行所述印章图案的图形识别,当所述印章图案的轮廓轨迹为矩形时,则执行矩形文本识别模块,当所述印章图案的轮廓轨迹为具有弧形边缘的封闭图案,则执行弧形文本分割模块;
[0036]矩形文本识别模块,基于文字识别算法对所述印章图案进行文本识别,获得所述
印章图案中的文本信息,结束;
[0037]弧形文本分割模块,基于目标检测算法对所述图案进行字符分割,获得字符所在的局部图案;以及
[0038]弯曲文本识别模块,至少基于弯曲文本检测与识别算法对所述局部图案进行识别,获得所述局部图案中的文本信息。
[0039]本专利技术的实施例还提供一种基于印章的弯曲文字识别设备,包括:
[0040]处理器;
[0041]存储器,其中存储有所述处理器的可执行指令;
[0042]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于印章的弯曲文字识别方法的步骤。
[0043]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于印章的弯曲文字识别方法的步骤。
[0044]本专利技术的目的在于提供基于印章的弯曲文字识别方法、系统、设备及存储介质,能够实现基于搜索数据的旅游市场热点分析,依托大量用户真实搜索数据,通过查询优化,自动获取旅游市场热点信息,进行时令趋势数据的准确预测。
附图说明
[0045]通过阅读参照以下附图对非限制性实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于印章的弯曲文字识别方法,其特征在于,包括以下步骤:S110、输入具有印章图案的图片进行所述印章图案的图形识别,当所述印章图案的轮廓轨迹为矩形时,则执行步骤S120,当所述印章图案的轮廓轨迹为具有弧形边缘的封闭图案,则执行步骤S130;S120、基于文字识别算法对所述印章图案进行文本识别,获得所述印章图案中的文本信息,结束;S130、基于目标检测算法对所述图案进行字符分割,获得字符所在的局部图案;以及S140、至少基于弯曲文本检测与识别算法对所述局部图案进行识别,获得所述局部图案中的文本信息。2.如权利要求1所述的基于印章的弯曲文字识别方法,其特征在于,所述步骤S110中,包括:S111、输入具有印章图案的图片,识别出所述印章图案,并对所述印章图案的轮廓进行图形识别;S112、当所述印章图案的轮廓轨迹为矩形时,执行步骤S120;以及S113、当所述印章图案的轮廓轨迹为具有弧形边缘的封闭图案,执行步骤S130。3.如权利要求1所述的基于印章的弯曲文字识别方法,其特征在于,所述步骤S120包括:采用OCR文字识别算法对所述图案进行识别,获得所述图案中的位置和文本信息,结束。4.如权利要求1所述的基于印章的弯曲文字识别方法,其特征在于,所述步骤S130包括:采用YOLO目标检测算法对所述图案进行识别,获得所述图案中的局部图案,对所述局部图案自所述图案中进行分割,获得文字所在的局部图案。5.如权利要求1所述的基于印章的弯曲文字识别方法,其特征在于,所述步骤S140包括:S141、对所述局部图案进行图形识别,获得所述局部图案的轮廓轨迹;S142、当所述局部图案的轮廓轨迹为矩形时,基于文字识别算法对所述图案进行识别,获得所述图案中的文本信息;以及S143、当所述局部图案的轮廓轨迹为具有弧形边缘的封闭图案,基于文本检测与识别算法对所述局部图案进行检测与识别,获得所述图案中的文本信息,结束。6.如权利要求5所述的基于印章的弯曲文字识别方法,其特征在于,所述步骤S143包括:S1431、利用弯曲文本检测模型通过神经网络直接对文本轮廓点的傅立叶变换进行建模,预测弯曲文本检转换为矩形文本后的轮廓点;S1432、再使用傅立叶,求...

【专利技术属性】
技术研发人员:王嘉欣赵华鞠剑勋李健
申请(专利权)人:上海携旅信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1