圆章弯曲文本识别方法、装置、系统与可读存储介质制造方法及图纸

技术编号:37423763 阅读:16 留言:0更新日期:2023-04-30 09:45
本发明专利技术公开了一种圆章弯曲文本识别方法、装置、系统和可读存储介质,该方法包括:获取圆章弯曲文本图像,通过文本检测模型对圆章弯曲文本图像进行检测,得到文本字符框坐标和字符串区域坐标;根据文本字符框坐标和字符串区域坐标,对圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图;根据单字符正序拼接子图和单字符逆序拼接子图,识别出圆章弯曲文本图像中的文本内容。本发明专利技术对圆章弯曲文本图像进行检测,从字符级别切入,同时利用字符串区域特性进行圆章弯曲文本识别,提高了圆章弯曲文本识别的准确率。率。率。

【技术实现步骤摘要】
圆章弯曲文本识别方法、装置、系统与可读存储介质


[0001]本专利技术涉及图像识别
,尤其涉及圆章弯曲文本识别方法、装置、系统与可读存储介质。

技术介绍

[0002]文字作为人类信息传播的载体,其中蕴含着丰富语义信息。在日常的文件中通常会存在印章文本,而印章文本大多数都为圆章弯曲文本,在日常生活中时常需要对文本进行识别,常见的OCR(光学字符识别)针对的是水平文本,并不能识别圆章弯曲文本,并且现有识别弯曲文本的方法普遍存在识别准确率不高的问题。因此,如何提高圆章弯曲文本识别的准确率,是急需解决的问题。

技术实现思路

[0003]本专利技术的主要目的在于提出一种圆章弯曲文本识别方法、装置、系统与可读存储介质,旨在解决如何提高圆章弯曲文本识别的准确率的问题。
[0004]为实现上述目的,本专利技术提供一种圆章弯曲文本识别方法,所述圆章弯曲文本识别方法包括如下步骤:
[0005]获取圆章弯曲文本图像,通过文本检测模型对所述圆章弯曲文本图像进行多粒度检测,得到文本字符框坐标和字符串区域坐标;
[0006]根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图;
[0007]根据所述单字符正序拼接子图和所述单字符逆序拼接子图,识别出所述圆章弯曲文本图像中的文本内容。
[0008]可选地,根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图的步骤包括:
[0009]根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符对应的字符框判断所属的字符串区域,对字符框进行归类分组;
[0010]根据所述字符框的分组,对同一组中的每个字符框进行排序,并对所述同一组内每个单字符的方向进行矫正和截图,得到目标单字符图组;
[0011]对所述目标单字符图组中的每个单字符进行缩放,正序拼接得到单字符正序拼接子图,逆序拼接得到单字符逆序拼接子图。
[0012]可选地,根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符对应的字符框判断所属的字符串区域,对字符框进行归类分组的步骤包括:
[0013]根据所述字符串区域坐标确定所述字符串区域在所述圆章弯曲文本图像中位置区域,并根据所述文本字符框坐标确定每个单字符对应的字符框对应的中心点坐标;
[0014]根据所述位置区域和所述中心点坐标,确定所述圆章弯曲文本图像中的每个单字符对应的字符框所属的字符串区域,对每个字符框进行归类分组。
[0015]可选地,根据所述字符框的分组,对同一组中的每个字符框进行排序的步骤包括:
[0016]根据所述字符框的分组对应的字符串区域坐标确定所述字符串区域对应的圆心坐标,并根据所述字符串区域中每个文本字符框坐标确定每个字符框对应的中心点坐标;
[0017]根据所述圆心坐标和所述中心点坐标,确定所述字符串区域中的每个字符框对应的中心点与所述字符串区域对应的圆心之间的夹角,并根据所述夹角,对所述字符串区域中的每个字符框进行排序。
[0018]可选地,对同一组内每个单字符的方向进行矫正和截图,得到目标单字符图组步骤包括:
[0019]根据所述字符框的分组对应的字符串区域坐标确定所述字符串区域对应的圆心坐标,并根据所述文本字符框坐标和所述圆心坐标,确定圆心到字符框的各边的距离;
[0020]根据所述圆心到所述字符框各边的距离,确定最大距离,并根据所述最大距离对所述文本字符框坐标中包含的字符框各顶点的坐标的排序进行更新,以矫正每个单字符的方向;
[0021]根据更新后的文本字符框坐标对所述同一分组字符框中的每个单字符进行截图得到单字符图片,并旋转所述单字符图片为正,得到目标单字符图组。
[0022]可选地,对所述目标单字符图组中的每个单字符进行缩放的步骤包括:
[0023]根据更新后的文本字符框坐标,计算出所述目标单字符图组中所有单字符的宽度平均值和高度平均值,并根据更新后的文本字符框坐标,计算出每个单字符各边的长度;
[0024]根据所述宽度平均值、所述高度平均值和每个单字符各边的长度,对所述目标单字符图组中的每个单字符进行缩放。
[0025]可选地,根据所述单字符正序拼接子图和所述单字符逆序拼接子图,识别出所述圆章弯曲文本图像中的文本内容的步骤包括:
[0026]分别将所述单字符正序拼接子图和所述单字符逆序拼接子图输入文字识别模型,通过所述文字识别模型分别计算出所述单字符正序拼接子图和所述单字符逆序拼接子图的置信度;
[0027]将所述单字符正序拼接子图的置信度和所述单字符逆序拼接子图的置信度进行对比,得到对比结果,并根据所述对比结果确定识别所述单字符正序拼接子图或所述单字符逆序拼接子图中的文本内容作为所述圆章弯曲文本图像中的文本内容。
[0028]此外,为实现上述目的,本专利技术还提供一种圆章弯曲文本识别装置,所述圆章弯曲文本识别装置包括:
[0029]获取模块,用于获取圆章弯曲文本图像,通过文本检测模型对所述圆章弯曲文本图像进行多粒度检测,得到文本字符框坐标和字符串区域坐标;
[0030]处理模块,用于根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图;
[0031]识别模块,用于根据所述单字符正序拼接子图和所述单字符逆序拼接子图,识别出所述圆章弯曲文本图像中的文本内容。
[0032]优选地,所述处理模块还用于:
[0033]根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符对应的字符框判断所属的字符串区域,对字符框进行归类分组;
[0034]根据所述字符框的分组,对同一组中的每个字符框进行排序,并对所述同一组内每个单字符的方向进行矫正和截图,得到目标单字符图组;
[0035]对所述目标单字符图组中的每个单字符进行缩放,正序拼接得到单字符正序拼接子图,逆序拼接得到单字符逆序拼接子图。
[0036]优选地,所述处理模块还用于:
[0037]根据所述字符串区域坐标确定所述字符串区域在所述圆章弯曲文本图像中位置区域,并根据所述文本字符框坐标确定每个单字符对应的字符框对应的中心点坐标;
[0038]根据所述位置区域和所述中心点坐标,确定所述圆章弯曲文本图像中的每个单字符对应的字符框所属的字符串区域,对每个字符框进行归类分组。
[0039]优选地,所述处理模块还用于:
[0040]根据所述字符框的分组对应的字符串区域坐标确定所述字符串区域对应的圆心坐标,并根据所述字符串区域中每个文本字符框坐标确定每个字符框对应的中心点坐标;
[0041]根据所述圆心坐标和所述中心点坐标,确定所述字符串区域中的每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种圆章弯曲文本识别方法,其特征在于,所述圆章弯曲文本识别方法包括如下步骤:获取圆章弯曲文本图像,通过文本检测模型对所述圆章弯曲文本图像进行多粒度检测,得到文本字符框坐标和字符串区域坐标;根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图;根据所述单字符正序拼接子图和所述单字符逆序拼接子图,识别出所述圆章弯曲文本图像中的文本内容。2.如权利要求1所述的圆章弯曲文本识别方法,其特征在于,所述根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符进行处理,得到单字符正序拼接子图和单字符逆序拼接子图的步骤包括:根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符对应的字符框判断所属的字符串区域,对字符框进行归类分组;根据所述字符框的分组,对同一组中的每个字符框进行排序,并对所述同一组内每个单字符的方向进行矫正和截图,得到目标单字符图组;对所述目标单字符图组中的每个单字符进行缩放,正序拼接得到单字符正序拼接子图,逆序拼接得到单字符逆序拼接子图。3.如权利要求2所述的圆章弯曲文本识别方法,其特征在于,所述根据所述文本字符框坐标和所述字符串区域坐标,对所述圆章弯曲文本图像中的每个单字符对应的字符框判断所属的字符串区域,对字符框进行归类分组的步骤包括:根据所述字符串区域坐标确定所述字符串区域在所述圆章弯曲文本图像中位置区域,并根据所述文本字符框坐标确定每个单字符对应的字符框对应的中心点坐标;根据所述位置区域和所述中心点坐标,确定所述圆章弯曲文本图像中的每个单字符对应的字符框所属的字符串区域,对每个字符框进行归类分组。4.如权利要求2中所述的圆章弯曲文本识别方法,其特征在于,根据所述字符框的分组,对同一组中的每个字符框进行排序的步骤包括:根据所述字符框的分组对应的字符串区域坐标确定所述字符串区域对应的圆心坐标,并根据所述字符串区域中每个文本字符框坐标确定每个字符框对应的中心点坐标;根据所述圆心坐标和所述中心点坐标,确定所述字符串区域中的每个字符框对应的中心点与所述字符串区域对应的圆心之间的夹角,并根据所述夹角,对所述字符串区域中的每个字符框进行排序。5.如权利要求2所述的圆章弯曲文本识别方法,其特征在于,所述对同一组内每个单字符的方向进行矫正和截图,得到目标单字符图组的步骤包括:根据所述字符框的分组对应的字符串区域坐标确定所述字符串区域对应的圆心坐标,并根据所述文本字符框坐标...

【专利技术属性】
技术研发人员:伍蹈廖明陈洁彦钱学成
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1