一种文本方向聚类矫正的图像信息提取方法及系统技术方案

技术编号:31715720 阅读:19 留言:0更新日期:2022-01-01 11:20
本发明专利技术公开了一种文本方向聚类矫正的图像信息提取方法及系统,接收图像,利用文本检测算法DB在图像中找到文本信息,在文本信息的周围形成包围盒;在包围盒长边取法向量,根据法向量的方向进行包围盒聚类,并给出每类包围盒法向量的方向;检测每类包围盒法向量与竖直方向的第一夹角,当第一夹角大于第一预设值时,根据第一夹角分别旋转对应一类的包围盒;对包围盒内的文本方向进行识别,若文本方向倒立,则将图像旋转180度;识别提取包围盒中的文本信息,纠正识别有误的文本信息。将法向量角度在同一范围的文本聚类,将每一类分别统一旋转矫正,对文本矫正后更利于文字识别,解决传统的图像矫正方式无法同时矫正多个方向的文本的问题。本的问题。本的问题。

【技术实现步骤摘要】
一种文本方向聚类矫正的图像信息提取方法及系统


[0001]本专利技术涉及图像处理
,特别是一种文本方向聚类矫正的图像信息提取方法及系统。

技术介绍

[0002]文本在图像中的相对位置、倾斜角度等特征信息都会影响文字识别的精度,因此需要对得到的文本进行修正才能进行文字识别。已有的修正方法只考虑了所有文字旋转角度一致的情况。这种情况在政务材料中是比较普遍的,例如证件图像或扫描件,会因为拍摄角度或摆放方式等原因,使得证件在图像中产生变形、旋转等不同情况,此时就需要对局部图像进行旋转(广义上称为仿射变换)来适配文字识别模型。当遇到其他旋转角,或者多段文本资料旋转角度不一致的情况时,现有方法则无法进行同时文字矫正。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一,为此,本专利技术提供一种文本方向聚类矫正的图像信息提取方法及系统。
[0004]为了实现以上目的,本专利技术所采用的技术方案如下:
[0005]根据本专利技术的第一方面实施例,一种文本方向聚类矫正的图像信息提取方法,包括:S10本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本方向聚类矫正的图像信息提取方法,其特征在于,包括:S10、接收图像,利用文本检测算法DB在所述图像中找到文本信息,在每个所述文本信息的周围形成矩形的包围盒;S20、以包围盒的长边取法向量,根据所述法向量的方向进行包围盒聚类,并给出每类包围盒法向量的方向;S30、检测每类所述包围盒的法向量与竖直方向的第一夹角,当所述第一夹角大于第一预设值时,根据所述第一夹角分别旋转对应一类的所述包围盒;S40、对包围盒内的文本方向进行识别,若文本方向倒立,则将图像旋转180度;S50、识别提取包围盒中的文本信息,纠正识别有误的文本信息。2.根据权利要求1所述的一种文本方向聚类矫正的图像信息提取方法,其特征在于,所述步骤S10之前还包括步骤S1,所述步骤S1包括录入或删除关键排版和关键词信息。3.根据权利要求1所述的一种文本方向聚类矫正的图像信息提取方法,其特征在于:所述步骤S30中,所述第一夹角为同一类所有包围盒的法向量与竖直方向夹角的平均值。4.根据权利要求1所述的一种文本方向聚类矫正的图像信息提取方法,其特征在于,所述步骤S...

【专利技术属性】
技术研发人员:朱佳豪路橙梁沛森陈锦锋陈武聪钟建琛李文浩邓耀隆
申请(专利权)人:广东金赋科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1