一种字符图像处理方法、装置、设备和介质制造方法及图纸

技术编号:26764548 阅读:23 留言:0更新日期:2020-12-18 23:40
本申请公开了一种字符图像处理方法、装置、设备和介质,涉及云计算技术领域。具体实现方案为:对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;根据校准后的字符区域信息,从所述目标图像中剔除字符。本申请实施例实现了对识别到的字符区域信息进行校准的效果,从而提高了字符区域信息的精准度,保证最终剔除字符的准确性。

【技术实现步骤摘要】
一种字符图像处理方法、装置、设备和介质
本申请实施例涉及图像处理
,具体涉及云计算技术,特别涉及一种字符图像处理方法、装置、设备和介质。
技术介绍
随着人工智能技术的不断进步,使用人工智能技术来进行影像文档智能分析的情况越来越频繁,例如对影像文档进行方向和歪斜矫正、进行布局分析以及进行内容识别等等。人工智能技术可以极大的方便工作人员对影像文档进行录入或审核,从而提升各类业务流程的处理效率,大大缩短了处理时间。
技术实现思路
本申请实施例公开一种字符图像处理方法、装置、设备和介质,以解决现有技术对字符区域信息识别的精准度较低的问题。根据本公开的一方面,提供了一种字符图像处理方法,所述方法包括:对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;根据校准后的字符区域信息,从所述目标图像中剔除字符。根据本公开的另一方面,提供了一种字符图像处理装置,所述装置包括:字符识别模块,用于对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;区域校准模块,用于根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;字符剔除模块,用于根据校准后的字符区域信息,从所述目标图像中剔除字符。根据本公开的另一方面,本申请实施例还公开了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例任一所述的字符图像处理方法。根据本公开的另一方面,本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例任一所述的字符图像处理方法。根据本申请的技术实现了对识别到的字符区域信息进行校准的效果,从而提高了字符区域信息的精准度,保证最终剔除字符的准确性。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。图1是根据本申请实施例公开的一种字符图像处理方法的流程图;图2A是根据本申请实施例公开的一种字符图像处理方法的流程图;图2B是根据本申请实施例公开的一种相关的字符图像处理场景的示意图;图2C是根据本申请实施例公开的一种字符图像处理场景的示意图;图3A是根据本申请实施例公开的一种字符图像处理方法的流程图;图3B是根据本申请实施例公开的一种字符图像处理的示意图;图3C是根据本申请实施例公开的一种字符图像处理场景的示意图;图4是根据本申请实施例公开的一种字符图像处理装置的结构示意图;图5是根据本申请实施例公开的一种电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。申请人在研发过程中发现,目前针对文档影像中表格的重建,通常是利用字符识别技术识别表格中的字符区域信息,再根据识别到的字符区域信息进行字符剔除,只保留表格线,从而完成表格的重建。然而现有的光学字符识别技术识别到的字符区域信息的精准度较低,存在识别到的字符区域信息过大,或者识别到的字符区域信息过小的问题。若识别到的字符区域信息过大,则当表格线与表格里字符的距离较近时,会把表格线也误识别到字符区域信息中,从而导致表格线也被剔除掉;而若识别到的字符区域信息过小,则字符区域信息无法全部覆盖字符图像,使得字符剔除不完整。总之,基于现有的字符识别技术进行字符剔除,以实现表格重建的效果不佳。图1是根据本申请实施例公开的一种字符图像处理方法的流程图,本实施例可以适用于剔除文档影像中的字符图像的情况。本实施例方法可以由字符图像处理装置来执行,所述装置可采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上。如图1所示,本实施例公开的字符图像处理方法可以包括:S101、对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息。其中,目标图像包括任意含有字符信息的文档图像或者视频帧图像等,目标图像的格式包括但不限于bmp格式、jpg格式或png格式等。在一种实施方式中,获取目标图像后,对目标图像进行图像预处理,包括但不限于图像降噪、图像增强、图像平滑或者图像二值化等。并利用现有的字符识别技术,包括但不限于OCR(OpticalCharacterRecognition,光学字符识别)技术,对预处理后的目标图像中的字符进行识别,得到目标图像中的字符区域信息和字符形态信息。其中,字符区域信息体现了各字符图像在目标图像中的区域位置,其包括但不限于以下两种可选的形式:1、字符图像外接矩形的四角点坐标。2、字符图像外接矩形的高度和宽度,以及字符图像外接矩形中心点分别距目标图像左边界/右边界和上边界/下边界的距离。字符形态信息则体现了字符图像的外观形态。通过对目标图像中的字符进行识别,得到目标图像中的字符区域信息和字符形态信息,实现了对字符图像的区域定位,且为后续进行字符区域信息的校准奠定了基础。S102、根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息。在一种实施方式中,根据识别到的目标图像中任一字符图像的字符形态信息,建立符合该字符图像的字符外观形态的纯净图像,在该纯净图像中包括该字符图像的所有字符像素点,而不包括不属于该字符图像的非字符像素点。进而将该纯净图像中的像素点与字符区域信息中包括的像素点进行匹配,若纯净图像中的任一像素点都能与字符区域信息中任一像素点匹配,则基于字符区域信息中匹配的像素点,得到校准后的字符区域信息;若纯净图像中的任一像素点无法与字符区域信息中的像素点匹配,则将字符区域信息进行扩大,得到校准后的字符区域信息。可选的,S102包括:根据所述字符形态信息,生成字符模板图像;根据所述字符区域信息,对所述字符模板图像与所述目标图像进行配准,并根据配准结果得到校准后的字符区域信息。在一种实施方式中,通过现有的文档编辑工具根据字符形态信息,生成字符模板图像。并采用经典配准算法,例如平均绝对差算法、误差平方和算法、归一化积算法以及序贯相似性检测算法等,将字符模板图像与目标图像中位于字符区域信息中的原始图像进行配准,若模板图像中的任一像素点都能与原始图像中任一像素点配准成功,则基于原始图像中配准成功本文档来自技高网...

【技术保护点】
1.一种字符图像处理方法,所述方法包括:/n对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;/n根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;/n根据校准后的字符区域信息,从所述目标图像中剔除字符。/n

【技术特征摘要】
1.一种字符图像处理方法,所述方法包括:
对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;
根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息;
根据校准后的字符区域信息,从所述目标图像中剔除字符。


2.根据权利要求1所述的方法,其中,所述根据所述字符形态信息,对所述字符区域信息进行校准得到校准后的字符区域信息,包括:
根据所述字符形态信息,生成字符模板图像;
根据所述字符区域信息,对所述字符模板图像与所述目标图像进行配准,并根据配准结果得到校准后的字符区域信息。


3.根据权利要求2所述的方法,其中,所述根据所述字符形态信息,生成字符模板图像,包括:
根据所述字符形态信息中的字符内容和字符字体,生成所述字符模板图像。


4.根据权利要求2所述的方法,其中,所述根据所述字符区域信息,对所述字符模板图像与所述目标图像进行配准,并根据配准结果得到校准后的字符区域信息,包括:
根据所述字符区域信息,对所述字符模板图像与所述目标图像进行配准,得到与所述字符模板图像中模板像素点关联的目标图像中目标像素点;
将所述目标像素点在所述目标图像中所处的区域信息,作为校准后的字符区域信息。


5.根据权利要求2或4任一所述的方法,其中,所述根据所述字符区域信息,对所述字符模板图像与所述目标图像进行配准,包括:
基于图像配准技术,确定所述字符模板图像中模板像素点与所述字符区域信息处的像素点之间映射关系;
若任一模板像素点配准失败,则扩大所述字符区域信息,且根据扩大后的字符区域信息继续进行配准。


6.根据权利要求5所述的方法,其中,扩大所述字符区域信息,包括:
根据所述字符区域信息在所述目标图像中的相对位置,扩大所述字符区域信息。


7.一种字符图像处理装置,所述装置包括:
字符识别模块,用于对目标图像中的字符进行识别,得到所述目标图像中的字符区域信息和字符形态信息;
区...

【专利技术属性】
技术研发人员:曲福
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1