一种修正文本检测边界框的方法、装置、设备及存储介质制造方法及图纸

技术编号:26033239 阅读:25 留言:0更新日期:2020-10-23 21:11
本发明专利技术公开了一种修正文本检测边界框的方法、装置、设备及存储介质,该方法包括:读取票据切片图像;票据切片图像为对票据图像进行文本检测得到边界框后,从票据图像上截取的仅包含该边界框内图像的切片图像;对票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;对二值化图像进行图像形态学的腐蚀操作,以横向合并二值化图像中包含的图像元素所属区域;图像元素包含字符及其他标记;对二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为票据切片图像包含的文本对应边界框。从而实现对文本检测结果的修正,得到范围较准确、包含文本较准确的边界框,进而提高票据图像中的文本识别正确率。

【技术实现步骤摘要】
一种修正文本检测边界框的方法、装置、设备及存储介质
本专利技术涉及计算机图像处理
,更具体地说,涉及一种修正文本检测边界框的方法、装置、设备及存储介质。
技术介绍
采用光学字符识别(OpticalCharacterRecognition,OCR)技术对票据图像中的文本进行识别前,需对票据图像中的文本进行检测并确定具体边界位置,但是现有技术实现具体边界位置确定时,定位到的文本边界框存在范围过大、包括非所需文本的问题,进而严重降低了票据图像中的文本识别正确率。
技术实现思路
本专利技术的目的是提供一种修正文本检测边界框的方法、装置、设备及存储介质,能够实现对文本检测结果的修正,得到范围较准确、包含文本较准确的边界框,进而提高票据图像中的文本识别正确率。为了实现上述目的,本专利技术提供如下技术方案:一种修正文本检测边界框的方法,包括:读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;对所述票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;对所述二值化图像进行图像形态学的腐蚀操作,以横向合并所述二值化图像中包含的图像元素所属区域;所述图像元素包含字符及其他标记;对所述二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为所述票据切片图像包含的文本对应边界框。优选的,对所述二值化图像进行外围轮廓检测之后,还包括:剔除对所述二值化图像进行外围轮廓检测得到的多个边界框中,面积小于面积阈值和/或长度小于长度阈值和/或宽度小于宽度阈值的边界框。优选的,对所述票据切片图像进行二值化操作,包括:将所述票据切片图像划分为多个图像块,计算每个所述图像块中的灰度均值,确定每个所述图像块中的灰度均值为该图像块的二值化阈值,并基于每个所述图像块的二值化阈值对该图像块进行二值化操作。优选的,对所述二值化图像进行图像形态学的腐蚀操作之前,还包括:对所述二值化图像进行图像形态学的膨胀操作。一种修正文本检测边界框的装置,包括:读取模块,用于:读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;二值化模块,用于:对所述票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;合并模块,用于:对所述二值化图像进行图像形态学的腐蚀操作,以横向合并所述二值化图像中包含的图像元素所属区域;所述图像元素包含字符及其他标记;检测模块,用于:对所述二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为所述票据切片图像包含的文本对应边界框。优选的,还包括:剔除模块,用于:对所述二值化图像进行外围轮廓检测之后,剔除对所述二值化图像进行外围轮廓检测得到的多个边界框中,面积小于面积阈值和/或长度小于长度阈值和/或宽度小于宽度阈值的边界框。优选的,所述二值化模块包括:二值化单元,用于:将所述票据切片图像划分为多个图像块,计算每个所述图像块中的灰度均值,确定每个所述图像块中的灰度均值为该图像块的二值化阈值,并基于每个所述图像块的二值化阈值对该图像块进行二值化操作。优选的,还包括:去噪模块,用于:对所述二值化图像进行图像形态学的腐蚀操作之前,对所述二值化图像进行图像形态学的膨胀操作。一种修正文本检测边界框的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上任一项所述修正文本检测边界框的方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述修正文本检测边界框的方法的步骤。本专利技术提供了一种修正文本检测边界框的方法、装置、设备及存储介质,该方法包括:读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;对所述票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;对所述二值化图像进行图像形态学的腐蚀操作,以横向合并所述二值化图像中包含的图像元素所属区域;所述图像元素包含字符及其他标记;对所述二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为所述票据切片图像包含的文本对应边界框。本申请公开的技术方案中,读取到按照对票据图像进行文本检测得到的边界框截取的票据切片图像后,对票据切片图像进行灰度化操作及二值化操作得到二值化图像,进而对二值化图像进行腐蚀操作以横向合并二值化图像中图像元素,最终对二值化图像检测外围轮廓检测,得到面积最大的一个边界框为票据切片图像包含文本的边界框;由于按照现有技术得到的票据切片图像中,如果包含非所需的文本的标记,通常所需的文本占用面积最大,因此本申请采用上述基于连通域的方案确定各个边界框,筛选面积最大的边界框为包含所需文本的边界框,从而实现对文本检测结果的修正,得到范围较准确、包含文本较准确的边界框,进而提高票据图像中的文本识别正确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种修正文本检测边界框的方法的流程图;图2为本专利技术实施例提供的一种修正文本检测边界框的装置的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,其示出了本专利技术实施例提供的一种修正文本检测边界框的方法的流程图,可以包括:S11:读取票据切片图像;票据切片图像为对票据图像进行文本检测得到边界框后,从票据图像上截取的仅包含该边界框内图像的切片图像。本专利技术实施例提供的一种修正文本检测边界框的方法的执行主体可以为对应的修正文本检测边界框的装置;本申请可以应用于金融行业的票据(发票、转账支票、进账单等)的文本识别,当然也可以应用于其他需要对票据进行文本识别的领域,均在本专利技术的保护范围之内。其中,票据图像即为对票据进行拍摄得到的彩色图像,对票据图像进行文本检测得到其包含的对应边界框后,仅截取票据图像中该边界框所包含的图像作为票据切片图像,进而基于本申请公开的技术方案对该票据切片图像进行修正。S12:对票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像。在读取到票据切片图像后,可以对票据切片图像进行灰度化本文档来自技高网...

【技术保护点】
1.一种修正文本检测边界框的方法,其特征在于,包括:/n读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;/n对所述票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;/n对所述二值化图像进行图像形态学的腐蚀操作,以横向合并所述二值化图像中包含的图像元素所属区域;所述图像元素包含字符及其他标记;/n对所述二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为所述票据切片图像包含的文本对应边界框。/n

【技术特征摘要】
1.一种修正文本检测边界框的方法,其特征在于,包括:
读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;
对所述票据切片图像依次进行灰度化操作及二值化操作,得到对应的二值化图像;
对所述二值化图像进行图像形态学的腐蚀操作,以横向合并所述二值化图像中包含的图像元素所属区域;所述图像元素包含字符及其他标记;
对所述二值化图像进行外围轮廓检测,得到至少一个边界框,并确定其中面积最大的边界框为所述票据切片图像包含的文本对应边界框。


2.根据权利要求1所述的方法,其特征在于,对所述二值化图像进行外围轮廓检测之后,还包括:
剔除对所述二值化图像进行外围轮廓检测得到的多个边界框中,面积小于面积阈值和/或长度小于长度阈值和/或宽度小于宽度阈值的边界框。


3.根据权利要求2所述的方法,其特征在于,对所述票据切片图像进行二值化操作,包括:
将所述票据切片图像划分为多个图像块,计算每个所述图像块中的灰度均值,确定每个所述图像块中的灰度均值为该图像块的二值化阈值,并基于每个所述图像块的二值化阈值对该图像块进行二值化操作。


4.根据权利要求3所述的方法,其特征在于,对所述二值化图像进行图像形态学的腐蚀操作之前,还包括:
对所述二值化图像进行图像形态学的膨胀操作。


5.一种修正文本检测边界框的装置,其特征在于,包括:
读取模块,用于:读取票据切片图像;所述票据切片图像为对票据图像进行文本检测得到边界框后,从所述票据图像上截取的仅包含该边界框内图像的切片图像;
二值化模块,用于:对所述票据切片...

【专利技术属性】
技术研发人员:谢文辉蔡凌玮张浩汪哲逸周期律常学亮刘杰李胤辉王翔陈亮邓方进
申请(专利权)人:重庆农村商业银行股份有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1