文本图片下划线识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24855411 阅读:27 留言:0更新日期:2020-07-10 19:08
本发明专利技术涉及文本图片下划线识别方法、装置、计算机设备及存储介质,该方法包括获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;对中间结果进行拓展和信息获取,以得到下划线对应的关键信息;反馈下划线对应的关键信息,以进行文本内容识别。本发明专利技术实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。

【技术实现步骤摘要】
文本图片下划线识别方法、装置、计算机设备及存储介质
本专利技术涉及图片识别方法,更具体地说是指文本图片下划线识别方法、装置、计算机设备及存储介质。
技术介绍
随着信息技术的飞速发展,图片和视频数据量快速增长。对于海量图片或视频帧来说,根据画面中是否包含文本内容,可分类为文本图片和非文本图片。对于文本图片来讲,其包括的文本内容通常携带丰富的信息,是辅助理解和认知图片的重要信息来源,所以文本内容作为一个重要线索在诸如图片搜索、人机交互和盲人辅助系统等场景中被广泛挖掘和应用。对于有些带有关键信息标注的文本图片而言,在其进行文本内容识别的过程中,会涉及到将这些关键信息标注对应的文本内容进行单独提取,以减短文本内容识别所花费的时间,现有技术一般或者使用OPENCV识别出文本图片中的直线等标注,但是并没有根据实际场景对这些标注进行扩展识别和处理,导致后续文本内容识别的效率较低,而且采用现有技术识别的效率也不高,且准确率较低。因此,有必要设计一种新的方法,实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供文本图片下划线识别方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术采用以下技术方案:文本图片下划线识别方法,包括:获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;>对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;反馈下划线对应的关键信息,以进行文本内容识别。其进一步技术方案为:所述初始识别结果包括线段。其进一步技术方案为:所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果,包括:根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。其进一步技术方案为:所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果,包括:对所述初始过滤结果进行重复直线的去除,以得到单线结果;根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。其进一步技术方案为:所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息,包括:对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;对合并结果进行向左延伸,以得到延伸结果;根据所述延伸结果获取延伸结果上方的关键信息字段,以得到下划线对应的关键信息。其进一步技术方案为:所述对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果,包括:获取所述拓展结果中所有直线的像素坐标;筛选像素坐标满足两个纵坐标的差异值和两个横坐标的差异值均落在预设范围值内的所述拓展结果中的直线,并将筛选出来的直线进行合并,以得到合并结果。其进一步技术方案为:所述对合并结果进行向左延伸,以得到延伸结果,包括:获取所述合并结果中的直线对应的像素点;从所述像素点开始向左边进行搜索,并检测所述像素点上方的图块,以得到检测结果,并根据所述检测结果从像素点的最左端开始使用黑色像素块进行填充,以得到延伸结果。本专利技术还提供了文本图片下划线识别装置,包括:初始获取单元,用于获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;过滤单元,用于对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;去除单元,用于对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;拓展单元,用于对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;发送单元,用于反馈下划线对应的关键信息,以进行文本内容识别。本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。本专利技术与现有技术相比的有益效果是:本专利技术通过对使用OPENCV对文本图片的识别结果进行长度和范围的过滤后,再进行重复直线和印章范围内的直线的去除,并拓展直线、合并直线以及延伸直线至文本图片内的关键信息下方均有直线,并对下方有直线的图块进行关键信息的获取,反馈获取到的关键信息,以便于进行文本识别,实现针对性地对于文本图片进行关键信息的下划线标注的识别和处理,且可将处理结果使用在文本图片关键信息文字的解析上,既可以提高下划线标注的识别效率和准确度,也可以提高文字解析的效率。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的文本图片下划线识别方法的流程示意图;图2为本专利技术实施例提供的文本图片下划线识别方法的子流程示意图;图3为本专利技术实施例提供的文本图片下划线识别方法的子流程示意图;图4为本专利技术实施例提供的文本图片下划线识别方法的子流程示意图;图5为本专利技术实施例提供的文本图片下划线识别方法的子流程示意图;图6为本专利技术实施例提供的文本图片下划线识别装置的示意性框图;图7为本专利技术实施例提供的文本图片下划线识别装置的去除单元的示意性框图;图8为本专利技术实施例提供的文本图片下划线识别装置的拓展单元的示意性框图;图9为本专利技术实施例提供的文本图片下划线识别装置的合并子单元的示意性框图;图10为本专利技术实施例提供的文本图片下划线识别装置的延伸子单元的示意性框图;图11为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说本文档来自技高网...

【技术保护点】
1.文本图片下划线识别方法,其特征在于,包括:/n获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;/n对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;/n对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;/n对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;/n反馈下划线对应的关键信息,以进行文本内容识别。/n

【技术特征摘要】
1.文本图片下划线识别方法,其特征在于,包括:
获取使用OPENCV对文本图片的识别结果,以得到初始识别结果;
对初始识别结果进行长度和范围的过滤,以得到初始过滤结果;
对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果;
对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息;
反馈下划线对应的关键信息,以进行文本内容识别。


2.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述初始识别结果包括线段。


3.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对初始识别结果进行长度和范围的过滤,以得到初始过滤结果,包括:
根据设定的直线长度阈值以及设定的位置范围对初始识别结果进行过滤,过滤出长度在设定的直线长度阈值且在文本图片内的位置落入到设定的位置范围内的初始识别结果,以得到初始过滤结果。


4.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对初始过滤结果进行重复直线和印章直线的去除,以得到中间结果,包括:
对所述初始过滤结果进行重复直线的去除,以得到单线结果;
根据HSV色彩空间识别出并过滤单线结果内处于红色印章范围内的直线,以得到中间结果。


5.根据权利要求1所述的文本图片下划线识别方法,其特征在于,所述对所述中间结果进行拓展和信息获取,以得到下划线对应的关键信息,包括:
对所述中间结果进行直线拓展至可获取关键信息的程度,以得到拓展结果;
对所述拓展结果中处于同一关键信息下的直线进行合并,以得到合并结果;
对合并结果进行向左延伸,以得到延伸结果;
根据所述延伸结果获取延伸结果上方的关键信息字段,以得到...

【专利技术属性】
技术研发人员:郑泽重范有文谭江龙
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1