【技术实现步骤摘要】
表格检测方法、装置、电子设备和存储介质
[0001]本专利技术实施例涉及图像识别领域,特别涉及表格检测方法、装置、电子设备和存储介质。
技术介绍
[0002]在目前日常的商业活动中,我们每天都运用了大量的文档和表格,而且表格文档也广泛地应用于各个领域,光学字符识别(Optical Character Recognition,OCR)表格分析在表单票据类、财务报表等文本图像上具有十分重要的作用。
[0003]而表格检测往往是进行表格分析的第一步,表格检测即定位出文本图像中的表格所在区域,在现有技术中,进行表格检测的主要方法是:通过待测图像,提取其中的表格线条元素,得到预处理表格线条图像,基于表格线条的交叉点获得目标表格线条图像,从而得到表格检测结果。
[0004]然而,在实际应用中,仅仅通过表格线条来确定表格检测信息,而忽略掉文本图像中的文字行的位置信息、行列关系会导致表格检测结果的准确度较低,不利于后续的表格分析。
技术实现思路
[0005]本申请实施例所要解决的技术问题是提出一种表格检测的方 ...
【技术保护点】
【技术特征摘要】
1.一种表格检测方法,其特征在于,包括以下步骤:将第一图像进行模型检测提取文本位置信息,生成检测结果;将所述检测结果进行二值化处理,生成二值图像;将所述二值图像与所述第一图像进行通道拼接,生成第二图像;将所述第二图像送入检测网络中进行检测,生成表格检测结果。2.根据权利要求1所述的表格检测方法,其特征在于,所述将第一图像进行模型检测提取文本位置信息,包括:所述模型包括预先获取的文字行检测模型;所述文本位置信息包括文字行的位置信息及行列关系信息。3.根据权利要求1所述的表格检测方法,其特征在于,所述生成检测结果,包括:所述检测结果为文字行检测的结果,提取第一图像中的文字行的位置信息及行列关系。4.根据权利要求1所述的表格检测方法,其特征在于,所述将所述检测结果进行二值化处理,生成二值图像,包括:所述二值化处理是根据所述检测结果的数据信息对二值化的阈值进行设定,其中所述数据信息为文字行的位置信息;所述检测结果根据所设定的所述阈值进行二值化,生成二值图像。5.根据权利要求1所述的表格检测方法,其特征在于,将所述二值图像与所述第一图像进行通道拼接,生成第二图像,包括:在包含RGB三个通道的所述第一图...
【专利技术属性】
技术研发人员:高大帅,武卫东,陈明,李健,
申请(专利权)人:北京捷通华声科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。