【技术实现步骤摘要】
表格图像文字智能识别方法、装置及存储介质
[0001]本专利技术涉及表格图片文字识别
,具体涉及表格图像文字智能识别方法、装置及存储介质。
技术介绍
[0002]尽管电子支付、电子票据等发展日益增多,但对于许多公司来说,对于进货出库等流程仍会使用纸质表单,而这些纸质表单一般都是以照片的方式归档入库存储,有些还会对图片进行扫描入库,对于表单内的内容,由于表单中包含的数据较为简单,一般采用OCR自动识别方法,但是如果直接对整张单据图片进行识别,这种识别方法会识别出表单中所有的文字信息和表格信息,同时表格中的列字段和对应的值较难对齐。这是因为拍取的表单图片可能不是水平放置的,内容可能发生旋转,表格内的文本可能会倾斜,给后续OCR识别造成困难。现有的方法中对图片方向进行矫正的方法有识别图像中文字行构成的水平线,计算此线和水平线的夹角,将整个图像逆向旋转此夹角实现文本内容的水平矫正。而这个旋转角度一般是根据水平线的平均值进行确定的,而平均值容易受极值和分布影响,可能会导致最终效果较差。
[0003]另外,这种方法一般针对 ...
【技术保护点】
【技术特征摘要】
1.表格图像文字智能识别方法,其特征在于,包括以下步骤:S1、获取待处理的出库单表格图片;对待处理的出库单表格图片进行裁剪,得到出库单图片;S2、调整出库单图片的放置方向,得到待识别出库单图片;S3、对待识别出库单图片进行直线检测,得到待识别出库单图片中所有直线段;对直线段进行第一分类,得到第一直线集,分别计算第一直线集中各直线段的斜率,统计斜率的众数,计算众数对应的角度值,将待识别出库单图片旋转所述角度值的负值;得到待识别表格图片;S4、对待识别表格图片进行直线检测,得到待识别表格图片中的所有直线段,计算待识别表格图片中的所有直线段的倾斜度,根据倾斜度对所有直线段进行第二分类,得到第二水平直线集和垂直直线集,分别对第二水平直线集和垂直直线集中的直线段进行筛选合并,得到表格的截取框;S5、根据表格的截取框从待识别表格图片中截取出表格图片;对表格图片进行OCR识别,得到识别结果。2.根据权利要求1所述的表格图像文字智能识别方法,其特征在于,所述待处理的出库单表格图片为以纯色背景拍摄的含有单据表格的图片,裁剪的具体过程包括:对待处理的出库单表格图片进行边缘检测,从待处理的出库单表格图片中裁剪出只含有单据边框的出库单图片。3.根据权利要求1所述的表格图像文字智能识别方法,其特征在于,步骤S2的具体过程为:S21、根据出库单图片的宽高比判断出库单图片的放置方向,若出库单图片为纵向放置,则将出库单图片调整为横向放置;S22、对横向放置的出库单图片进行OCR识别,判断是否能识别出关键词,若未识别到,则对横向放置的出库单图片进行上下翻转,得到向上横向放置的出库单图片;S23、将向上横向放置的出库单图片灰度化,得到灰度化出库单图片;S24、对灰度化出库单图片的边缘进行裁剪,得到待识别出库单图片。4.根据权利要求1所述的表格图像文字智能识别方法,其特征在于,第一直线集包括存储水平直线段的第一水平直线集和存储垂直直线段的第一垂直直线集,具体过程包括:S301、对待识别出库单图片进行直线检测,得到所有直线段以及各直线段两端的坐标;S302、根据所有直线段两端的坐标分别计算各直线段的斜率;S303、根据直线段的斜率对直线段进行分类;S304、将斜率大于1的直线段存入第一垂直直线集,将斜率小于等于1的直线段存入第一水平直线集中。5.根据权利要求4所述的表格图像文字智能识别方法,其特征在于,统计斜率的众数的过程为:S311、对第一直线集中的各直线段进行筛选:判断第一直线集中各直线段的斜率是否存在离群值,若存在,则将斜率为离群值对应的直线段从第一直线集中删除;判断第一直线集中各直线段的斜率是否为0,若是,则将斜率为0对应的水平直线段从
第一直线集中删除;S312、对筛选后的第一直线集中所有直线段的斜率进行近似处理;S313、统计近似处理后各直线段斜率的众数,得到斜率的众数。6.根据权利要求5所述的表格图像文字智能识别方法,其特征在于,离群值的计算过程为:将第一水平直线集中所有水平直线段的斜率值升序排列,...
【专利技术属性】
技术研发人员:陈顺军,周欢,傅纯元,
申请(专利权)人:四川合纵药易购医药股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。