【技术实现步骤摘要】
一种用于财务报表的弯曲表格线的检测方法
本专利技术涉及财务报表的表格线识别
,特别涉及一种用于财务报表的弯曲表格线的检测方法。
技术介绍
随着社会经济的发展和中国城镇化的推进,越来越多的人进入城市就业,越来越多的公司诞生;同时随着互联网技术的发展,电子交易,数字交易已经普及;对于公司、银行、证卷交易所产生越来越多的财务表格单据及信息。传统的财务报表统计、校对、审计都全靠人工进行;速度慢、效率底,很难满足越来越多的表格单据信息的识别、入库及校对。如何快速准确的对财务等表格单据进行智能识别、核对,同时减少人工成本,是急需解决的问题;特别时各种应用向移动端转移,以便更加灵活、便利。而其中表格线检测的完整性、准确性,对于表格重建及表格的识别有着重要的作用,而移动端用户拍摄的场景各异、条件差,导致上传表格存在各种噪声、弯曲、形変、光照不足或过强等,如何解决此类表格线的定位,特别是弯曲表格的定位,直接影响着该应用的适用范围、准确度、灵活度、便利性。
技术实现思路
本专利技术的目的是:提出一种用于财务报表的弯曲表格线的检测方法,重构表格,并提取表格内的关键信息,以解决弯曲表格的表格线定位问题,满足财务报表到标准表格的映射、保存和校验。本专利技术解决其技术问题所采用的技术方案是:一种用于财务报表的弯曲表格线的检测方法,包括如下步骤:S1、通过拍摄或扫描财务报表获得表格图像,并进行图像预处理;S2、采用霍夫直线检测所述表格图像的倾斜度,并计算出实际字符高度,运用放射变换校正所述表格图像,并依据实际字符高度对所述表格图像进行自适应缩放处理;S3、调用红章去除算法,去除所述表 ...
【技术保护点】
1.一种用于财务报表的弯曲表格线的检测方法,其特征在于,包括如下步骤:S1、通过拍摄或扫描财务报表获得表格图像,并进行图像预处理;S2、采用霍夫直线检测所述表格图像的倾斜度,并计算出实际字符高度,运用放射变换校正所述表格图像,并依据实际字符高度对所述表格图像进行自适应缩放处理;S3、调用红章去除算法,去除所述表格图像中的红章干扰,并保留原有的印刷信息;S4、对去除红章后的表格图像进行灰度化处理,得到单通道的灰度图像M4,再分别采用横线卷积核和竖线卷积核对其进行卷积处理,以达到增强财务表格水平线和竖直线的目的;S5、对增强后的水平线和竖直线图像分别进行自适应二值化处理,获得二值化图像;S6、用数学形态学的方法对所述二值化图像中的横线和竖线进行检测,进而过滤掉非表格线干扰;S7、采用爬行虫行进的方式对表格线进行补全及干扰剔除;S8、重构表格线,并进行弯曲校正和字符识别;S9、依据标准映射表,重构表格,并进行校验和统计。
【技术特征摘要】
1.一种用于财务报表的弯曲表格线的检测方法,其特征在于,包括如下步骤:S1、通过拍摄或扫描财务报表获得表格图像,并进行图像预处理;S2、采用霍夫直线检测所述表格图像的倾斜度,并计算出实际字符高度,运用放射变换校正所述表格图像,并依据实际字符高度对所述表格图像进行自适应缩放处理;S3、调用红章去除算法,去除所述表格图像中的红章干扰,并保留原有的印刷信息;S4、对去除红章后的表格图像进行灰度化处理,得到单通道的灰度图像M4,再分别采用横线卷积核和竖线卷积核对其进行卷积处理,以达到增强财务表格水平线和竖直线的目的;S5、对增强后的水平线和竖直线图像分别进行自适应二值化处理,获得二值化图像;S6、用数学形态学的方法对所述二值化图像中的横线和竖线进行检测,进而过滤掉非表格线干扰;S7、采用爬行虫行进的方式对表格线进行补全及干扰剔除;S8、重构表格线,并进行弯曲校正和字符识别;S9、依据标准映射表,重构表格,并进行校验和统计。2.如权利要求1所述的一种用于财务报表的弯曲表格线的检测方法,其特征在于,所述步骤S1中图像预处理的具体步骤包括:图像缩放处理、灰度化处理、图像增强处理和自适应二值化处理。3.如权利要求1所述的一种用于财务报表的弯曲表格线的检测方法,其特征在于,所述步骤S2中的实际字符高度的具体获取步骤如下:在自适应二值化处理得到的二值化图像上进行连通域查找,并剔除非字符连通域;对获取的字符连通域分别计算出其外接矩形框的高度和宽度的最大值的平均值,并将其作为字符高度,然后根据所述图像预处理中的图像缩放比例,反算出实际字符高度。4.如权利要求1所述的一种用于财务报表的弯曲表格线的检测方法,其特征在于,所述步骤S2中放射变换校正表格图像的具体步骤如下:S21、采用Sobel边缘检测算法对二值化后的表格图像进行边缘提取;S22、采用Hough直线检测算法获得表格水平边缘与垂直边缘倾斜角度;S23、根据所述水平及垂直边缘倾斜角度进行放射变换,获取校正后的表格图像。5.如权利要求1所述的一种用于财务报表的弯曲表格线的检测方法,其特征在于,所述步骤S2中自适应缩放处理的步骤包括:根据实际字符高度,判断表格图像是否可以缩放,若实际字符高度大于28像素,则将所述表格图像缩放至20像素,若实际字符高度小于28像素,则将所述表格图像设置为20像素,得到缩放图像M2。6.如权利要求5所述的一种用于财务报表的弯曲表格线的检测方法,其特征在于,所述步骤S3中调用红章去除算法去除红章的具体步骤如下:S31、获取所述缩放图像M2的自适应二值图像B1,通过自适应二值图像B1及缩放图像M2来获取背景平均灰度值、目标平均灰度及最大灰度值;所述自适应二值图像B1的目标为字符及表格线,其它情况视为背景;S32、将所述缩放图像M2转换为HSV图像H,由于红章变红,其中r通道最大,而目标...
【专利技术属性】
技术研发人员:周康明,
申请(专利权)人:上海眼控科技股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。