【技术实现步骤摘要】
一种简单表格照片中的关键列内手写数据提取方法
本专利技术属于计算机视觉领域,具体地设计一种简单表格照片中的关键列内手写数据提取方法。
技术介绍
在现有技术中,对于手写数据的采集技术已经较为成熟,但是在需要识别并提取表格中的指定列手写数据时,仍然是先识别并提取整个表格内的手写数据,再通过对整个表格内的列筛选出所需的关键名列的方法,这一方法在遇到图像拍摄采集过程中纸张不平整、打印时表格线空洞缺损等问题时,会影响到整个表格的建立,导致筛选出的关键列出现错漏或错位的问题。
技术实现思路
本专利技术的目的是为了解决以上现有技术的不足,提出了一种简单表格照片中的关键列内手写数据提取方法,包括:步骤1:将采集到的照片进行图像处理,得到仅包含表格区域的灰度图像:1.1对采集到的图像做二值化处理,提取其中最大白色连通域作为纸张掩码,使用掩码层覆盖原图像;特别的,针对纸张手持或按压时的情况,使用HSV颜色空间分析属于肤色范围内区域,制作掩码覆盖;1.2对掩码覆盖后的图像做二值化处理,获取表格连通域;特 ...
【技术保护点】
1.一种简单表格照片中的关键列内手写数据提取方法,其特征在于,包括:/n步骤1:将采集到的照片进行图像处理,得到仅包含表格区域的灰度图像:/n1.1对采集到的图像做二值化处理,提取其中最大白色连通域作为纸张掩码,使用掩码层覆盖原图像;特别的,针对纸张手持或按压时的情况,使用HSV颜色空间分析属于肤色范围内区域,制作掩码覆盖;/n1.2对掩码覆盖后的图像做二值化处理,获取表格连通域;特别的,针对可能存在的打印导致表格线空洞缺损,对二值化图像进行反色处理后再提取连通域;计算连通域外接矩形,以外接矩最大的区域作为表格区域,利用外接矩角度值将表格图像旋转到水平,计算旋转后的表格区域 ...
【技术特征摘要】
1.一种简单表格照片中的关键列内手写数据提取方法,其特征在于,包括:
步骤1:将采集到的照片进行图像处理,得到仅包含表格区域的灰度图像:
1.1对采集到的图像做二值化处理,提取其中最大白色连通域作为纸张掩码,使用掩码层覆盖原图像;特别的,针对纸张手持或按压时的情况,使用HSV颜色空间分析属于肤色范围内区域,制作掩码覆盖;
1.2对掩码覆盖后的图像做二值化处理,获取表格连通域;特别的,针对可能存在的打印导致表格线空洞缺损,对二值化图像进行反色处理后再提取连通域;计算连通域外接矩形,以外接矩最大的区域作为表格区域,利用外接矩角度值将表格图像旋转到水平,计算旋转后的表格区域坐标,切割图像;
步骤2:对表格区域图像进行二值化处理,利用图像处理获得横向和纵向表格线图,利用投影法分别计算横线的y坐标和纵线的x坐标;
步骤3:根据表格线间的位置关系,确定表头所有列名的位置,对该区域进行切割及处理后,输入到训练好的CRNN网络识别,和给定的表头关键字比较,确定所需识别的列;
步骤4:将所得坐标和纵向表格线坐标比较,确定所在列外部两侧的x坐标,以该坐标切割表格灰度图像,获得待识别的单列灰度图像;
步骤5:对单列图像进行二值化,使用图像处理,抹去单列图像中表格线;
步骤6:使用投影法从处理后单列图像中将每行手写数据切分出来;
步骤7:将切分出的手写数据块输入到训练好的CRNN网络中,识别手写数据备。
2.根据权利要求1所述的一种简单表格照片中的关键列内手写数据提取方法,其特征在于,所述的步骤2中:
2.1对步骤1所得表格区域图像,二值...
【专利技术属性】
技术研发人员:郑会龙,
申请(专利权)人:杭州测质成科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。