【技术实现步骤摘要】
一种表格信息转录方法、系统、电子设备和存储介质
本专利技术实施例涉及图像识别
,尤其涉及一种表格信息转录方法、系统、电子设备和存储介质。
技术介绍
目前,国内外有部分国家地区,依然采用手写形式填写表格,因此,有大批量的表格信息需要人工识别处理。面对复杂多变的表格,虽然随着计算机技术的发展,识别各类图像的图像识别技术也越来越多,但是目前还没有相应的图像处理技术,能够有效处理这种大批量的含有复杂表格字符信息的图片。因此,亟待一种识别表格图像内容的方法,实现图像中表格信息的转录,以及提高识别的准确性。
技术实现思路
本专利技术实施例提供一种表格信息转录方法、系统、电子设备和存储介质,以达到准确实现图像中的表格信息转录的目的。第一方面,本专利技术实施例提供了一种表格信息转录方法,所述方法包括:获取带有表格信息的目标图像,并从所述目标图像中提取第一类型和第二类型的表格线条,得到包括第一类型表格线条的第一图像和包括第二类型表格线条的第二图像;对所述第一图像和所述第二图像进行运算, ...
【技术保护点】
1.一种表格信息转录方法,其特征在于,所述方法包括:/n获取带有表格信息的目标图像,并从所述目标图像中提取第一类型和第二类型的表格线条,得到包括第一类型表格线条的第一图像和包括第二类型表格线条的第二图像;/n对所述第一图像和所述第二图像进行运算,得到各单元格的边线以及各个单元格的顶点位置;/n基于单元格的边线以及单元格的顶点位置,确定单元格区域,并对所述单元格区域进行文本信息识别;/n将识别到的文本信息写入预先构建的目标文件中,以完成图像中表格信息的转录。/n
【技术特征摘要】
1.一种表格信息转录方法,其特征在于,所述方法包括:
获取带有表格信息的目标图像,并从所述目标图像中提取第一类型和第二类型的表格线条,得到包括第一类型表格线条的第一图像和包括第二类型表格线条的第二图像;
对所述第一图像和所述第二图像进行运算,得到各单元格的边线以及各个单元格的顶点位置;
基于单元格的边线以及单元格的顶点位置,确定单元格区域,并对所述单元格区域进行文本信息识别;
将识别到的文本信息写入预先构建的目标文件中,以完成图像中表格信息的转录。
2.根据权利要求1所述的方法,其特征在于,从所述目标图像中提取第一类型和第二类型的表格线条,包括:
对所述目标图像进行腐蚀和膨胀处理,基于预设的形态学因子从腐蚀和膨胀处理后的图像中提取第一类型和第二类型的表格线条。
3.根据权利要求1所述的方法,其特征在于,对所述第一图像和所述第二图像进行运算,得到各单元格的边线以及各个单元格的顶点位置,包括:
对所述第一图像和所述第二图像进行并集运算得到表格线图像,并从表格线图像中确定各单元格的边线;
对所述第一图像和所述第二图像进行交集运算得到格点图像,并从所述格点图像中确定各个单元格的顶点位置。
4.根据权利要求1所述的方法,其特征在于,在得到各单元格的边线以后,所述方法还包括:
基于各单元格边线确定表格区域,并将区域面积小于预设阈值或区域形状不规则的表格区域丢弃。
5.根据权利要求1所述的方法,其特征在于,在得到各单元格的边线以及各个单元格的顶点位置后,所述方法还包括:
按照指定顺序进行像素扫描,确定目标格点,其中,所述目...
【专利技术属性】
技术研发人员:张天澄,徐立凡,马业恒,
申请(专利权)人:张天澄,徐立凡,马业恒,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。