一种表格识别方法、识别系统及计算机装置制造方法及图纸

技术编号:17110741 阅读:29 留言:0更新日期:2018-01-24 22:41
本发明专利技术提出了一种表格识别方法、识别系统、计算机装置及计算机可读存储介质,表格识别方法包括:建立深度学习模型;获取表格图片,将表格图片横向切割为多个横向图片;通过深度学习模型,识别每个横向图片是否包含直线,获取包含直线的横向图片;纵向切割包含直线的横向图片,得到多个区块;根据多个区块组成表格,定位表格内文字并识别文字内容。通过利用建立好的深度学习模型进行表格的识别,提高了表格识别的效率以及准确率。

A form recognition method, recognition system and computer device

【技术实现步骤摘要】
一种表格识别方法、识别系统及计算机装置
本专利技术涉及图片识别
,具体而言,涉及一种表格识别方法、识别系统、计算机装置及计算机可读存储介质。
技术介绍
目前,深度学习在图片识别领域发展迅速,它已完全超越传统方法的准确率和效率,深受图片识别领域的关注。物体检测和识别是图片识别领域的一个专业分支。相较于物体识别,物体检测具有更大的难度和挑战。表格的扫描识别是帮助用户直接将照片中的表格转换成可编辑的表格文本,属于物体检测识别的实际应用之一。已有的做法分为以下几步:(1)识别表格的区块分割块;(2)根据分割块组成表格;(3)定位文字;(4)识别文字内容。但是(1)、(2)步识别的表格往往噪音较大,准确率还有待于进一步的提高。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术的一个方面在于提出了一种表格识别方法。本专利技术的另一个方面在于提出了一种表格识别系统。本专利技术的再一个方面在于提出了一种计算机装置。本专利技术的又一个方面在于提出了一种计算机可读存储介质。有鉴于此,根据本专利技术的一个方面,提出了一种表格识别方法,包括:建立深度学习模型;获本文档来自技高网...
一种表格识别方法、识别系统及计算机装置

【技术保护点】
一种表格识别方法,其特征在于,包括:建立深度学习模型;获取表格图片,将所述表格图片横向切割为多个横向图片;通过所述深度学习模型,识别每个所述横向图片是否包含直线,获取包含直线的横向图片;纵向切割所述包含直线的横向图片,得到多个区块;根据所述多个区块组成表格,定位所述表格内文字并识别所述文字内容。

【技术特征摘要】
1.一种表格识别方法,其特征在于,包括:建立深度学习模型;获取表格图片,将所述表格图片横向切割为多个横向图片;通过所述深度学习模型,识别每个所述横向图片是否包含直线,获取包含直线的横向图片;纵向切割所述包含直线的横向图片,得到多个区块;根据所述多个区块组成表格,定位所述表格内文字并识别所述文字内容。2.根据权利要求1所述的表格识别方法,其特征在于,在所述纵向切割所述包含直线的横向图片,得到所述多个区块之前,还包括:对所述包含直线的横向图片进行筛选,去除重复的所述包含直线的横向图片。3.根据权利要求1所述的表格识别方法,其特征在于,所述建立深度学习模型的步骤,具体包括:通过网络爬虫采集表格类图片;通过所述表格类图片对模型参数进行预训练,获取预训练模型;获取手工拍照图片,对所述手工拍照图片进行标注;通过所述手工拍照图片对所述预训练模型进行调整,得到所述深度学习模型。4.根据权利要求3所述的表格识别方法,其特征在于,在所述通过所述表格类图片对模型参数进行预训练,获取所述预训练模型之前,还包括:将所述表格类图片横向切割为多个横向表格类图片;对所述多个横向表格类图片进行白化操作;将所述多个横向表格类图片的格式调整为固定大小。5.根据权利要求3所述的表格识别方法,其特征在于,所述获取所述手工拍照图片,对所述手工拍照图片进行标注的步骤,具体包括:获取所述手工拍照图片,判断所述手工拍照图片是否包含有直线;当所述手工拍照图片包含有直线时,将所述手工拍照图片标记为1;当所述手工拍照图片不包含有直线时,将所述手工拍照图片标记为0。6.根据权利要求3至5中任一项所述的表格识别方法,其特征在于,所述预训练模型依次包括:第一四层卷积层[64,32,16,16]、四层全连接层[256,128,64,32]、三层全连接层[64,128,256]、第二四层卷积层[16,16,32,64];所述深度学习模型为依次包括:第一四层卷积层[64,32,16,16]、四层全连接层[256,128,64,32]、softmax层;其中,所述第一四层卷积层各层的大小为64、32、16、16,所述四层全连接层各层的大小为256、128、64、32,所述三层全连接层各层的大小为64、128、256,所述第二四层卷积层各层的大小为16、16、32、64,所述三层全连接层各层的大小为64,128,256。7.一种表格识别系统,其特征在于,包括:模型建立单元,用于建立深度学习模型;第一切割单元,用于获取表格图片,将所述表格图片横向切割为多个横向图片;第一识别单元,用于通过所述深度学习模型,识别每个所述横向图片是否包含直线,获取包含直线的横向图片;所述第一切割单元,...

【专利技术属性】
技术研发人员:马柏樟
申请(专利权)人:畅捷通信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1