【技术实现步骤摘要】
表格填写方法、装置、电子设备及存储介质
[0001]本申请涉及数据处理领域,具体而言,涉及一种表格填写方法、装置、电子设备及存储介质。
技术介绍
[0002]随着电子化办公的普及,让表格使用信息化手段进行管理成为了可能。使用信息化手段管理表格能提高表格管理工作效率,使表格检索方便快捷,可以有效保护表格原件,共享表格信息可以提高档案利用率、能产生显著经济效益。因而需要将大量的纸质表格、图像表格等转化为电子表格,以实现表格的信息化管理。
[0003]目前,常见的自动化表格填写主要是通过表格检测与单元格识别,将纸质表格转化为电子表格。虽然能将纸质表格转化为电子表格,但是表格的填写还是需要人为进行,极大的增加了工作人员的工作量。
技术实现思路
[0004]有鉴于此,本申请实施例的目的在于提供一种表格填写方法、装置、电子设备及存储介质。能够将目标表格转化为电子表格,并实现表格的自动填写,减少工作人员的工作量。
[0005]第一方面,本申请实施例提供了一种表格填写方法,包括:识别目标表格图像中的单元格和文 ...
【技术保护点】
【技术特征摘要】
1.一种表格填写方法,其特征在于,包括:识别目标表格图像中的单元格和文本,以将所述目标表格转换为电子表格;通过图卷积网络和所述单元格预测相邻有值单元格和空白单元格的隶属关系;将所述有值单元格中的文本和数据库中的文本进行匹配,以得到与所述有值单元格存在隶属关系的所述空白单元格的待填写文本;基于所述待填写文本在所述空白单元格内生成相应文本,以完成所述电子表格的填写;其中,所述有值单元格为所述目标表格中填写有内容的单元格,所述空白单元格为所述目标表格中没有填写内容的单元格。2.根据权利要求1所述的方法,其特征在于,所述识别目标表格图像中的单元格和文本,包括:通过Swin Transformer和R
‑
FPN提取所述目标表格图像中的单元格,并获取所述单元格对应的单元格属性;通过Paddle OCR识别所述目标表格图像中的文本;其中,所述R
‑
FPN通过在FPN结构上添加Res Net网络中的残差结构获得,所述R
‑
FPN用于增加高分辨率特征图的比重。3.根据权利要求2所述的方法,其特征在于,所述单元格属性包括单元格的位置信息,所述识别目标表格图像中的单元格和文本之后,所述方法还包括:将所述单元格按照预设编号规则进行编号;将编号后的所述单元格、所述单元格属性和所述文本进行存储。4.根据权利要求3所述的方法,其特征在于,所述将编号后的所述单元格、所述单元格属性和所述文本进行存储包括:按照所述单元格属性将所述编号后的所述单元格照所述目标表格的格式进行排列;将所述文本在相应的所述单元格内存储,以使所述文本和所述单元格按照所述目标表格的格式进行存储。5.根据权利要求2所述的方法,其特征在于,所述通过图卷积网络和所述单元格预测相邻所述有值单元格和所述空白单元格的隶属关系,包括:根据所述单元格属性构建邻接矩阵;将所述邻接矩阵中的相邻节点的特征相聚合,并将特征聚合后的所述相邻节点进行隶属关系判断,以确定所...
【专利技术属性】
技术研发人员:刘树衎,冯杭,李震宇,
申请(专利权)人:中国人民解放军海军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。