【技术实现步骤摘要】
表单数据处理方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
和金融科技领域,尤其涉及一种表单数据处理方法、装置、电子设备和存储介质。
技术介绍
[0002]财务报表是反映企业或预算单位一定时期资金、利润状况的会计报表,是企业财务信息的重要组成部分,通过企业的财务报表,企业的决策者可以更加方便地了解企业的财务状况,以便于作出更佳的决策。没有统一的标准,因此在根据各个业务场景下的表单来生成财务报表时无可避免地需要对原表单中的数据进行处理。
[0003]在相关技术中,表单数据的处理通常采用文字识别的方式,将相同项目名称下表单中的数据填入财务报表模板中,以最终形成财务报表。但随着企业业务的不断扩展,各个业务场景下使用的表单的格式、项目名称等存在差异,使得原表单中的项目与财务报表模板中的项目无法完全匹配,因而采用相关技术中的方法处理表单数据至少存在着表单录入准确性差的问题。
技术实现思路
[0004]鉴于上述问题,本公开提供了一种表单数据处理方法、装置、电子设备、可读存储介质和计算机程序产品 ...
【技术保护点】
【技术特征摘要】
1.一种表单数据处理方法,包括:获取待录入表单;利用文字识别方法处理所述待录入表单,以从所述待录入表单中提取得到多个第一表单项目,以及与多个所述第一表单项目一一对应的多个表单数据;分别将多个所述第一表单项目依次与目标表单模板中的多个第一模板项目进行匹配,以确定多个所述第一表单项目与多个所述第一模板项目之间的映射关系;基于项目语义信息和所述目标表单模板的表单结构信息对所述映射关系进行筛选,得到目标映射关系;以及基于所述目标映射关系,将多个所述表单数据写入所述目标表单模板中,得到目标表单。2.根据权利要求1所述的方法,其中,所述分别将多个所述第一表单项目依次与目标表单模板中的多个第一模板项目进行匹配,以确定多个所述第一表单项目与多个所述第一模板项目之间的映射关系,包括:基于项目文本信息,分别将多个所述第一表单项目依次与多个所述第一模板项目进行匹配,以确定第一映射关系,以及未能完成匹配的第二表单项目和第二模板项目,其中,所述第二表单项目属于多个所述第一表单项目,所述第二模板项目属于多个所述第一模板项目;将所述第二表单项目依次与规则库中的匹配规则进行匹配,以确定第二映射关系,以及未能完成匹配的第三表单项目和第三模板项目,其中,所述第三表单项目属于所述第二表单项目,所述第三模板项目属于所述第二模板项目;将所述第三表单项目与所述第三模板项目进行模糊匹配,以确定第三映射关系;以及基于所述第一映射关系、所述第二映射关系和所述第三映射关系,确定所述映射关系。3.根据权利要求2所述的方法,其中,所述将所述第三表单项目与所述第三模板项目进行模糊匹配,以确定第三映射关系,包括:计算所述第三表单项目与所述第三模板项目之间的编辑距离;以及在所述编辑距离小于预设编辑距离的情况下,确定所述第三表单项目与所述第三模板项目之间具有所述第三映射关系。4.根据权利要求2所述的方法,其中,所述基于项目文本信息,分别将多个所述第一表单项目依次与多个所述第一模板项目进行匹配,以确定第一映射关系,以及未能完成匹配的第二表单项目和第二模板项目,包括:将多个所述第一表单项目的文本信息依次与多个所述第一模板项目的文本信息进行匹配,得到第一匹配结果;基于所述第一匹配结果,从多个所述第一表单项目中确定已完成匹配的第一目标表单项目和未能完成匹配的所述第二表单项目;基于所述第一匹配结果,从多个所述第一模板项目中确定已完成匹配的第一目标模板项目和未能完成匹配的所述第二模板项目;以及基于所述第一匹配结果,确定所述第一目标表单项目和所述第一目标模板项目之间具有所述第一映射关系。5.根据权利要求2所述的方法,其中,所述将所述第二表单项目依次与规则库中的匹配
规则进行匹配,以确定第二映射关系,以及未能完成匹配的第三表单项目和第三模板项目,包括:将所述第二表单项目与所述规则库中的匹配规则进行匹配,得到第二匹配结果;基于所述第二匹配结果,从多个所述第二表单项目中确定已完成匹配的第二目标表单项目和未能完成匹配的所述第三表单项目;从所述规则库的匹配规则中确定与所述第二目标表单项目对应的目标匹配规则;基于所述目标匹配规则,从多个所述第二模板项目中确定已完成匹配的第二目标模板项目和未能完成匹配的所述第三模板项目;以及基于所述目标匹配规则,确定所述第二目标表单项目和所述第二目标模板项目之间具有所述第二映射关系。6.根据权利要求1所述的方法,其中,所述基于项目语义信息和所述目标表单模板的表单结构信息对所述映射关系进行筛选,得到目标映射关系,包括:...
【专利技术属性】
技术研发人员:谢小容,车越云,熊博颖,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。