基于模板的文件解析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37394346 阅读:18 留言:0更新日期:2023-04-27 07:31
本申请提供一种基于模板的文件解析方法、装置、电子设备及存储介质。该方法在接收到解析指令后,响应该解析指令,分别从获取的各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配待解析文件对应的目标服务模板和目标解析引擎,然后加载该目标解析引擎对应的定制化配置,最后根据该目标服务模板、目标解析引擎以及该定制化配置对待解析文件进行解析,生成并存储目标文档至数据库。该方法通过生成基于各个市场主体服务模板的通用模板,并基于插件式开发提供了向后兼容的各个市场主体服务模板解析引擎用来适配不断变化的源文件,减少了文件解析中的重复开发工作,提高了开发和解析效率。了开发和解析效率。了开发和解析效率。

【技术实现步骤摘要】
基于模板的文件解析方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种基于模板的文件解析方法、装置、电子设备及存储介质。

技术介绍

[0002]在日常金融业务应用开发过程中,业务人员可能需要对各种Excel表格中的数据进行动态提取,然后与业务基准规则进行对比,筛选出服务业务预期的数据,并对数据进行二次加工,从而将各种Excel表格文件解析为标准格式的Excel表格文档。然而,传统的文件解析方法在面对多模板解析时,需要进行大量的重复开发工作,且代码复杂、不易维护;此外,在面对不断变化的源Excel文件时,每次源文件的更新都需要重新开发新的业务组件,通用性不强。
[0003]因此,需要提出一种基于模板的文件解析方法,能提供向后兼容的业务组件用来适配不断变化的源文件,减少重复开发工作,提高开发和解析效率。

技术实现思路

[0004]本申请提供一种基于模板的文件解析方法、装置、电子设备及存储介质,用于提供向后兼容的业务组件用来适配不断变化的源文件,减少重复开发工作,提高开发和解析效率。
[0005]为了解决上述技术问题,本申请提供以下技术方案:
[0006]本申请提供一种基于模板的文件解析方法,包括:
[0007]获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎;其中,各个市场主体服务模板解析引擎是通过插件式开发得到;
[0008]接收解析指令;
[0009]响应所述解析指令,分别从各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配所述待解析文件对应的目标服务模板和目标解析引擎;
[0010]加载所述目标解析引擎对应的定制化配置;
[0011]根据所述目标服务模板、目标解析引擎以及所述定制化配置对所述待解析文件进行解析,生成并存储目标文档至数据库。
[0012]相应的,本申请还提供一种基于模板的文件解析装置,包括:
[0013]第一获取模块,用于获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎;其中,各个市场主体服务模板解析引擎是通过插件式开发得到;
[0014]指令接收模块,用于接收解析指令;
[0015]指令响应模块,用于响应所述解析指令,分别从各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配所述待解析文件对应的目标服务模板和目标解析引擎;
[0016]配置加载模块,用于加载所述目标解析引擎对应的定制化配置;
[0017]文件解析模块,用于根据所述目标服务模板、目标解析引擎以及所述定制化配置
对所述待解析文件进行解析,生成并存储目标文档至数据库。
[0018]同时,本申请提供一种电子设备,其包括处理器和存储器,存储器用于存储计算机程序,处理器用于运行所述存储器里的计算机程序,以执行上述基于模板的文件解析方法中的步骤。
[0019]此外,本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行上述基于模板的文件解析方法中的步骤。
[0020]有益效果:本申请提供一种基于模板的文件解析方法、装置、电子设备及存储介质。具体地,该方法先获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎,其中,各个市场主体服务模板解析引擎是通过插件式开发得到,在接收到解析指令后,响应该解析指令,分别从各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配该待解析文件对应的目标服务模板和目标解析引擎,然后加载目标解析引擎对应的定制化配置,最后根据目标服务模板、目标解析引擎以及定制化配置对待解析文件进行解析,生成并存储目标文档至数据库。该方法通过自定义模板的方式生成了基于各个市场主体服务模板的通用模板,并基于插件式开发提供了向后兼容的各个市场主体服务模板解析引擎用来适配不断变化的源文件,不会对现有解析引擎产生影响,且实现了动态模板和解析引擎的定制,减少了文件解析中的重复开发工作,提高了开发和解析效率。
附图说明
[0021]下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。
[0022]图1是本申请实施例提供的基于模板的文件解析系统的系统架构图。
[0023]图2是本申请实施例提供的基于模板的文件解析方法的流程示意图。
[0024]图3是本申请实施例提供的基于模板的文件解析方法的逻辑架构图。
[0025]图4是本申请实施例提供的文件解析方法的流程示意图。
[0026]图5是本申请实施例提供的基于模板的文件解析装置的结构示意图。
[0027]图6是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0028]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029]本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含;本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行。
[0030]在本申请中,待解析文件为格式为Excel格式或CSV格式的文件,其可以是用户手动上传的文件,也可以是通过机器人流程自动化系统,从对应市场主体的系统(如银行的后台系统)中自动抓取的文件。
[0031]在本申请中,市场主体服务模板指的是金融机构或者银行将待解析文件预解析成为的文档模板标准,例如XX银行XX模板。其中,市场主体包括金融机构、银行等,服务指的是基金服务、债券服务、银行卡服务等。
[0032]在本申请中,市场主体服务模板解析引擎指的是针对市场主体服务模板的解析器;其中,解析器指的是根据解析规则将CSV、JSON、XML之类格式的字符串解码成数据结构。
[0033]在本申请中,定制化配置指的是预先设定的自定义解析需求配置,包括是否需要对文件的头部标题进行解析等。
[0034]本申请提供一种基于模板的文件解析方法、装置、电子设备及存储介质。
[0035]请参阅图1,图1是本申请提供的基于模板的文件解析系统的系统架构示意图,如图1所示,该基于模板的文件解析系统至少包括终端设备101和服务器102,其中:
[0036]终端设备101和服务器102之间设有通信链路,以实现信息交互。通信链路的类型可以包括有线、无线通信链路或者光纤电缆等,本申请在此不做限制。
[0037]终端设备101可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
[0038]服务器102可以是独立的服务器,也可以是服务器组成的服务器网络或者服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模板的文件解析方法,其特征在于,包括:获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎;其中,各个市场主体服务模板解析引擎是通过插件式开发得到;接收解析指令;响应所述解析指令,分别从各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配所述待解析文件对应的目标服务模板和目标解析引擎;加载所述目标解析引擎对应的定制化配置;根据所述目标服务模板、目标解析引擎以及所述定制化配置对所述待解析文件进行解析,生成并存储目标文档至数据库。2.根据权利要求1所述的基于模板的文件解析方法,其特征在于,在所述获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎的步骤之前,还包括:获取初始模板的表头字段;其中,所述初始模板的表头字段包括根据业务需求进行相应操作得到表头字段,所述操作包括修改操作、新增操作以及删除操作;根据所述业务需求,确定所述初始模板对应的业务类型;根据所述业务类型和已选定表头字段的所述初始模板,创建市场主体服务模板;根据所述市场主体服务模板,定义所述市场主体服务模板对应的市场主体服务解析引擎。3.根据权利要求1所述的基于模板的文件解析方法,其特征在于,所述获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎的步骤,包括:接收上传的源文件;确定所述源文件的文件格式;根据预设的文件过滤条件和所述源文件的文件格式对所述源文件进行过滤,得到待解析文件。4.根据权利要求1所述的基于模板的文件解析方法,其特征在于,所述获取待解析文件、各个市场主体服务模板以及各个市场主体服务模板解析引擎的步骤,包括:接收上传的源文件;确定所述源文件的文件格式;若所述源文件的文件格式均不满足所述预设的文件过滤条件,则对所述源文件进行识别筛选,得到内容为表格的待识别文件;对所述待识别文件进行表格图像识别,得到所述待识别文件中的电子表格;对所述待识别文件进行文字识别,得到所述待识别文件中的字符和所述字符的坐标;根据所述字符的坐标将所述待识别文件中的字符填充至所述电子表格,得到待解析文件。5.根据权利要求1所述的基于模板的文件解析方法,其特征在于,所述响应所述解析指令,分别从各个市场主体服务模板和各个市场主体服务模板解析引擎中匹配所述待解析文件对应的目标服务模板和目标解析引擎的步骤,包括:响应所述解析指令,获取所述待解析文...

【专利技术属性】
技术研发人员:黄芳
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1