本发明专利技术提供一种基于模版智能学习的财务数据初始化系统,其特征在于:包括:获取原系统数据端,用于获取原系统数据文件。初始化数据生成端,用于生成初始化数据,包括导入模块、识别模块、解析模块、统一数据模块、数据读取模块以及初始化数据生成模块。管理确认终端,用于用户人工校验确认。一种基于模版智能学习的财务数据初始化方法,具体过程如下:S1:获取原系统数据文件,所述获取原系统数据文件的方式包括客户端自动下载和手动下载。S2:导入文件,解析并识别模版或者自定义模版;S3:根据模版解析文件数据;S4:自动记录模版及模版热度;S5:获取统一格式数据;S6:转换为新系统初始数据;S7:人工确认后完成初始化。
A financial data initialization method and system based on template intelligent learning
【技术实现步骤摘要】
一种基于模版智能学习的财务数据初始化方法及系统
本专利技术涉及财务管理软件系统领域,尤其涉及一种基于模版智能学习的财务数据初始化方法及系统。
技术介绍
当今市场上有众多财务管理软件系统,用户进行系统更换升级时有发生,系统之间的数据具有一定的差异性:如文件类型不一致,财务设置不一致,系统标准不一致等,无法直接进行数据迁移。数据转移的过程即为新系统初始化的过程。该过程因为数据来源不确定性、多样性将导致新系统无法正常使用。
技术实现思路
本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于模版智能学习的财务数据初始化方法及系统,该系统适用于财务管理软件系统更新升级时,数据的完整迁移、适用多种形式的数据类型,具有用户手动选择解析方式,人工自定义配置解析模版数据,使新系统初始化过程灵活度更高,保证新系统正常使用。为实现上述目的,本专利技术采用了如下技术方案:一种基于模版智能学习的财务数据初始化系统,其特征在于:包括:获取原系统数据端,用于获取原系统数据文件。初始化数据生成端,用于生成初始化数据,包括导入模块、识别模块、解析模块、统一数据模块、数据读取模块以及初始化数据生成模块。管理确认终端,用于用户人工校验确认。优选地,所述获取原系统数据端包括自动下载模块和手动下载模块,所述自动下载模块用于自动下载原系统数据文件,所述手动下载模块。优选地,所述导入模块与所述获取原系统数据端数据相连,用于将获取的原系统数据文件导入到新系统中。所述识别模块,用于模版数据识别判断所述数据文件的类型,所述文件类型包括excel、xml、html和pdf。所述解析模块,包括匹配解析模块和手动解析模块,所述匹配解析模块用于所述识别模块识别成功的模版数据的解析,所述手动解析模块用于手动选择解析方式,解析识别模块识别失败的模版数据。所述统一数据模块与所述解析模块数据连接,所述解析模块将所述数据文件解析成统一JSON格式数据,并收录到所述同一数据模块中。所述数据读取模块与所述统一数据模块数据相连,读取所述JSON格式数据。所述初始化数据生成模块用于将数据读取模块读取的数据生成初始化数据并进入新系统的管理确认终端。优选地,所述数据读取模块中还具有智能过滤模块,所述智能过滤模块用于智能过滤非必要数据以及对有用数据按照配置规则进行清洗,所述数据读取模块读取的JSON格式数据是所述智能过滤模块过滤后的数据文件,所述配置规则分为对单个内容进行处理,以及对全局数据进行对比分析后处理。优选地,所述手动解析模块还包括配置解析模块和学习生成模块,所述配置解析模块用于人工自定义配置解析模版数据,所述学习生成模块用于自主学习生成新的模版数据。优选地,所述初始化数据生成端还包括一个模版库模块,所述模版库模块与所述解析模块数据连接,用于根据模版配置解析模版数据,或者收录手动解析模版自主生成的新的模版数据;所述模版库模块还包括统计模块,用于统计所述模版库模块中模版匹配解析的次数。一种基于模版智能学习的财务数据初始化方法,具体过程如下:S1:获取原系统数据文件,所述获取原系统数据文件的方式包括客户端自动下载和手动下载。S2:导入文件,解析并识别模版或者自定义模版;解析并识别模板采用智能匹配,所述只能匹配包括如下步骤:第一步,前提是先利用easyexcel将多种格式的文件转化为统一结构,该结构包含四个属性,1、文件名称2、Sheet数据,包含Sheet序号和row集合的一对多映射关系,row集合里为该行各个col的值3、Sheet名称及序号4、合并单元格信息,包含序号和单个合并信息,合并信息包含startRow(开始行),endRow(结束行),startCol(开始列),endCol(结束列)。第二步,加载模版库模版信息(模版表/读取配置表),模版信息主要包含模版Id,模版名称,模板类型,表头开始行,表头结束行,表头关键字,表单关键字,识别策略,全局数据处理方式。遍历模版根据模版设置去进行匹配判断,模版里匹配策略有多种,主要为:a、Sheet名称完全一致,顺序及文字b、关键Sheet名称一致性匹配c、Sheet名称关键字匹配d、指定表单的具体行完全一致性匹配e、指定表单的具体行包含关键字匹配。其中每个匹配策略对应一个service服务,通过注解的方式加入spring对象池里,需要使用的具体某个策略的时候,从sping对象池中拿出改service对象进行执行匹配,如果匹配成功则根据改模版的读取配置进行读取。通过该方式进行数据库配置可以有效解耦,直观、高效增加模版,并可以自主学习,动态排序。S3:根据模版解析文件数据;模版解析文件数据采用自定义解析和自动学习的方式,当用户文件和模版库全部模版都无法匹配成功时,则进行自定义模版解析,具体方式为1、先利用poi将excel按Sheet分组,每个Sheet为一个JSON对象,单个Sheet内每行数据为一个JSON数组,JSON数组由单个单元格信息Cell组成,每个Cell包含五个个属性,startRow(开始行),endRow(结束行),startCol(开始列),endCol(结束列),value(单元格内容),将读取的数据返回到浏览器页面,由浏览器进行渲染。2、浏览器进行页面渲染,拿到所有后台返回值,创建表格,表头第一行为26英文字母取当前表头长度,即为A-Z的截止字母,之后每一行都可展示返回内容,第一列即数字下标顺序,其余内容需要根据返回对象的相关参数合并表格,每一个数组,即为每一行数据拖拽主要用到了原生拖拽APIdrag的相关方法,可拖拽的标签需要指定draggable为true,在拖拽起始dragstart中,赋值当前拖拽节点的相关属性,例如title,id(可在拖拽结束后拿到当前拖拽节点信息,即drop放下鼠标事件),拖动过程中(dragover),在指定可drop区域会显示提示样式,提示可放下鼠标操作,在拖拽过程中,需要指定相关节点,即表头第一行,拖拽结束后(dragend)需要移除相关类名或事件删除已拖动到指定区域的标签,需要同时清空相关样式,把同时比对当前删除数据,恢复起始位置指定数据,切换期末数据形式,需要清空所有已拖动节点同时恢复起始位置数据3、根据前端拖动选择的参数,进行模版组装,主要包含模版识别策略,必须的key值对应的列信息,可以是表头也是可以列数,针对每一列数据进行的处理策略,如删除特殊符号,科学计数法转换,替换特殊符号等。4、根据组装模版进行数据读取,如果读取成功则将组装的模版加入模版库即将对应的模版数据信息插入模版配置表和模版属性读取配置表,生成新的模版数据,供后续用户及自己再次使用。S4:自动记录模版及模版热度;考虑到数据迁移一般是多家企业由A系统迁移到B系统,多家企业的原财务数据格式一致即模版一致,模版本文档来自技高网...
【技术保护点】
1.一种基于模版智能学习的财务数据初始化系统,其特征在于:包括:/n获取原系统数据端,用于获取原系统数据文件;/n初始化数据生成端,用于生成初始化数据,包括导入模块、识别模块、解析模块、统一数据模块、数据读取模块以及初始化数据生成模块;/n管理确认终端,用于用户人工校验确认。/n
【技术特征摘要】
1.一种基于模版智能学习的财务数据初始化系统,其特征在于:包括:
获取原系统数据端,用于获取原系统数据文件;
初始化数据生成端,用于生成初始化数据,包括导入模块、识别模块、解析模块、统一数据模块、数据读取模块以及初始化数据生成模块;
管理确认终端,用于用户人工校验确认。
2.如权利要求1所述的一种基于模版智能学习的财务数据初始化系统,其特征在于:所述获取原系统数据端包括自动下载模块和手动下载模块,所述自动下载模块用于自动下载原系统数据文件,所述手动下载模块
如权利要求1所述的一种基于模版智能学习的财务数据初始化系统,其特征在于:所述导入模块与所述获取原系统数据端数据相连,用于将获取的原系统数据文件导入到新系统中;
所述识别模块,用于模版数据识别判断所述数据文件的类型,所述文件类型包括excel、xml、html和pdf;
所述解析模块,包括匹配解析模块和手动解析模块,所述匹配解析模块用于所述识别模块识别成功的模版数据的解析,所述手动解析模块用于手动选择解析方式,解析识别模块识别失败的模版数据;
所述统一数据模块与所述解析模块数据连接,所述解析模块将所述数据文件解析成统一JSON格式数据,并收录到所述同一数据模块中;
所述数据读取模块与所述统一数据模块数据相连,读取所述JSON格式数据;
所述初始化数据生成模块用于将数据读取模块读取的数据生成初始化数据并进入新系统的管理确认终端。
3.如权利要求3所述的一种基于模版智能学习的财务数据初始化系统,其特征在于:所述数据读取模块中还具有智能过滤模块,所述智能过滤模块用于智能过滤非必要数据以及对有用数据按照配置规则进行清洗,所述数据读取模块读取的JSON格式数据是所述智能过滤模块过滤后的数据文件,所述配置规则分为对单个内容进行处理,以及对全局数据进行对比分析后处理。
4.如权利要求3所述的一种基于模版智能学习的财务数据初始化系统,其特征在于:所述手动...
【专利技术属性】
技术研发人员:窦友斌,刘禄,郑强南,
申请(专利权)人:南京云帐房网络科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。