一种文件处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:36782079 阅读:10 留言:0更新日期:2023-03-08 22:18
本申请实施例公开了一种文件处理方法、装置、电子设备及可读存储介质,该方法包括:获取待处理的第一文件;解析第一文件,确定第一文件对应的第一标识信息;在检测到预设处理模型中包括与第一标识信息对应的第一知识库的情况下,将第一文件输入至预设处理模型,基于第一知识库对第一文件进行处理,得到第二文件;其中,预设处理模型根据至少一个知识库构建,至少一个知识库包括第一知识库。至少一个知识库包括第一知识库。至少一个知识库包括第一知识库。

【技术实现步骤摘要】
一种文件处理方法、装置、电子设备及可读存储介质


[0001]本申请属于信息处理
,尤其涉及一种文件处理方法、装置、电子设备及可读存储介质。

技术介绍

[0002]目前,由于系统开发总是落后经营管理需求。人们不得不从多个系统中手动导出数据,然后手工处理各类报表文件。对于海量的且复杂的文件处理时,常面临信息不统一的问题和文件格式变化大的问题等,导致处理时间长,而且处理准确度低。
[0003]由此,目前的文件处理效率低。

技术实现思路

[0004]本申请实施例提供一种文件处理方法、装置、设备及可读存储介质,能够解决目前的文件处理效率低的问题。
[0005]第一方面,本申请实施例提供一种文件处理方法,该方法包括:
[0006]获取待处理的第一文件;
[0007]解析第一文件,确定第一文件对应的第一标识信息;
[0008]在检测到预设处理模型中包括与第一标识信息对应的第一知识库的情况下,将第一文件输入至预设处理模型,基于第一知识库对第一文件进行处理,得到第二文件;
[0009]其中,预设处理模型根据至少一个知识库构建,至少一个知识库包括第一知识库。
[0010]第二方面,本申请实施例提供一种文件处理装置,该装置包括:
[0011]获取模块,用于获取待处理的第一文件;
[0012]解析模块,用于解析第一文件,确定第一文件对应的第一标识信息;
[0013]处理模块,用于在检测到预设处理模型中包括与第一标识信息对应的第一知识库的情况下,将第一文件输入至预设处理模型,基于第一知识库对第一文件进行处理,得到第二文件;
[0014]其中,预设处理模型根据至少一个知识库构建,至少一个知识库包括第一知识库。
[0015]第三方面,本申请实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时,实现如第一方面或者第一方面的任一可能实现方式中的方法。
[0016]第四方面,本申请实施例提供了一种可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。
[0017]本申请实施例中,通过解析待处理的第一文件,确定第一文件对应的第一标识信息,这里,能够便于后续快速确定出能够处理第一文件的第一知识库,在检测到预设处理模型中包括与第一标识信息对应的第一知识库的情况下,将第一文件输入至根据至少一个知识库构建的预设处理模型,其中,至少一个知识库包括第一知识库。最后,基于第一知识库
对第一文件中的内容进行处理,得到第二文件。这里,能够基于预设处理模型和第一知识库对第一文件进行自动处理,提升文件处理效率。
附图说明
[0018]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本申请实施例提供的一种文件处理方法的流程图;
[0020]图2是本申请实施例提供的一种预设处理模型示意图;
[0021]图3是本申请实施例提供的一种文件处理装置结构示意图;
[0022]图4是本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
[0023]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0024]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0025]本申请实施例提供的文件处理方法至少可以应用于下述应用场景中,下面进行说明。
[0026]由于系统开发总是落后经营管理需求,甚至无法实现。人们不得不从无数系统导出数据,然后手工处理,各类报表文件。对于海量的、复杂的数据处理,常面临以下问题:
[0027]首先,信息不统一的问题。通常,在信息的收集过程中,信息来源多,数据文件名称也多,字段名叫法也不统一。比如:装机竣工数据,就有“表03

开通工单装机清单”、“表04_装维人员开通当日竣工工单钻取”、“表09A

装移机工单退单明细报表”、“服务开通工单列表信息”等很多叫法。其次,单元格合并的问题。单元格合并会导致数据错位,进而导致无法导入数据库。
[0028]然后,还有文件格式变化大的问题。同样一个“装机在途清单”,随着时间的推进,可能某一天是53行,某一天就是105行,某一天是csv格式,某一天可能就是xls格式或者是xlsx格式。版本则从XP到2016不一而足。最后,还有数据差异大的问题。比如某文件是“731xxxx”,另一个文件是“|731xxxx”,或者“_731xxxx”、“731xxxx”。在很多行业、很多领域
都存在类似的情况。
[0029]基于上述应用场景,下面对本申请实施例提供的文件处理方法进行详细说明。
[0030]图1为本申请实施例提供的一种文件处理方法的流程图。
[0031]如图1所示,该文件处理方法可以包括步骤110

步骤130,该方法应用于文件处理装置,具体如下所示:
[0032]步骤110,获取待处理的第一文件。
[0033]步骤120,解析第一文件,确定第一文件对应的第一标识信息。
[0034]步骤130,在检测到预设处理模型中包括与第一标识信息对应的第一知识库的情况下,将第一文件输入至预设处理模型,基于第一知识库对第一文件进行处理,得到第二文件;其中,预设处理模型根据至少一个知识库构建,至少一个知识库包括第一知识库。
[0035]其中,知识库中包括:用于进行信息清洗的预设对应关系,以及用于进行格式转换的预设格式。知识库中的内容可以根据操作者的输入内容确定。
[0036]本申请实施例提供的文件处理方法中,通过解析待处理的第一文件,确定第一文件对应的第一标识信息,这里,能够便于后续快速确定出能够处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,其特征在于,所述方法包括:获取待处理的第一文件;解析所述第一文件,确定所述第一文件对应的第一标识信息;在检测到预设处理模型中包括与所述第一标识信息对应的第一知识库的情况下,将所述第一文件输入至所述预设处理模型,基于所述第一知识库对所述第一文件进行处理,得到第二文件;其中,所述预设处理模型根据至少一个知识库构建,所述至少一个知识库包括所述第一知识库。2.根据权利要求1所述的方法,其特征在于,所述解析所述第一文件,确定所述第一文件对应的第一标识信息,包括:在所述第一文件中的关键字与预设关键字相匹配的情况下,确定所述预设关键字对应的标识信息;将所述预设关键字对应的标识信息确定为所述第一标识信息。3.根据权利要求1所述的方法,其特征在于,所述在检测到预设处理模型中包括与所述第一标识信息对应的第一知识库的情况下,将所述第一文件输入至所述预设处理模型,基于所述第一知识库对所述第一文件进行处理,得到第二文件,包括:将所述第一文件输入至所述预设处理模型,基于所述第一知识库识别所述第一文件中的第一信息和第二信息;对所述第一文件中的所述第一信息进行格式转换处理,以及对所述第一文件中的所述第二信息进行信息清洗处理,得到所述第二文件。4.根据权利要求3所述的方法,其特征在于,所述第一知识库包括预设格式和预设对应关系,所述对所述第一文件中的所述第一信息进行格式转换处理,以及对所述第一文件中的所述第二信息进行信息清洗处理,得到所述第二文件,包括:基于所述预设格式,对所述第一文件中的所述第一信息进行格式转换处理,得到第三文件,所述第三文件中包括所述预设格式的第三信息,所述第一信息对应的语义信息和所述第三信息对应的语义信息一致;基于所述预设对应关系,将所述第三文件中的所述第二信息替换为第四信息,得到所述第二文件,其中,所述预设对应关系包括互相对应的所述第二信息和所述第四信息。5.根据权利要求1所述的方法,其特征在于,所述在检测到预设处理模型中包括与所述第一标识信息对应的第一知识库的情况下,将所述第一文件输入至所述预设处理模型,基于所述第一知识库对所述...

【专利技术属性】
技术研发人员:陈知生陈迎昕
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1