System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种文件解析方法、装置和设备。
技术介绍
1、随着数据处理技术的发展,文件解析在检测、金融、电商、物流等领域具有广泛的应用场景,在处理大量数据的需求上显得尤为重要。因此,如何准确地解析文件对用户来说是至关重要的。
2、相关技术中,主要采用人工解析的方式来解析文件中的数据,但是这种方式会导致解析文件的准确性较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高文件解析准确性的文件解析方法、装置和设备。
2、第一方面,本申请提供了一种文件解析方法,包括:
3、获取待解析文件的目标文件格式;
4、根据目标文件格式从多个候选文件格式中确定与目标文件格式对应的目标解析方式;
5、根据目标文件格式从多个候选解析规则中确定与目标文件格式对应的目标解析规则;其中,各候选解析规则用于指示需要解析的文件信息和字段信息;
6、根据目标解析方式和目标解析规则对待解析文件进行解析,得到文件解析信息。
7、在其中一个实施例中,若目标文件格式包括xml格式,目标解析方式包括预设接口解析方式,根据目标解析方式和目标解析规则对待解析文件进行解析,得到文件解析信息,包括:
8、根据目标解析规则调用预设接口对待解析文件进行解析,得到文件解析信息。
9、在其中一个实施例中,若目标文件格式包括pdf格式,目标解析方式包括预设组件解析方式,根据目标解析方式和目标解析规则对
10、根据目标解析规则调用预设组件对待解析文件进行解析,得到文件解析信息。
11、在其中一个实施例中,若目标文件格式excel格式或者csv格式,目标解析方式包括预设工具解析方式,根据目标解析方式和目标解析规则对待解析文件进行解析,得到文件解析信息,包括:
12、根据目标解析规则调用预设工具对待解析文件进行解析,得到文件解析信息。
13、在其中一个实施例中,根据目标解析规则调用预设工具对待解析文件进行解析,得到文件解析信息,包括:
14、根据目标解析规则调用预设工具创建待解析文件对应的工作薄对象,并获取工作薄对象中的各工作表对象;
15、使用循环结构遍历各工作表对象中的各行对象中的各单元对象,并根据各单元对象的类型对各单元对象执行相应的操作,得到文件解析信息。
16、在其中一个实施例中,根据目标解析规则调用预设工具对待解析文件进行解析,得到文件解析信息,包括:
17、根据目标解析规则调用预设工具创建监听器和待解析文件对应的阅读器对象;
18、根据监听器对阅读器对象中的各行数据进行解析处理,得到文件解析信息。
19、在一个实施例中,获取待解析文件的目标文件格式,包括:
20、对待解析文件进行完整性分析,得到完整性分析结果;
21、在完整性分析结果用于指示待解析文件存在修改的情况下,执行获取待解析文件的目标文件格式的步骤。
22、在一个实施例中,目标解析规则还用于指示文件解析信息的存储方式,方法还包括:
23、对文件解析信息进行非对称加密,得到加密后的文件解析信息;
24、按照存储方式存储加密后的文件解析信息。
25、第二方面,本申请还提供了一种文件解析装置,包括:
26、获取模块,用于获取待解析文件的目标文件格式;
27、第一确定模块,用于根据目标文件格式从多个候选文件格式中确定与目标文件格式对应的目标解析方式;
28、第二确定模块,用于根据目标文件格式从多个候选解析规则中确定与目标文件格式对应的目标解析规则;其中,各候选解析规则用于指示需要解析的文件信息和字段信息;
29、解析模块,用于根据目标解析方式和目标解析规则对待解析文件进行解析,得到文件解析信息。
30、第三方面,本申请还提供了一种文件解析设备,该文件解析设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时以实现上述第一方面的方法的步骤。
31、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面的方法的步骤。
32、第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面的方法的步骤。
33、上述文件解析方法、装置和设备,通过获取待解析文件的目标文件格式;并根据目标文件格式从多个候选文件格式中确定与目标文件格式对应的目标解析方式。进一步地,根据目标文件格式从多个候选解析规则中确定与目标文件格式对应的目标解析规则;其中,各解析规则用于指示需要解析的文件信息和字段信息。进一步地,根据目标解析方式和目标解析规则对待解析文件进行解析,得到文件解析信息。本申请实施例通过获取待解析文件的目标文件格式,可以更加准确地获得文件的格式类型,有利于后续的解析过程。进一步地,根据目标文件格式从多个候选文件格式中确定与目标文件格式对应的目标解析方式,以及从多个候选解析规则中确定与目标文件格式对应的目标解析规则的方式,通过选择适合目标文件的解析方式和灵活配置的解析规则对待解析文件进行解析,可以提取出文件中的关键信息,有利于提高文件解析的效率和准确性。
本文档来自技高网...【技术保护点】
1.一种文件解析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,若所述目标文件格式包括XML格式,所述目标解析方式包括预设接口解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
3.根据权利要求1所述的方法,其特征在于,若目标文件格式包括PDF格式,所述目标解析方式包括预设组件解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
4.根据权利要求1所述的方法,其特征在于,若目标文件格式EXCEL格式或者CSV格式,所述目标解析方式包括预设工具解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标解析规则调用预设工具对所述待解析文件进行解析,得到所述文件解析信息,包括:
6.根据权利要求4所述的方法,其特征在于,所述根据所述目标解析规则调用预设工具对所述待解析文件进行解析,得到
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述获取待解析文件的目标文件格式,包括:
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述目标解析规则还用于指示文件解析信息的存储方式,所述方法还包括:
9.一种文件解析装置,其特征在于,所述装置包括:
10.一种文件解析设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任意一项所述方法的步骤。
...【技术特征摘要】
1.一种文件解析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,若所述目标文件格式包括xml格式,所述目标解析方式包括预设接口解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
3.根据权利要求1所述的方法,其特征在于,若目标文件格式包括pdf格式,所述目标解析方式包括预设组件解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
4.根据权利要求1所述的方法,其特征在于,若目标文件格式excel格式或者csv格式,所述目标解析方式包括预设工具解析方式,所述根据所述目标解析方式和所述目标解析规则对所述待解析文件进行解析,得到所述文件解析信息,包括:
5.根据...
【专利技术属性】
技术研发人员:黄学民,赵兴梁,田方园,马叔阳,牛峥,谭华安,刘博林,庄小亮,关启元,陈宇涛,马业林,曾丽,
申请(专利权)人:中国南方电网有限责任公司超高压输电公司广州局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。