一种Excel文件解析方法技术

技术编号:18444833 阅读:13 留言:0更新日期:2018-07-14 10:20
本发明专利技术提供一种Excel文件解析方法,包括:S1,应用Apache POI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,文件信息至少包括目标Excel文件的唯一标识和文件名称;标题信息至少包括目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;内容信息包括目标Excel文件的唯一标识、每一列名对应列的单元格数据和每一单元格数据对应的行数;S2,将文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表。本发明专利技术提供的一种Excel文件解析方法,将Excel文件拆分为三个部分进行解析,有效分析了Excel文件,减少了时间成本,提高了批量解析效率。

A Excel file parsing method

The present invention provides an Excel file parsing method, including: S1, using Apache POI to extract file information, title information, and content information of the target Excel file, in which the file information includes at least the unique identification and file name of the target Excel file, and the title information is less including the unique identification of the target Excel file, Each column name and the number of rows corresponding to each of the listed names; the content information includes the unique identity of the target Excel file, the cell data of each column of the corresponding column and the number of rows corresponding to each cell's data; S2, records the file information, title information, and content information into the file information table, the title information table and the content. Information table. The invention provides an analytic method of Excel file, which is divided into three parts to analyze the Excel file, effectively analyze the Excel file, reduce the time cost and improve the efficiency of batch analysis.

【技术实现步骤摘要】
一种Excel文件解析方法
本专利技术涉及数据解析
,尤其涉及一种Excel文件解析方法。
技术介绍
ApachePOI是应用Java编写的免费开源的跨平台的JavaAPI,ApachePOI提供API给Java程式对MicrosoftOffice格式档案读和写的功能,特别是Java操作Excel解决方案。目前,应用ApachePOI对Excel文件进行解析已经成为Excel解析的主流方法。然而,随着项目中越来越多Excel文件的批量导入,针对单个Excel处理的工作量也越来越大。目前基于ApachePOI的Excel解析方法大都基于Excel文件整体进行,大量的解析程序耗时耗力,给批量Excel文件的解析带来了挑战。
技术实现思路
本专利技术为解决现有技术中存在的Excel文件解析方法费时费力的问题,提供了一种Excel文件解析方法。一方面,本专利技术提出一种Excel文件解析方法,包括:S1,应用ApachePOI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称;所述标题信息至少包括所述目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数;S2,将所述文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表中。优选地,所述文件信息还包括所述目标Excel文件的文件类型、文件大小和文件位置中的至少一种。优选地,任一列对应的列名的获取方法包括:顺序读取所述目标Excel文件中包含数据的第一行单元格,并根据预先设定的命名规则和任一所述单元格的列号设置所述任一单元格所在列的列名。优选地,所述文件类型至少包括:.xlsx和.xls。优选地,还包括:S3,应用所述文件信息表、标题信息表和内容信息表对所述目标Excel文件进行分析。另一方面,本专利技术提出一种Excel文件解析装置,包括:信息提取模块,用于应用ApachePOI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称;所述标题信息至少包括所述目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数;信息录入模块,用于将所述文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表中。优选地,所述文件信息还包括所述目标Excel文件的文件类型、文件大小和文件位置中的至少一种。再一方面,本专利技术提出一种Excel文件解析设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。又一方面,本专利技术提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如前所述的方法。本专利技术提供的一种Excel文件解析方法,将目标Excel文件拆分为三个部分进行解析,在对Excel文件进行了有效分析的基础上,减少了时间成本,提高了批量解析效率。附图说明图1为本专利技术具体实施例的一种Excel文件解析方法的流程示意图;图2为本专利技术具体实施例的一种Excel文件解析装置的结构示意图;图3为本专利技术具体实施例的一种Excel文件解析设备的结构示意图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。图1为本专利技术具体实施例的一种Excel文件解析方法的流程示意图,如图1所示,一种Excel文件解析方法,S1,应用ApachePOI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称;所述标题信息至少包括所述目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数;S2,将所述文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表中。具体地,ApachePOI是应用Java编写的免费开源的跨平台的JavaAPI,应用ApachePOI能够对Excel文件进行解析。区别于传统的ApachePOI对Excel文件整体进行解析的方法。本专利技术具体实施例中对目标Excel文件进行拆分,将目标Excel文件拆分为三个部分进行解析,所述三个部分对应提取的分别是所述目标Excel文件的文件信息、标题信息和内容信息。其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称。所述唯一标识是所述目标Excel文件在系统中对应的全局唯一标识(globallyuniqueidentifier,GUID),即通过特定算法为所述目标Excel文件创建的一个唯一标识码。所述目标Excel文件的唯一标识同样包含在所述标题信息和内容信息中,用于识别所述标题信息和内容信息对应的Excel文件。所述标题信息至少包括所述目标Excel文件的唯一标识、所述目标Excel文件中每一列对应的列名以及每一所述列名对应的行数。因而所述标题信息中包括了所述Excel文件中每一列的列名以及所述每一列列名在所述Excel文件中的位置,即所述每一列列名对应的行数。所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数。因而所述内容信息中包括了所述Excel文件中每一单元格的数据以及所述每一单元格数据在所述目标Excel文件中的位置,即所述每一单元格数据对应的列名和行数。在应用ApachePOI对目标Excel文件中的文件信息、标题信息和内容信息进行提取后,对应将所述文件信息录入文件信息表,标题信息录入标题信息表,内容信息录入内容信息表,完成所述目标Excel文件的解析。本专利技术具体实施例中,将目标Excel文件拆分为三个部分进行解析,在对Excel文件进行了有效分析的基础上,减少了时间成本,提高了批量解析效率。基于上述具体实施例,一种Excel文件解析方法,所述文件信息还包括所述目标Excel文件的文件类型、文件大小和文件位置中的至少一种。具体地,所述文件信息在包括所述目标Excel文件的唯一标识和文件名称的同时,还包括了所述目标Excel文件的文件类型、文件大小和文件位置中的至少一种。基于上述任一具体实施例,一种Excel文件解析方法,每列对应的列名的获取方法包括:顺序读取所述目标Excel文件中包含数据的第一行单元格,并根据预先设定的命名规则和任一所述单元格的列号设置所述任一单元格所在列的列名。具体地,顺序读取所述目标Excel文件中存在数据的第一行单元格,根据获取的第一行的各个单元格的列号,应用预先设定的命名规则,对各个单元格所属的列进行命名。例如,假设所述目标Excel文件中100列数据,获取所述目标Exc本文档来自技高网...

【技术保护点】
1.一种Excel文件解析方法,其特征在于,包括:S1,应用ApachePOI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称;所述标题信息至少包括所述目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数;S2,将所述文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表中。

【技术特征摘要】
1.一种Excel文件解析方法,其特征在于,包括:S1,应用ApachePOI分别提取目标Excel文件的文件信息、标题信息和内容信息;其中,所述文件信息至少包括所述目标Excel文件的唯一标识和文件名称;所述标题信息至少包括所述目标Excel文件的唯一标识、每列对应的列名和每一所述列名对应的行数;所述内容信息包括所述目标Excel文件的唯一标识、每一所述列名对应列的单元格数据和每一所述单元格数据对应的行数;S2,将所述文件信息、标题信息和内容信息对应录入文件信息表、标题信息表和内容信息表中。2.根据权利要求1所述的方法,其特征在于,所述文件信息还包括所述目标Excel文件的文件类型、文件大小和文件位置中的至少一种。3.根据权利要求1所述的方法,其特征在于,任一列对应的列名的获取方法包括:顺序读取所述目标Excel文件中包含数据的第一行单元格,并根据预先设定的命名规则和任一所述单元格的列号设置所述任一单元格所在列的列名。4.根据权利要求2所述的方法,其特征在于,所述文件类型至少包括.xlsx和.xls。5.根据权利要求1所述的方法,其特征在于,还包括:S3,应用所述文件信息表、标题信息表和内容信息表对所述目标Excel文...

【专利技术属性】
技术研发人员:安焕龙
申请(专利权)人:北京市天元网络技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1