一种基于JAVA语言的Excel表格导入方法和系统技术方案

技术编号:38864752 阅读:25 留言:0更新日期:2023-09-17 10:05
本发明专利技术公开了一种基于JAVA语言的Excel表格导入方法和系统,所述方法包括初始配置步骤,完成初始配置,获得解析组件;接收文件步骤,接收待处理的Excel文件,所述Excel文件包含多媒体文件和非多媒体文件;第一解析步骤,基于所述解析组件,对所述多媒体文件进行解析获得第一集合;第二解析步骤,基于所述解析组件,对所述非多媒体文件进行解析获得第一数据,基于所述第一数据与所述第一集合获得第二集合;导入步骤,获取待导入所述第二集合的File文件,将所述第二集合填装到所述File文件中。本发明专利技术可以解析带有多媒体文件的Excel表格文件,可以将Excel表格文件解析的数据导入到File文件中,同时实现了快速查找、修改和删除Excel表格数据等,提高了用户体验。提高了用户体验。提高了用户体验。

【技术实现步骤摘要】
一种基于JAVA语言的Excel表格导入方法和系统


[0001]本专利技术涉及数据处理领域,具体地,涉及一种基于JAVA语言的Excel表格导入方法和系统。

技术介绍

[0002]在目前的业务办理过程中经常需要使用Excel表格文件,用于数据的存储、加工和转移等,Excel文件里面的数据类型随着需求变得越来越多,比如图像类、文本文件类和视频类等,解析和导入Excel表格文件随着数据类型的多样化变得越来越困难和复杂。在JAVA语言中,目前常用的是Java Excel API和阿里开源的EasyExcel两种方法,一般是将Excel转换成JAVA的输入流进行字段的匹配,读取表头数据形成一个类,再读取表格中与表头数据相匹配的数据,形成有映射关系的列表,通过这个列表实现解析和导入的目的。但Excel的多媒体文件的相应信息保存的位置跟数据内容不一致,Java Excel API仅支持图像类,且只支持识别PNG格式,EasyExcel则暂时不支持解析带多媒体文件的Excel,一般和HuTool POI工具一起使用,但HuTool POI用于单独解析Excel里面的图像类,且只能读取浮动的图像,嵌入单元格的图像无法读取,从而目前的两种方法无法很好的解析和导入带有多媒体文件的Excel表格文件。

技术实现思路

[0003]为了解决在现有技术下无法解析和导入带有多媒体文件的Excel表格文件的问题,本专利技术提供了一种基于JAVA语言的Excel表格导入方法,所述方法包括:初始配置步骤:完成初始配置,获得解析组件;接收文件步骤:接收待处理的Excel文件,所述Excel文件包含多媒体文件和非多媒体文件;第一解析步骤:基于所述解析组件,对所述多媒体文件进行解析获得第一集合;第二解析步骤:基于所述解析组件,对所述非多媒体文件进行解析获得第一数据,基于所述第一数据与所述第一集合获得第二集合;导入步骤:获取待导入所述第二集合的File文件,将所述第二集合填装到所述File文件中。
[0004]配置JAVA语言所需的环境以及导入解析Excel文件所需的解析组件,接收待处理的Excel文件,通过第一解析步骤对Excel文件中的多媒体文件进行解析并将解析获取的多媒体数据存储在第一集合,通过第二解析步骤对所述Excel文件中的非多媒体文件进行解析,并将解析后获取的非多媒体文件数据与所述第一集合一起存储获得第二集合,通过导入步骤获取File文件,将所述第二集合的数据导入到所述File文件,实现解析和导入Excel文件的多种数据格式。
[0005]进一步地,所述初始配置步骤包括配置Spring框架和Apache POI库,配置JAVA的框架和导入解析所述Excel文件所需的组件。
[0006]进一步地,所述接收文件步骤具体包括:通过文件组件获取所述Excel文件;通过表单组件获取所述Excel文件中指定待解析的表单。
[0007]进一步地,所述第一解析步骤具体包括:获取所述表单;通过行组件循环读取所述表单中每一行的行数据;判断所述行数据是否包括所述多媒体文件,若是则将所述多媒体文件的第二数据存储在所述第一集合;所述第一解析步骤用于解析所述多媒体文件。
[0008]进一步地,所述第一解析步骤还包括:通过调用坐标组件获取所述多媒体文件的坐标信息,将所述坐标信息存储在所述第一集合,用于定位所述多媒体文件,方便操作所述多媒体文件;和/或,将所述多媒体文件上传到文件服务器,获得一个包括所述多媒体文件所有属性的对象,所述对象包括唯一标识符,将所述唯一标识符存储在所述第一集合,每一个所述多媒体文件都拥有一个所述唯一标识符,通过所述唯一标识符可快速区分和查找所述多媒体文件;和/或,分类标识所述多媒体文件,将所述多媒体文件分类,通过类别可快速获取所述多媒体文件。
[0009]进一步地,所述第二解析步骤具体包括:获取所述表单;通过所述行组件循环读取所述表单的每一行数据;通过列组件循环读取所述每一行数据的每一列数据;判断所述每一列数据是否为所述多媒体文件,若是则读取所述第一集合中对应的所述第二数据存储在所述第二集合,若否则读取所述非多媒体文件,获得所述第一数据,将所述第一数据存储在所述第二集合。所述第二解析步骤用于解析所述非多媒体文件。
[0010]进一步地,所述第二解析步骤还包括:通过所述行组件读取所述表单的首行数据,判断所述首行数据是否为空,若是则返回空值。
[0011]进一步地,所述第二解析步骤还包括:通过所述行组件获取首行下标和尾行下标,判断所述首行下标与所述尾行下标是否相等,若是则解析所述首行数据,获得所述表单的所有解析数据。
[0012]进一步地,所述导入步骤中的所述File文件获取方式为前端上传获取或后端指定路径创建;所述导入步骤还包括:判断所述File文件的后缀名是否为xlsx或xls,若后缀名是xlsx则调用所述文件组件读取所述File文件的输入流,若后缀名是xls则调用POI文件组件读取所述File文件的输入流,若后缀名不是xlsx或xls则返回空值。对所述File文件不同的文件格式,调用不同的文件组件去读取所述File文件的输入流。
[0013]在实施上述方案的过程中,申请人发现在某些场景下多媒体文件的文本信息有误
需要修改或删除等,用户需要单独提取该多媒体文件利用第三方工具进行修改再导入File文件或Excel文件,过程麻烦且需要消耗一定的时间,为了解决上述问题,专利技术人增加了修改步骤,将多媒体文件的文本信息的转换为可编辑文本,通过修改可编辑文本对多媒体文件的文本信息进行修改,流程简洁且耗时短。
[0014]进一步地,所述方法还包括修改步骤:获取所述多媒体文件;判断所述多媒体文件是否包含文本信息;若是则将所述多媒体文件中的文本信息转换为可编辑文本;基于所述可编辑文本对所述多媒体文件中的文本信息进行修改,用于修改多媒体文件的文本信息。
[0015]在实施上述方案的过程中,申请人发现在某些场景下需要将多媒体文件的文本信息提取出来,例如身份证信息或驾照信息等,用户需要单独提取多媒体文件利用第三方工具进行解析提取,过程麻烦且需要消耗一定的时间,为了解决上述问题,专利技术人增加了提取步骤,将多媒体文件的文本信息进行解析获得文本数据,将文本数据和与多媒体文件的对应关系存储获得文本集合,流程简洁且耗时短。
[0016]进一步地,所述方法还包括提取步骤:获取所述多媒体文件;判断所述多媒体文件是否包含文本信息;若是则将所述文本信息进行解析获得文本数据,将所述文本数据和与所述多媒体文件的对应关系存储获得文本集合,用于读取多媒体文件的文本信息。
[0017]在实施上述方案的过程中,申请人发现在某些场景下将多媒体文件的文本信息提取出来后需要进行翻译操作,为了解决上述问题,专利技术人改进了提取步骤,将解析获得的文本数据进行翻译获得翻译数据,将所述翻译数据和与所述文本数据的对应关系存储获得翻译集合,方便用户进行快速翻译。
[0018]进一步地,所述提取步骤还包括:将所述文本数据进行翻译获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于JAVA语言的Excel表格导入方法,其特征在于,所述方法包括:初始配置步骤:完成初始配置,获得解析组件;接收文件步骤:接收待处理的Excel文件,所述Excel文件包含多媒体文件和非多媒体文件;第一解析步骤:基于所述解析组件,对所述多媒体文件进行解析获得第一集合;第二解析步骤:基于所述解析组件,对所述非多媒体文件进行解析获得第一数据,基于所述第一数据与所述第一集合获得第二集合;导入步骤:获取待导入所述第二集合的File文件,将所述第二集合填装到所述File文件中。2.根据权利要求1所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述初始配置步骤包括配置Spring框架和Apache POI库,获得用于提供解析所述Excel文件的组件。3.根据权利要求1所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述接收文件步骤具体包括:通过文件组件获取所述Excel文件;通过表单组件获取所述Excel文件中指定待解析的表单。4.根据权利要求3所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述第一解析步骤具体包括:获取所述表单;通过行组件循环读取所述表单中每一行的行数据;判断所述行数据是否包括所述多媒体文件,若是则将所述多媒体文件的第二数据存储在所述第一集合。5.根据权利要求4所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述第一解析步骤还包括:通过调用坐标组件获取所述多媒体文件的坐标信息,将所述坐标信息存储在所述第一集合;和/或,将所述多媒体文件上传到文件服务器,获得一个包括所述多媒体文件所有属性的对象,所述对象包括唯一标识符,将所述唯一标识符存储在所述第一集合;和/或,分类标识所述多媒体文件。6.根据权利要求3所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述第二解析步骤具体包括:获取所述表单;通过所述行组件循环读取所述表单的每一行数据;通过列组件循环读取所述每一行数据的每一列数据;判断所述每一列数据是否为所述多媒体文件,若是则读取所述第一集合中对应的所述第二数据存储在所述第二集合,若否则读取所述非多媒体文件,获得所述第一数据,将所述第一数据存储在所述第二集合。
7.根据权利要求6所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述第二解析步骤还包括:通过所述行组件读取所述表单的首行数据;判断所述首行数据是否为空,若是则返回空值。8.根据权利要求7所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述第二解析步骤还包括:通过所述行组件获取首行下标和尾行下标,判断所述首行下标与所述尾行下标是否相等,若是则解析所述首行数据,获得所述表单的所有解析数据。9.根据权利要求1所述的一种基于JAVA语言的Excel表格导入方法,其特征在于,所述导入步骤中的所述File文件获取方式为前端上传获取或后端指定路径创建;所述导入步骤还包括:判断所述File文件的后缀名是否为xlsx或xls,若后缀名是xlsx则调用所述文件组件...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:成都数联云算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1