基于Excel格式的数据提取系统及配置方法技术方案

技术编号:24091206 阅读:44 留言:0更新日期:2020-05-09 08:09
本发明专利技术涉及数据处理的技术领域,具体公开了一种基于Excel格式的数据提取系统及配置方法,系统包括依次连接的模板生成单元、模板匹配单元、数据提取单元。方法包括:首先通过模板生成单元生成多个模板,通过模板定义需要提取的数据以及数据间的关系,然后上传Excel数据文件,并将Excel数据文件与各模板依次进行匹配,以确定匹配值最高的模板,通过数据提取单元以具有最高匹配值的模板从Excel数据文件中提取对应的有效数据,从而实现了从Excel数据文件提取数据,本发明专利技术提供的基于Excel格式的数据提取系统及配置方法,代替了人工手动录入,提高了据导入效率,简化了流程,同时也降低了错误率。

Data extraction system and configuration method based on Excel format

【技术实现步骤摘要】
基于Excel格式的数据提取系统及配置方法
本专利技术涉及数据处理的
,尤其是涉及一种基于Excel格式的数据提取系统及配置方法。
技术介绍
互联网信息时代的今天,计算机数据处理代替了人工办公,但是,在某些系统的某些场景中,需要通过Excel表格导入数据到系统中。现有的导入方式是提供固定的模板,用户仍需通过依次填充数据后再导入应用系统中。比如,在学生管理系统中,需要将全班学生的姓名、性别、学号等信息导入,现有的导入方式是需要在学生管理系统中建立固定的模板,然后将全班学生的姓名、性别、学号等信息依次输入至模板中;又如在进出口货物装船出运前,均需向海关进行申报,同一属性的数据(即同一货物申报的数据)均包括箱单、发票、运单、合同等多种数据,在向系统中导入相关数据时,也是需要在管理系统中建立固定的模板,然后将需要的数据依次输入至模板中以实现数据的导入。以上操作不仅繁琐,耗时耗力,而且容易出错。
技术实现思路
针对现有技术存在的不足,本专利技术的目的之一是提供一种基于Excel格式的数据提取系统,其能够提高数据导入效率,本文档来自技高网...

【技术保护点】
1.基于Excel格式的数据提取系统,其特征在于,包括:/n模板生成单元(1),以定义需要提取的数据,以及数据间的关系,生成多个模板;/n模板匹配单元(2),用于将Excel数据文件与模板生成单元(1)生成的各模板进行匹配,以期确定匹配值最高的模板;/n数据提取单元(3),与所述模板匹配单元(2)连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。/n

【技术特征摘要】
1.基于Excel格式的数据提取系统,其特征在于,包括:
模板生成单元(1),以定义需要提取的数据,以及数据间的关系,生成多个模板;
模板匹配单元(2),用于将Excel数据文件与模板生成单元(1)生成的各模板进行匹配,以期确定匹配值最高的模板;
数据提取单元(3),与所述模板匹配单元(2)连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。


2.根据权利要求1所述的基于Excel格式的数据提取系统,其特征在于,所述模板生成单元(1)包括:
字段定义单元(11),定义参照物,并结合正则表达式以定义需要提取的数据的“点”位;
列表定义单元(12),定义需要提取的数据的区域;
自用列表定义单元(13),结合定义参照物,以及定义需要提取的数据的区域以确定所述提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系。


3.根据权利要求1所述的基于Excel格式的数据提取系统,其特征在于,还包括:
数据结构化处理单元(4),分别对数据提取单元(3)提取的有效数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
数据内容规则模块(5),预先设定有多种类型标准模型,并分配有对应的类型库(51),按照类型标准模型对数据结构化处理单元(4)生成的各中间文件进行分类别存储。


4.根据权利要求3所述的基于Excel格式的数据提取系统,其特征在于,还包括:
数据存储规则单元(6),预先设定有最终所需输出数据文件的标准结构;
数据输出单元(7),分别与所述数据内容规则模块(5)及所述数据存储规则单元(6)连接,以输出与数据存储规则单元(6)设定的标准结构数据。


5.基于Excel格式的数据提取方法,其特征在于,包括以下步骤:
S1:模板制作,通过模板定义需要提取的数据,以及数据间的关系,其中,包括若干...

【专利技术属性】
技术研发人员:吴非陆欢旺徐剑刚
申请(专利权)人:上海三稻智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1