【技术实现步骤摘要】
基于Excel格式的数据提取系统及配置方法
本专利技术涉及数据处理的
,尤其是涉及一种基于Excel格式的数据提取系统及配置方法。
技术介绍
互联网信息时代的今天,计算机数据处理代替了人工办公,但是,在某些系统的某些场景中,需要通过Excel表格导入数据到系统中。现有的导入方式是提供固定的模板,用户仍需通过依次填充数据后再导入应用系统中。比如,在学生管理系统中,需要将全班学生的姓名、性别、学号等信息导入,现有的导入方式是需要在学生管理系统中建立固定的模板,然后将全班学生的姓名、性别、学号等信息依次输入至模板中;又如在进出口货物装船出运前,均需向海关进行申报,同一属性的数据(即同一货物申报的数据)均包括箱单、发票、运单、合同等多种数据,在向系统中导入相关数据时,也是需要在管理系统中建立固定的模板,然后将需要的数据依次输入至模板中以实现数据的导入。以上操作不仅繁琐,耗时耗力,而且容易出错。
技术实现思路
针对现有技术存在的不足,本专利技术的目的之一是提供一种基于Excel格式的数据提取系统,其能 ...
【技术保护点】
1.基于Excel格式的数据提取系统,其特征在于,包括:/n模板生成单元(1),以定义需要提取的数据,以及数据间的关系,生成多个模板;/n模板匹配单元(2),用于将Excel数据文件与模板生成单元(1)生成的各模板进行匹配,以期确定匹配值最高的模板;/n数据提取单元(3),与所述模板匹配单元(2)连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。/n
【技术特征摘要】
1.基于Excel格式的数据提取系统,其特征在于,包括:
模板生成单元(1),以定义需要提取的数据,以及数据间的关系,生成多个模板;
模板匹配单元(2),用于将Excel数据文件与模板生成单元(1)生成的各模板进行匹配,以期确定匹配值最高的模板;
数据提取单元(3),与所述模板匹配单元(2)连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。
2.根据权利要求1所述的基于Excel格式的数据提取系统,其特征在于,所述模板生成单元(1)包括:
字段定义单元(11),定义参照物,并结合正则表达式以定义需要提取的数据的“点”位;
列表定义单元(12),定义需要提取的数据的区域;
自用列表定义单元(13),结合定义参照物,以及定义需要提取的数据的区域以确定所述提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系。
3.根据权利要求1所述的基于Excel格式的数据提取系统,其特征在于,还包括:
数据结构化处理单元(4),分别对数据提取单元(3)提取的有效数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
数据内容规则模块(5),预先设定有多种类型标准模型,并分配有对应的类型库(51),按照类型标准模型对数据结构化处理单元(4)生成的各中间文件进行分类别存储。
4.根据权利要求3所述的基于Excel格式的数据提取系统,其特征在于,还包括:
数据存储规则单元(6),预先设定有最终所需输出数据文件的标准结构;
数据输出单元(7),分别与所述数据内容规则模块(5)及所述数据存储规则单元(6)连接,以输出与数据存储规则单元(6)设定的标准结构数据。
5.基于Excel格式的数据提取方法,其特征在于,包括以下步骤:
S1:模板制作,通过模板定义需要提取的数据,以及数据间的关系,其中,包括若干...
【专利技术属性】
技术研发人员:吴非,陆欢旺,徐剑刚,
申请(专利权)人:上海三稻智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。