【技术实现步骤摘要】
一种Excel数据整合分析系统和方法
本专利技术涉及数据处理、检索和比对的分析系统,特别涉及一种对Excel数据进行整合后的自定义检索与灵活碰撞比对的分析系统及方法。
技术介绍
随着信息技术的快速发展及办公自动化业务的全面普及,在各个行业、不同业务单位都积累了大量Excel数据,这些Excel数据存储分散又相互独立。如何实现对这些excel数据进行有效整合和处理,对处理后数据进行高效检索和灵活分析,进而发现数据之间的隐性关系以及数据内部深层次的价值,是当前急需解决的问题。为了解决这些问题,当市场上出现了多种Excel数据分析系统,比如Excel数据管理系统(主要实现Excel数据分类上传管理)、excel数据接入系统(主要实现excel数据分类存储)、excel数据检索系统(主要实现Excel数据的整合入库并按关键词搜索)等。但上述系统主要原理都基于excle数据分类管理与存储、按条件检索整合后的数据;最终获取的数据是一个或多个独立文件或者独立存储的数据,很难发现文件内容之间的关联关系,更难以发现多个Excel文件之间的数据关联关系。因此,这些Excel数据应用分析系统不能很好满足业务的实际需求,不能获知Excel数据之间的关联性,也难以发现多个Excel数据之间隐藏的深层次关联关系。现有技术中也公开了数据灵活比对方面的内容,例如专利CN104731814A。然而,专利CN104731814A进行比对的数据来源是任意关系数据库,需要首先在数据库中存储符合设定格式的相关数据,再进行比对;比对的结果可以作 ...
【技术保护点】
1.一种excel数据整合分析系统,其特征在于,该系统包括:/n应用体系(2)用于对接入系统的excel数据进行数据处理,包括资源表定义模块(21)、文件规则配置模块(22)、导入任务配置模块(23)、导入任务监控模块(24)和比对规则配置模块(25);/n展现体系(1)用于自定义数据检索和数据比对处理,其包括资源数据检索模块(11)和资源数据比对模块(12);/n数据体系(3)用于存储接入系统的excel数据、系统处理数据的任务记录和系统设定的规则配置,包括系统资源库(31)、系统配置库(32)和系统规则库(33)。/n
【技术特征摘要】
1.一种excel数据整合分析系统,其特征在于,该系统包括:
应用体系(2)用于对接入系统的excel数据进行数据处理,包括资源表定义模块(21)、文件规则配置模块(22)、导入任务配置模块(23)、导入任务监控模块(24)和比对规则配置模块(25);
展现体系(1)用于自定义数据检索和数据比对处理,其包括资源数据检索模块(11)和资源数据比对模块(12);
数据体系(3)用于存储接入系统的excel数据、系统处理数据的任务记录和系统设定的规则配置,包括系统资源库(31)、系统配置库(32)和系统规则库(33)。
2.根据权利要求1所述的数据整合分析系统,其特征在于,所述应用体系(2)中,
资源表定义模块(21),其用于对接入整合分析系统的excel数据配置资源数据表和数据字段,同时设定数据字段的使用属性;
文件规则配置模块(22),其用于对接入整合分析系统的excel数据配置数据项;所述数据项包括在excel数据中数据表头或数据分类下的数据内容和位置信息;
导入任务配置模块(23),其用于对资源表定义模块(21)传送的数据字段配置信息与文件规则配置模块(22)传递的数据项信息进行关系映射,映射关系作为导入数据任务传送至导入任务监控模块(24);
导入任务监控模块(24),其用于根据导入任务配置模块(23)传送的导入数据任务提取excel数据中包括内容信息和位置信息的数据项信息,并根据导入数据任务中的映射关系关联数据项和资源数据表中的数据字段;
比对规则配置模块(25),其用于接收资源表定义模块(21)传送的资源数据表及数据字段信息,基于数据内容和业务需求,设置不同资源数据表及数据字段之间的数据字段比对信息。
3.根据权利要求1或2所述的数据整合分析系统,其特征在于,
所述资源表定义模块(21)包括:
数据表配置子模块,其用于对接入整合分析系统的excel数据配置资源数据表;
数据字段配置子模块,其用于对接入整合分析系统的excel数据配置数据字段信息,同时在配置数据字段时定义数据字段的使用属性;
优选地,文件规则配置模块(22)包括:
规则名称配置子模块,其用于配置数据项的文件规则名称和规则描述,以便系统存储和查找;
数据项配置子模块,其用于配置接入系统的excel数据的数据项内容信息和位置信息;
优选地,比对规则配置模块(25)包括,
比对规则名称子模块,其用以配置和存储数据比对规则的名称;
数据过滤子模块,其用于配置不同资源数据表比对时的检索字段;优选地,在数据过滤时,在比对的资源数据表中分别设置过滤条件或检索字段;
数据碰撞子模块,其用于关联数据过滤子模块过滤出的比对的资源数据表中的数据字段;
数据输出子模块,其用于配置数据碰撞结果的输出条件,优选将数据碰撞结果输出或传送至资源数据比对模块12。
4.根据权利要求1或2所述的数据整合分析系统,其特征在于,所述资源表定义模块(21)生产的资源数据表与数据字段信息分别存放于资源数据表与资源字段表中;
优选地,资源数据表中包括主键表标识、表名称和表描述信息;资源字段表包括主键字段标识、字段名称、字段类型、使用类别和表标识信息;
文件规则配置模块(22)产生的信息存放于接入文件规则表,其包括主键接入规则标识、规则名称、规则描述、数据项名称、数据项位置、文件路径和使用状态信息;
导入任务配置模块(23)产生的信息存放于导入任务配置表,其包括主键任务标识、任务名称、字段标识、数据项名称、表标识、接入规则标识和使用状态信息;
导入任务监控模块(24)产生的信息存放于导入任务监控表,其包括主键监控任务标识、任务状态、执行方式、执行状态、执行进度、任务标识、任务处理开始时间和任务处理结束时间;
比对规则配置模块(25)产生的信息存放于比对规则配置表,其包括主键比对规则标识、比对规则名称、表标识、过滤条件、碰撞条件和输出条件。
5.根据权利要求1所述的数据整合分析系统,其特征在...
【专利技术属性】
技术研发人员:尚林林,
申请(专利权)人:北京宸瑞科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。