数据提取方法及装置、存储介质、电子设备制造方法及图纸

技术编号:17141718 阅读:28 留言:0更新日期:2018-01-27 15:46
本公开是关于一种数据提取方法、数据提取装置、计算机可读存储介质及电子设备,涉及数据处理技术领域,该方法包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。该方法简化了数据提取的步骤,进而提高了数据提取效率。

Data extraction methods and devices, storage media, electronic devices

The public is a data extraction method, data extraction apparatus, computer readable storage medium and electronic device, and relates to the technical field of data processing, the method includes: analysis of multiple data items to be counted and determine the node path and the corresponding statistical data items to be; for each of the need to establish a mapping relationship between the statistical data and the node path, and the mapping relationship is stored to the database; query the node path corresponds to a target data item from the database, and according to the node and the target path to obtain the corresponding data item data value. This method simplifies the steps of data extraction, and then improves the efficiency of data extraction.

【技术实现步骤摘要】
数据提取方法及装置、存储介质、电子设备
本公开涉及数据处理
,具体而言,涉及一种数据提取方法、数据提取装置、计算机可读存储介质以及电子设备。
技术介绍
随着医疗中对于患者的生活习性的关注度逐步提升,医疗大数据对患者信息统计的指标也相应增多。在相关技术中进行医疗数据统计时,数据一般来源于多家医院,而用户最终看到的数据则是对多家医院的患者数据整合得到的。其中每个医院的数据均存储在ES(ElasticSearch)中,单家医院的数据可由ES本身提供的功能聚合得到。但是相关技术中聚合出来的数据结果层级嵌套太多且不同的数据统计指标都分布在不同层级的结点上,在整合多家医院相同结点的数据之前,必须先把各结点的数据值解析出来,然后才能做加、减、乘、除等整合运算。相关技术中解析和提取数据的步骤较繁琐,导致数据提取过程效率较低;每次提取不同数据指标时都要修改原有逻辑,通用性较差。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据提取方法、数据提取装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种数据提取方法,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。在本公开的一种示例性实施例中,所述方法还包括:对各所述目标数据项对应的所述数据值进行整合运算。在本公开的一种示例性实施例中,对多个数据项进行解析之前,所述方法还包括:从多个数据源中查询对应的数据集,并在所述数据集中确定所述数据项。在本公开的一种示例性实施例中,所述结点路径包括从所述数据源中得到的所述数据集中所述待统计数据项的结点所在位置。根据本公开的一个方面,提供一种数据提取装置,包括:结点确定模块,用于对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;映射建立模块,用于为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;数据获取模块,用于从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。在本公开的一种示例性实施例中,所述装置还包括:数据整合模块,用于对各所述目标数据项对应的所述数据值进行整合运算。在本公开的一种示例性实施例中,对多个数据项进行解析之前,所述装置还包括:数据集查询模块,用于从多个数据源中查询对应的数据集,并在所述数据集中确定所述数据项。在本公开的一种示例性实施例中,所述结点路径包括从所述数据源中得到的所述数据集中所述待统计数据项的结点所在位置。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的数据提取方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的数据提取方法。本公开示例性实施例中提供的数据提取方法、数据提取装置、计算机可读存储介质以及电子设备中,对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。一方面,通过为各所述待统计数据项与结点路径之间建立映射关系,可以直接基于结点路径确定目标数据项对应的数据值,简化了数据提取的操作步骤,进而提高了数据提取效率;另一方面,基于结点路径确定目标数据项对应的数据值,避免了相关技术中提取不同数据指标时需要修改原有逻辑的步骤,提高了数据提取方法的通用性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种数据提取方法示意图;图2示意性示出本公开示例性实施例中数据提取方法的总体数据流向示意图;图3示意性示出本公开示例性实施例中数据提取流程示意图;图4示意性示出本公开示例性实施例中一种数据提取装置的框图;图5示意性示出一种用于实现上述数据提取方法的电子设备;图6示意性示出一种用于实现上述数据提取方法的计算机可读存储介质。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施方式中首先提供了一种数据提取方法,可以应用于医疗大数据统计中,也可以应用于电商数据或者是其它各领域数据的统计,本示例中以医疗数据统计为例进行说明。参考图1所示,该数据提取方法可以包括以下步骤:步骤S110.对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;步骤S120.为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;步骤S130.从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。在本示例性实施例提供的数据提取方法中,一方面,通过为各所述待统计数据项与结点路径之间建立映射关系,可以直接基于结点路径确定目标数据项对应的数据值,简化了数据提取的操作步骤,进而提高了数据提取效率;另一方面,基于结点路径确定目标数据项对应的数据值,避免了相关技术中提取不同数据指标时需要修改原有逻辑的步骤,提高了数据提取方法的通用性。下面,将对本示例本文档来自技高网...
数据提取方法及装置、存储介质、电子设备

【技术保护点】
一种数据提取方法,其特征在于,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。

【技术特征摘要】
1.一种数据提取方法,其特征在于,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。2.根据权利要求1所述的数据提取方法,其特征在于,所述方法还包括:对各所述目标数据项对应的所述数据值进行整合运算。3.根据权利要求1所述的数据提取方法,其特征在于,对多个数据项进行解析之前,所述方法还包括:从多个数据源中查询对应的数据集,并在所述数据集中确定所述数据项。4.根据权利要求3所述的数据提取方法,其特征在于,所述结点路径包括从所述数据源中得到的所述数据集中所述待统计数据项的结点所在位置。5.一种数据提取装置,其特征在于,包括:结点确定模块,用于对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;映射建立模块,用于为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述...

【专利技术属性】
技术研发人员:王赛兵
申请(专利权)人:天津开心生活科技有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1