The public is a data extraction method, data extraction apparatus, computer readable storage medium and electronic device, and relates to the technical field of data processing, the method includes: analysis of multiple data items to be counted and determine the node path and the corresponding statistical data items to be; for each of the need to establish a mapping relationship between the statistical data and the node path, and the mapping relationship is stored to the database; query the node path corresponds to a target data item from the database, and according to the node and the target path to obtain the corresponding data item data value. This method simplifies the steps of data extraction, and then improves the efficiency of data extraction.
【技术实现步骤摘要】
数据提取方法及装置、存储介质、电子设备
本公开涉及数据处理
,具体而言,涉及一种数据提取方法、数据提取装置、计算机可读存储介质以及电子设备。
技术介绍
随着医疗中对于患者的生活习性的关注度逐步提升,医疗大数据对患者信息统计的指标也相应增多。在相关技术中进行医疗数据统计时,数据一般来源于多家医院,而用户最终看到的数据则是对多家医院的患者数据整合得到的。其中每个医院的数据均存储在ES(ElasticSearch)中,单家医院的数据可由ES本身提供的功能聚合得到。但是相关技术中聚合出来的数据结果层级嵌套太多且不同的数据统计指标都分布在不同层级的结点上,在整合多家医院相同结点的数据之前,必须先把各结点的数据值解析出来,然后才能做加、减、乘、除等整合运算。相关技术中解析和提取数据的步骤较繁琐,导致数据提取过程效率较低;每次提取不同数据指标时都要修改原有逻辑,通用性较差。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据提取方法、数据提取装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种数据提取方法,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据 ...
【技术保护点】
一种数据提取方法,其特征在于,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。
【技术特征摘要】
1.一种数据提取方法,其特征在于,包括:对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述映射关系存储至数据库中;从所述数据库中查询与一目标数据项对应的所述结点路径,并根据所述结点路径获取与所述目标数据项对应的数据值。2.根据权利要求1所述的数据提取方法,其特征在于,所述方法还包括:对各所述目标数据项对应的所述数据值进行整合运算。3.根据权利要求1所述的数据提取方法,其特征在于,对多个数据项进行解析之前,所述方法还包括:从多个数据源中查询对应的数据集,并在所述数据集中确定所述数据项。4.根据权利要求3所述的数据提取方法,其特征在于,所述结点路径包括从所述数据源中得到的所述数据集中所述待统计数据项的结点所在位置。5.一种数据提取装置,其特征在于,包括:结点确定模块,用于对多个待统计数据项进行解析并确定与各所述待统计数据项对应的结点路径;映射建立模块,用于为各所述待统计数据项与所述结点路径之间建立一映射关系,并将所述...
【专利技术属性】
技术研发人员:王赛兵,
申请(专利权)人:天津开心生活科技有限公司,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。