数据处理方法、装置、计算机可读存储介质及电子设备制造方法及图纸

技术编号:20724716 阅读:26 留言:0更新日期:2019-03-30 17:39
本公开提供了一种数据处理方法、装置、计算机可读存储介质及电子设备,涉及数据处理技术领域。该数据处理方法包括:获取原始数据,并根据所述原始数据获取与所述原始数据对应的元数据信息;判断所述数据库中是否存在与所述元数据信息匹配的关系树结构;若存在,则将所述关系树结构作为所述元数据信息对应的数据结构。本公开一方面提高了数据生产的效率、降低了难度;另一方面随着知识的积累,可以评估数据生产中碰到的问题是否符合知识库的规则,避免出现错误,提高了数据生产的质量。

【技术实现步骤摘要】
数据处理方法、装置、计算机可读存储介质及电子设备
本公开涉及数据处理
,具体而言,涉及一种数据处理方法、数据处理装置、计算机可读存储介质以及电子设备。
技术介绍
在医疗信息化领域,各医疗信息化公司的竞争逐渐演变的更加激烈,但是目前医疗行业内存在大量的医疗信息化厂商,行业集中度低,医疗数据比较分散。目前,即使是同一厂商,其信息系统碎片化程度也很高,医疗信息系统在系统的整个生命周期内随着不同业务需求在各个实施单位产生数据结构的差异也越来越大。为了使得医疗数据能够在整个医疗行业通用,所以通常通过医疗数据生产的方法将原始的医疗数据转化为统一标准高质量的结构化医疗数据,且通过结构化查询语言(如:SQL)记录数据转换的过程。但是现有的数据生成过程中转换的数据无法直接作为知识库的知识,这就使得医疗数据生产的难度高、效率低,并且获得的医疗数据的质量低。因此,本领域需要一种新的数据处理方法及装置,以解决上述问题中的一个或多个问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开实施例的目的在于提供一种数据处理方法、数据处理装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开实施例的第一方面,提供了一种数据处理方法,其特征在于,包括:获取原始数据,并根据所述原始数据获取与所述原始数据对应的元数据信息;判断数据库中是否存在与所述元数据信息匹配的关系树结构;若存在,则将所述关系树结构作为所述元数据信息对应的数据结构。在本公开的示例性实施例中,判断数据库中是否存在与所述元数据信息匹配的关系树结构,包括:深度遍历各所述关系树结构中的树节点;根据所述树节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构。在本公开的示例性实施例中,所述树节点包括表节点、血缘字段节点和关系字段节点,且所述表节点通过所述关系字段节点相互连接,所述血缘字段节点与对应的所述表节点连接。在本公开的示例性实施例中,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当所述关系树结构中的所述表节点、所述血缘字段节点和所述关系字段节点与所述元数据信息完全匹配时,将所述关系树结构作为所述数据结构。在本公开的示例性实施例中,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当所述关系树结构中与所述表节点对应的部分所述血缘字段节点与所述元数据信息不匹配,其它节点与所述元数据信息匹配时,将不匹配的所述血缘字段节点从所述关系树结构中剪除,并将剪枝后的所述关系树结构作为所述数据结构。在本公开的示例性实施例中,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当非根的所述表节点、与非根的所述表节点对应的全部的所述血缘字段节点、与非根的所述表节点对应的所述关系字段节点中的一个或多个与所述元数据信息不匹配,其它节点与所述元数据信息匹配时,将非根的所述表节点对应的分枝全部剪除,并将剪枝后的所述关系树结构作为所述数据结构。在本公开的示例性实施例中,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当所述关系树结构中的所述表节点、所述血缘字段节点和所述关系字段节点与所述元数据信息完全不匹配时,通过数据处理语言处理所述元数据信息以生成所述数据结构。根据本公开的一个方面,提供了一种数据处理装置,其特征在于,包括:信息获取模块,用于获取原始数据,并根据所述原始数据获取与所述原始数据对应的元数据信息;信息匹配模块,用于判断数据库中是否存在与所述元数据信息匹配的关系树结构;结构生成模块,用于当存在与所述元数据信息匹配的所述关系树结构时,将所述关系树结构作为所述元数据信息对应的数据结构。根据本公开的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法。根据本公开的一个方面,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的数据处理方法。在本公开的一些实施例所提供的技术方案中,从数据源中抽取原始数据,根据原始数据获取对应的元数据信息;接着将元数据信息与数据库中的关系树结构进行匹配,判断是否存在匹配的关系树结构;若存在,则将匹配的关系树结构作为元数据信息对应的数据结构。本公开一方面通过数据库中的关系树结构指导数据生产,提高了数据生产的效率,帮助工程师完成简单性和重复性的工作,降低了数据生成的难度,使经验不足的工程师也能借助知识库的帮助完成数据生产工作;另一方面将原始数据以关系树结构的形式存储在数据库中以形成知识,随着知识的积累,可以评估数据生产中碰到的问题是否符合知识库的规则,避免出现错误,提高了数据生产的质量。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示意性示出了一种数据处理方法的流程示意图;图2示意性示出了一种数据处理方法的应用场景示例图;图3示意性示出了一种SQL语句转化为SQL关系树的结构示意图;图4示意性示出了一种有知识库指导数据生产的流程示意图;图5示意性示出了一种数据生产的方法示意图;图6示意性示出了一种剪枝操作的流程示意图;图7示意性示出了一种剪枝操作的流程示意图;图8示意性示出了一种无知识库指导数据生产的流程示意图;图9示意性示出了一种数据处理装置的结构示意图;图10示意性示出了一种数据处理方法的电子设备示例框图;图11示意性示出了一种数据处理方法的计算机可读存储介质。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取原始数据,并根据所述原始数据获取与所述原始数据对应的元数据信息;判断数据库中是否存在与所述元数据信息匹配的关系树结构;若存在,则将所述关系树结构作为所述元数据信息对应的数据结构。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取原始数据,并根据所述原始数据获取与所述原始数据对应的元数据信息;判断数据库中是否存在与所述元数据信息匹配的关系树结构;若存在,则将所述关系树结构作为所述元数据信息对应的数据结构。2.根据权利要求1所述的数据处理方法,其特征在于,判断数据库中是否存在与所述元数据信息匹配的关系树结构,包括:深度遍历各所述关系树结构中的树节点;根据所述树节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构。3.根据权利要求2所述的数据处理方法,其特征在于,所述树节点包括表节点、血缘字段节点和关系字段节点,且所述表节点通过所述关系字段节点相互连接,所述血缘字段节点与对应的所述表节点连接。4.根据权利要求3所述的数据处理方法,其特征在于,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当所述关系树结构中的所述表节点、所述血缘字段节点和所述关系字段节点与所述元数据信息完全匹配时,将所述关系树结构作为所述数据结构。5.根据权利要求3所述的数据处理方法,其特征在于,根据所述节点与所述元数据信息的匹配程度,判断所述数据库中是否存在与所述元数据信息匹配的所述关系树结构,包括:当所述关系树结构中与所述表节点对应的部分所述血缘字段节点与所述元数据信息不匹配,其它节点与所述元数据信息匹配时,将不匹配的所述血缘字段节点从所述关系树结构中剪除,并将剪枝后的所述关系树结构作为所述数据结构。6.根据权利要求3...

【专利技术属性】
技术研发人员:丁琳
申请(专利权)人:北京懿医云科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1