医疗数据补充方法和装置制造方法及图纸

技术编号:18525594 阅读:23 留言:0更新日期:2018-07-25 12:37
本公开是关于一种医疗数据补充方法和医疗数据补充装置。该方法对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;该医疗数据补充方法包括:从主表中提取公共键、主键以及主表匹配字段形成主表的分布式的Row对象的集合;将主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将公共键作为分布式的Java对象的集合的键;根据公共键对分布式的Java对象的集合进行聚合,并将主键对应填入需要的信息中;通过公共键链接需要的信息,并根据主表匹配字段与从表匹配字段的匹配性将需要的信息补充从表的待补充医疗数据。使从表记录的医疗数据达到可利用的目的。

【技术实现步骤摘要】
医疗数据补充方法和装置
本公开涉及计算机
,具体而言,涉及一种医疗数据补充方法和医疗数据补充装置。
技术介绍
ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL在抽取数据过程中,由于元数据自身的系统缺陷,可能存在一些数据字段缺失问题,如果缺失的数据字段非常重要,可能导致大量数据无法得到有效利用。例如,在实际医疗系统当中,检查(包括病理、放射、超声心动等)数据、实验室检验(血检、尿检等)数据,只记录了病人ID,并未记录就诊ID,这样会对医疗数据科研造成很大不便,因为医疗数据科研需要以就诊为粒度,研究每次就诊过程中,检查检验数据与入出院诊断、治疗情况之间的关系。合理补充就诊ID,对后期医疗数据科研有重大作用。因此,有必要研究一种医疗数据补充方法和医疗数据补充装置,使记录的医疗数据达到可利用的目的。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种医疗数据补充方法和医疗数据补充装置,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面,提供了一种医疗数据补充方法,对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;所述医疗数据补充方法包括:从所述主表中提取所述公共键、所述主键以及主表匹配字段形成主表的分布式的Row对象的集合;将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;根据所述公共键对所述分布式的Java对象的集合进行聚合,并将所述主键对应填入需要的信息中;通过所述公共键链接所述需要的信息,并根据所述主表匹配字段与从表匹配字段的匹配性将所述需要的信息补充所述从表的待补充医疗数据。在本公开的一种示例性实施例中,所述主表记录有就诊ID信息、病人ID信息、就诊时间以及病人的基本信息;所述从表记录有病人ID信息、检查时间以及检查信息。在本公开的一种示例性实施例中,所述待补充医疗数据为就诊ID信息,所述公共键为病人ID信息,所述主表匹配字段为就诊时间,所述从表匹配字段为检查时间。在本公开的一种示例性实施例中,所述主表匹配字段与从表匹配字段的匹配性为所述就诊时间与检查时间的接近性。在本公开的一种示例性实施例中,所述医疗数据补充方法还包括:从所述主表中提取所述公共键、所述主键以及匹配字段后,删除所述公共键为空格串或空串的行。根据本公开的另一个方面,提供一种医疗数据补充装置,对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段,所述医疗数据补充装置包括:公共键、外键以及主表匹配字段提取单元,用于从所述主表中提取所述公共键、所述主键以及主表匹配字段形成主表的分布式的Row对象的集合;主表转换单元,用于将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;分布式的Java对象的集合聚合单元,用于根据所述公共键对所述分布式的Java对象的集合进行聚合,并将所述主键对应填入需要的信息中;待补充医疗数据补充单元,用于通过所述公共键链接所述需要的信息,并根据所述主表匹配字段与从表匹配字段的匹配性将所述需要的信息补充所述从表的待补充医疗数据。在本公开的一种示例性实施例中,所述主表记录有就诊ID信息、病人ID信息、就诊时间以及病人的基本信息;所述从表记录有病人ID信息、检查时间以及检查信息。在本公开的一种示例性实施例中,所述待补充医疗数据为就诊ID信息,所述公共键为病人ID信息,所述主表匹配字段为就诊时间,所述从表匹配字段为检查时间。在本公开的一种示例性实施例中,所述主表匹配字段与从表匹配字段的匹配性为所述就诊时间与检查时间的接近性。在本公开的一种示例性实施例中,所述医疗数据补充装置还包括:空格串或空串删除单元,用于从所述主表中提取所述公共键、所述主键以及匹配字段后,删除所述公共键为空格串或空串的行。本公开的医疗数据补充方法和医疗数据补充装置,将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;然后通过公共键将主表和从表链接,由于待补充医疗数据为主表的主键且为从表的外键,根据主表匹配字段与从表匹配字段的匹配性将主表的主键补充入从表。一方面,对从表中待补充的医疗数据进行补充,进一步完善从表,从而使从表记录的医疗数据达到可利用的目的。另一方面,将主表的分布式的Row对象的集合转为分布式的Java对象的集合,方便处理各种结构化或非结构化数据,而且类型转化比较安全。再一方面,根据公共键对所述分布式的Java对象的集合进行聚合,将一个大集合分成若干个小集合,为下一步的信息匹配减少数据运算量,从而提高效率;而且能够避免进行下一步信息匹配时出现错误。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开一示例实施例的医疗数据补充方法的流程图。图2示意性示出本公开一示例实施例的医疗数据补充装置的方框图。图3示意性示出根据本公开示例实施方式中一种电子设备的示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施方式中首先提供了一种医疗数据补充方法,该医疗数据补充方法对从表进行医疗数据补充,所述待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有本文档来自技高网...

【技术保护点】
1.一种医疗数据补充方法,对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;其特征在于,所述医疗数据补充方法包括:从所述主表中提取所述公共键、所述主键以及主表匹配字段形成主表的分布式的Row对象的集合;将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;根据所述公共键对所述分布式的Java对象的集合进行聚合,并将所述主键对应填入需要的信息中;通过所述公共键链接所述需要的信息,并根据所述主表匹配字段与从表匹配字段的匹配性将所述需要的信息补充所述从表的待补充医疗数据。

【技术特征摘要】
1.一种医疗数据补充方法,对从表进行医疗数据补充,待补充医疗数据为从表的外键且为主表的主键,且主表和从表持有公共键,主表持有主表匹配字段,从表持有从表匹配字段;其特征在于,所述医疗数据补充方法包括:从所述主表中提取所述公共键、所述主键以及主表匹配字段形成主表的分布式的Row对象的集合;将所述主表的分布式的Row对象的集合转为分布式的Java对象的集合,且将所述公共键作为所述分布式的Java对象的集合的键;根据所述公共键对所述分布式的Java对象的集合进行聚合,并将所述主键对应填入需要的信息中;通过所述公共键链接所述需要的信息,并根据所述主表匹配字段与从表匹配字段的匹配性将所述需要的信息补充所述从表的待补充医疗数据。2.根据权利要求1所述的医疗数据补充方法,其特征在于,所述主表记录有就诊ID信息、病人ID信息、就诊时间以及病人的基本信息;所述从表记录有病人ID信息、检查时间以及检查信息。3.根据权利要求2所述的医疗数据补充方法,其特征在于,所述待补充医疗数据为就诊ID信息,所述公共键为病人ID信息,所述主表匹配字段为就诊时间,所述从表匹配字段为检查时间。4.根据权利要求3所述的医疗数据补充方法,其特征在于,所述主表匹配字段与从表匹配字段的匹配性为所述就诊时间与检查时间的接近性。5.根据权利要求1所述的医疗数据补充方法,其特征在于,所述医疗数据补充方法还包括:从所述主表中提取所述公共键、所述主键以及匹配字段后,删除所述公共键为空格串或空串的行。6.一种医疗数据补充装置,对从表进行医疗数据补充,待补充医疗数据为从表的外键且...

【专利技术属性】
技术研发人员:丁文超
申请(专利权)人:医渡云北京技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1