应用于HIS系统的数据表映射方法技术方案

技术编号:19057362 阅读:45 留言:0更新日期:2018-09-29 12:16
本申请涉及一种应用于HIS系统的数据表映射方法,包括以下步骤:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。本申请的方法利用计算机进行不同HIS系统数据表的自动匹配,减少效率低、重复性高的人工工作,降低人力成本。

【技术实现步骤摘要】
应用于HIS系统的数据表映射方法
本申请涉及信息管理系统
,具体涉及一种应用于HIS系统的数据表映射方法。
技术介绍
HIS(HospitalInformationSystem,医院信息系统)是应用于医院的一种信息管理系统,该系统以财务信息、病人信息和物资信息为主线,通过对信息的收集、存储、传递、统计和分析,从而实现综合查询、报表输出和信息共享等功能,及时为医院领导及各部门管理人员提供全面的数据服务。当前存在的情况是,不同医院、甚至同一医院内往往存在多个不同厂家所设计的HIS系统,而不同厂家对HIS系统的表结构、字段都有自己的设计,导致多个系统之间不能进行数据共享,成为一个个数据孤岛。这样就会影响数据的集中收集和分析,导致领导及各部门管理人员对相关数据的统一使用产生障碍。相关技术中,主要依赖医疗行业有工作经验的员工,基本靠人为识别字段含义,然后人工构建相关表结构之间的对应关系,最终才实现不同HIS系统之间的数据共享。然而,每一家厂商所设计的HIS系统都存在几百个表、上千字段;全国的HIS系统厂商有上百家,常见的有几十家。显然,人工处理存在效率低下、容易出错、时间成本高的问题。
技术实现思路
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种应用于HIS系统的数据表映射方法。根据本申请实施例的第一方面,提供一种应用于HIS系统的数据表映射方法,包括:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。进一步地,所述特征数据包括元数据和采样数据;所述元数据包括数据表的表名和该数据表中所有字段的字段名;所述采样数据包括存储在每一个字段下的若干条数据。进一步地,所述相似度的计算方法包括:根据两个字段各自的元数据,计算两个字段之间的表结构相似度;根据两个字段各自的采样数据,计算两个字段之间的内容相似度。进一步地,所述表结构相似度的计算方法包括:采用字符串模糊匹配算法,分别计算两个字段的字段名之间的匹配度以及两个字段所属的数据表的表名之间的匹配度;将两个匹配度相加,得出表结构相似度。进一步地,所述内容相似度的计算方法包括:将一个字段下的若干条数据与另一个字段下的若干条数据一一对应;依次计算每一条数据与对应数据之间的字符串匹配度,并将多个字符串匹配度相加,得到采样数据的总体字符串匹配度;对采样数据的所属分类进行判别,获得类型匹配度;综合考虑采样数据的总体字符串匹配度和类型匹配度,得到内容相似度。进一步地,所述基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配,包括:如果两个字段之间的表结构相似度高于第一阈值,则直接判断两个字段之间互相匹配;如果两个字段之间的表结构相似度不高于第一阈值,则综合表结构相似度和内容相似度进行判断。进一步地,所述综合表结构相似度和内容相似度进行判断,包括:将表结构相似度和内容相似度加权求和,给出两个字段之间的综合相似度评分;依次计算出所述第一HIS系统中的某一个字段与所述第二HIS系统中的每一个字段之间的综合相似度评分;对计算出的多个综合相似度评分进行排序,选取综合相似度评分最高的两个字段,判定这两个字段之间互相匹配。进一步地,所述方法还包括:在所有的字段都完成映射之后,对于存在映射关系的两个字段,将这两个字段所在的两个数据表之间也建立相应的映射关系。进一步地,所述方法还包括:对于存在映射关系的两个数据表,计算二者之间存在的映射关系的个数分别占两个数据表中字段总个数的比例;如果在两个数据表中所占的比例均达到第二阈值,则认为两个数据表之间完全匹配。根据本申请实施例的第二方面,提供一种应用于HIS系统的数据表映射装置,其特征在于,包括:采集模块,用于分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;处理模块,用于根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;判断模块,用于根据相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;执行模块,用于在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。根据本申请实施例的第三方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算设备的处理器执行时,使得计算设备执行一种应用于HIS系统的数据表映射方法,所述方法包括:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。根据本申请实施例的第四方面,提供一种应用于HIS系统的数据表映射设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。本申请的实施例提供的技术方案可以包括以下有益效果:利用计算机进行不同HIS系统数据表的自动匹配,减少效率低、重复性高的人工工作,降低人力成本;本申请的方法可以设置一个通用系统,这样不仅可以实现某异构HIS系统到通用系统的直接映射,进而也可以实现两个异构HIS系统之间的间接映射。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。图1是根据一示例性实施例示出的一种应用于HIS系统的数据表映射方法的流程图。图2是根据一示例性实施例示出的一种应用于HIS系统的数据表映射方法的流程交互图。图3是根据一示例性实施例示出的一种应用于HIS系统的数据表映射方法的间接映射关系示意图。图4是根据一示例性实施例示出的一种应用于HIS系统的数据表映射装置的电路框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是本文档来自技高网...

【技术保护点】
1.一种应用于HIS系统的数据表映射方法,其特征在于,包括:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。

【技术特征摘要】
1.一种应用于HIS系统的数据表映射方法,其特征在于,包括:分别从第一HIS系统的数据库和第二HIS系统的数据库中选取各自的待匹配数据表,并分别提取每一个待匹配数据表的特征数据;根据提取的特征数据,计算所述第一HIS系统的待匹配数据表中的字段与所述第二HIS系统的待匹配数据表中的字段之间的相似度;基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配;如果匹配,则在所述第一HIS系统的数据表中的字段和对应的所述第二HIS系统的数据表中的字段之间建立映射关系。2.根据权利要求1所述的一种应用于HIS系统的数据表映射方法,其特征在于:所述特征数据包括元数据和采样数据;所述元数据包括数据表的表名和该数据表中所有字段的字段名;所述采样数据包括存储在每一个字段下的若干条数据。3.根据权利要求2所述的一种应用于HIS系统的数据表映射方法,其特征在于,所述相似度的计算方法包括:根据两个字段各自的元数据,计算两个字段之间的表结构相似度;根据两个字段各自的采样数据,计算两个字段之间的内容相似度。4.根据权利要求3所述的一种应用于HIS系统的数据表映射方法,其特征在于,所述表结构相似度的计算方法包括:采用字符串模糊匹配算法,分别计算两个字段的字段名之间的匹配度以及两个字段所属的数据表的表名之间的匹配度;将两个匹配度相加,得出表结构相似度。5.根据权利要求3所述的一种应用于HIS系统的数据表映射方法,其特征在于,所述内容相似度的计算方法包括:将一个字段下的若干条数据与另一个字段下的若干条数据一一对应;依次计算每一条数据与对应数据之间的字符串匹配度,并将多个字符串匹配度相加,得到采样数据的总体字符串匹配度;对采样数据的所属分类进行判别,获得类型匹配度;综合考虑采样数据的总体字符串匹配度和类型匹配度,得到内容相似度。6.根据权利要求3-5任一项所述的一种应用于HIS系统的数据表映射方法,其特征在于,所述基于相似度判断任意两个分别属于不同系统的字段之间是否互相匹配,包括:如果两个字段之间的表结构相似度高于第一阈值,则直接判断两个字段之间互相匹配;如果两个字段之间的表结构相似度不高于第一阈值,则综合表结构相似度和内容相似度进行判断。7.根据权利要求6所述的一种应用于HIS系统的数据表映射方法,其特征在于,所述综合表结构相似度和内容相似度进行判断,包括:将表结构相似度和内容相似度加权求和,给出两个字段之间的综合相似度评分;依次计算出所述第一HIS系统中的某一个字段与所述第二HIS系统中的每一个字段之间的综合相似度评分;对计算出的多个综合相似度评...

【专利技术属性】
技术研发人员:陈曦
申请(专利权)人:成都智信电子技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1