一种基于自动探测技术规范化医院数据库的方法技术

技术编号:37149363 阅读:16 留言:0更新日期:2023-04-06 22:03
本发明专利技术属于数据处理技术领域,具体涉及一种基于自动探测技术规范化医院数据库的方法,包括:在标准数据库中建立标准数据库表,并且构造标准数据库表中的标准字段和原数据库字段;在医院数据库中将不同的数据库表中的相同类型的字段和相应的字段取值统计为一组进行分析得到统计检索表;根据标准字段在历史映射规则表中查找相匹配的字段,以及在医院知识库中查找相关的字段作为关键字段;使用关键字段在统计检索表中查找候选字段,当候选字段存在时确定直接映射规则;当候选字段不存在时,通过医疗知识图谱扩展关键字段并且查找统计检索表以确定模糊映射规则,本发明专利技术能够自动实现从医院数据库的字段到标准字段的映射。从医院数据库的字段到标准字段的映射。从医院数据库的字段到标准字段的映射。

【技术实现步骤摘要】
一种基于自动探测技术规范化医院数据库的方法


[0001]本专利技术属于数据处理
,具体涉及一种基于自动探测技术规范化医院数据库的方法。

技术介绍

[0002]在开展不同的医院之间的数据互通时,一般需要在标准数据库接入不同的医院的患者相关数据,不同的医院对于患者相关数据的数据存储方式各不相同,患者相关数据指的是包含患者基本信息、检查信息、影像信息、电子病历信息、手术记录信息等的数据库表,现有技术一般是由实施工程师配置不同的医院数据库的数据库表字段与标准数据库的数据库表字段之间的映射关系,映射关系常常涉及数百种,需要花费实施工程师大量的时间,并且还容易出现映射错误,由此,本专利技术提出一种基于自动探测技术规范化医院数据库的方法,针对不同的医院的数据库表字段自动给出正确的映射规则,还在不能完全确定映射规则的情况下给出可能的映射规则来解决上述的技术问题。

技术实现思路

[0003]本专利技术在不同的医院数据库中按照字段类型对于字段和字段取值进行统计分析,得到不同的医院数据库的统计检索表,并且通过历史映射规则表、医院知识库,以及医疗知识图谱确定关键字段,根据关键字段查询统计检索表,实现从字段到标准字段的映射,还根据映射规则将字段取值添加为相应的标准字段取值。
[0004]为了达到上述的专利技术目的,本专利技术给出如下所述的一种基于自动探测技术规范化医院数据库的方法,主要包括以下的步骤:
[0005]在标准数据库中建立标准数据库表,并且构造所述标准数据库表中的标准字段,以及所述标准字段的名称、取值范围、单位,所述标准数据库表中还包括所述标准字段的原数据库字段;
[0006]在医院数据库中,分别将不同的数据库表中的相同类型的字段和相应的字段取值统计为一组,若与同一组的字段相对应的字段取值为数值类型,则针对与同一组的字段相对应的字段取值提取其中的最大值、最小值、均值、中值、标准差,若与同一组的字段相对应的字段取值为文本类型,则针对与同一组的字段相对应的字段取值提取其中的枚举值、频繁出现值、长度均值,以得到医院数据库的统计检索表;
[0007]根据所述标准数据库表中的所述标准字段,在历史映射规则表中查找与所述标准字段相匹配的数据库表中的字段,同时还在医院知识库中查找与所述标准字段相关的所有字段,并且将查找到的数据库表中的字段和与所述标准字段相关的所有字段作为关键字段;
[0008]在医院数据库的统计检索表中查找与所述关键字段相对应的字段作为候选字段,当所述候选字段存在时,对于数值类型的与所述候选字段相对应的候选字段取值,按照所述标准字段的单位进行单位转换,同时计算单位转换后的候选字段取值的匹配度得分,对
于文本类型的与所述候选字段相对应的候选字段取值,直接计算候选字段取值的匹配度得分,并且将匹配度得分为第一名的所述候选字段作为直接映射规则添加到映射规则表中,还将匹配度得分为其他预设名次的所述候选字段作为候选直接映射规则添加到映射规则表中;
[0009]当所述候选字段不存在时,在医疗知识图谱中搜索与所述关键字段同义的其他字段并且添加到所述关键字段中,同时基于添加后的所述关键字段,重复上个步骤的方法,并且将相应的模糊映射规则和候选模糊映射规则添加到映射规则表中;还通过人工对于映射规则表进行修正,使用修正后的映射规则表更新所述历史映射规则表。
[0010]作为本专利技术的一种优选技术方案,在医疗知识图谱中搜索与所述关键字段同义的其他字段,包括如下步骤:
[0011]按照所述关键字段在医疗知识图谱中进行搜索之前,利用程序生成包含所述关键字段及其上下文信息的搜索结构体,所述搜索结构体能够代表与所述关键字段相对应的场景信息,并且使用语素分析方法将所述搜索结构体划分为不同的搜索词,同时将与所述关键字段相对应的搜索词作为确定搜索词,将其他搜索词作为候选搜索词;
[0012]在医疗知识图谱的不同节点中,搜索与所述确定搜索词相关的节点,在相关的节点为一个的情况下,将相关的节点所代表的字段作为与所述关键字段同义的其他字段;
[0013]在相关的节点为不止一个的情况下,在医疗知识图谱中确定与所述候选搜索词相对应的医疗知识图谱的节点,同时分别计算从不同的相关的节点到达所述医疗知识图谱的节点时经过的医疗知识图谱中的连接边的数量,计算的连接边的数量越少,设置相应的相关的节点具有越高的优先级,取优先级最高的相关的节点所代表的字段作为与所述关键字段同义的其他字段。
[0014]作为本专利技术的一种优选技术方案,在通过人工对于映射规则表进行修正之后,还包括基于修正后的映射规则表生成SQL语句,将不同的医院数据库中的数据库表的字段取值添加到标准数据库中的标准数据库表的相应的标准字段取值。
[0015]作为本专利技术的一种优选技术方案,将不同的医院数据库中的数据库表的字段取值添加到标准数据库中的标准数据库表的相应的标准字段取值,包括如下步骤:
[0016]针对第一个医院数据库,基于第一个医院数据库的备份存储区域中的数据生成添加记录,添加记录包括原数据库字段取值、字段名称、标准字段名称、字段取值,同时按照添加记录向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值;
[0017]在向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值的过程中,将第一个医院数据库的工作存储区域中的数据更新实时同步到第一个医院数据库的更新存储区域中;
[0018]在结束向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值时,禁止第一个医院数据库的工作存储区域中的数据再进行更新,同时根据第一个医院数据库的更新存储区域中的数据生成添加记录,并且判断标准数据库的A存储区域中的标准数据库表中是否存在与添加记录中的原数据库字段取值和标准字段名称同时相同的数据记录,若存在,则使用添加记录修改数据记录,若不存在,则按照添加记录向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值;
[0019]恢复允许第一个医院数据库的工作存储区域中的数据进行更新,同时将标准数据库的A存储区域指定为标准数据库的工作存储区域,第一个医院数据库的工作存储区域以及标准数据库的工作存储区域各自进行数据更新;
[0020]针对下一个医院数据库中的数据库表的字段取值,使用第一添加方法添加到标准数据库中的标准数据库表的相应的标准字段取值;
[0021]判断是否所有医院数据库中的数据库表的字段取值都已添加到标准数据库中,若是,结束全部步骤,反之,继续执行下个步骤;
[0022]针对下一个医院数据库中的数据库表的字段取值,使用第二添加方法添加到标准数据库中的标准数据库表的相应的标准字段取值;
[0023]判断是否所有医院数据库中的数据库表的字段取值都已添加到标准数据库中,若是,结束全部步骤,反之,跳转针对下一个医院数据库中的数据库表的字段取值,使用第一添加方法添加到标准数据库中的标准数据库表的相应的标准字段取值的步骤。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动探测技术规范化医院数据库的方法,其特征在于,包括如下步骤:在标准数据库中建立标准数据库表,并且构造所述标准数据库表中的标准字段,以及所述标准字段的名称、取值范围、单位,所述标准数据库表中还包括所述标准字段的原数据库字段;在医院数据库中,分别将不同的数据库表中的相同类型的字段和相应的字段取值统计为一组,若与同一组的字段相对应的字段取值为数值类型,则针对与同一组的字段相对应的字段取值提取其中的最大值、最小值、均值、中值、标准差,若与同一组的字段相对应的字段取值为文本类型,则针对与同一组的字段相对应的字段取值提取其中的枚举值、频繁出现值、长度均值,以得到医院数据库的统计检索表;根据所述标准数据库表中的所述标准字段,在历史映射规则表中查找与所述标准字段相匹配的数据库表中的字段,同时还在医院知识库中查找与所述标准字段相关的所有字段,并且将查找到的数据库表中的字段和与所述标准字段相关的所有字段作为关键字段;在医院数据库的统计检索表中查找与所述关键字段相对应的字段作为候选字段,当所述候选字段存在时,对于数值类型的与所述候选字段相对应的候选字段取值,按照所述标准字段的单位进行单位转换,同时计算单位转换后的候选字段取值的匹配度得分,对于文本类型的与所述候选字段相对应的候选字段取值,直接计算候选字段取值的匹配度得分,并且将匹配度得分为第一名的所述候选字段作为直接映射规则添加到映射规则表中,还将匹配度得分为其他预设名次的所述候选字段作为候选直接映射规则添加到映射规则表中;当所述候选字段不存在时,在医疗知识图谱中搜索与所述关键字段同义的其他字段并且添加到所述关键字段中,同时基于添加后的所述关键字段,重复上个步骤的方法,并且将相应的模糊映射规则和候选模糊映射规则添加到映射规则表中;还通过人工对于映射规则表进行修正,使用修正后的映射规则表更新所述历史映射规则表。2.根据权利要求1所述的一种基于自动探测技术规范化医院数据库的方法,其特征在于,在医疗知识图谱中搜索与所述关键字段同义的其他字段,包括如下步骤:按照所述关键字段在医疗知识图谱中进行搜索之前,利用程序生成包含所述关键字段及其上下文信息的搜索结构体,所述搜索结构体能够代表与所述关键字段相对应的场景信息,并且使用语素分析方法将所述搜索结构体划分为不同的搜索词,同时将与所述关键字段相对应的搜索词作为确定搜索词,将其他搜索词作为候选搜索词;在医疗知识图谱的不同节点中,搜索与所述确定搜索词相关的节点,在相关的节点为一个的情况下,将相关的节点所代表的字段作为与所述关键字段同义的其他字段;在相关的节点为不止一个的情况下,在医疗知识图谱中确定与所述候选搜索词相对应的医疗知识图谱的节点,同时分别计算从不同的相关的节点到达所述医疗知识图谱的节点时经过的医疗知识图谱中的连接边的数量,计算的连接边的数量越少,设置相应的相关的节点具有越高的优先级,取优先级最高的相关的节点所代表的字段作为与所述关键字段同义的其他字段。3.根据权利要求1所述的一种基于自动探测技术规范化医院数据库的方法,其特征在于,在通过人工对于映射规则表进行修正之后,还包括基于修正后的映射规则表生成SQL语句,将不同的医院数据库中的数据库表的字段取值添加到标准数据库中的标准数据库表的相应的标准字段取值。
4.根据权利要求3所述的一种基于自动探测技术规范化医院数据库的方法,其特征在于,将不同的医院数据库中的数据库表的字段取值添加到标准数据库中的标准数据库表的相应的标准字段取值,包括如下步骤:针对第一个医院数据库,基于第一个医院数据库的备份存储区域中的数据生成添加记录,添加记录包括原数据库字段取值、字段名称、标准字段名称、字段取值,同时按照添加记录向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值;在向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值的过程中,将第一个医院数据库的工作存储区域中的数据更新实时同步到第一个医院数据库的更新存储区域中;在结束向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值时,禁止第一个医院数据库的工作存储区域中的数据再进行更新,同时根据第一个医院数据库的更新存储区域中的数据生成添加记录,并且判断标准数据库的A存储区域中的标准数据库表中是否存在与添加记录中的原数据库字段取值和标准字段名称同时相同的数据记录,若存在,则使用添加记录修改数据记录,若不存在,则按照添加记录向标准数据库的A存储区域中的标准数据库表中添加标准字段取值和原数据库字段取值;恢复允许第一个医院数据库的工作存储区域中的数据进行更新,同时将标准数据库的A存储区域指定为标准数据库的工作...

【专利技术属性】
技术研发人员:谢彦夏星球
申请(专利权)人:北京和兴创联健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1