一种基于内容包含度的数据字典检索系统及方法技术方案

技术编号:34852746 阅读:30 留言:0更新日期:2022-09-08 07:53
本发明专利技术公开了一种基于内容包含度的数据字典检索系统,该系统包括输入模块、字典检索模块、标准字典库和输出模块;并公开了基于该系统的检索方法,包括步骤:S1、输入检索条件字典Q;S2、提取检索条件字典Q的项值,并生成检索项值集合Q1;S3、依次读取标准字典库中的标准字典D,提取所述标准字典D的项值,并生成标准项值集合D1;S4、计算检索项值Q1和标准项值D1之间的包含度p;S5、根据包含度p,对所述标准字典D进行排序,并输出包含度p的绝对值大于0的标准字典D作为检索结果。本发明专利技术能大大提高数据字典检索的精确度和效率,从而更好地满足数据字典治理过程中基于字典内容的检索需求。据字典治理过程中基于字典内容的检索需求。据字典治理过程中基于字典内容的检索需求。

【技术实现步骤摘要】
一种基于内容包含度的数据字典检索系统及方法


[0001]本专利技术涉及医疗信息
,特别涉及一种基于内容包含度的数据字典检索系统及方法。

技术介绍

[0002]数据字典是一组关于<编码、值>键值对的集合,数据字典作为信息系统的一类重要元数据,定义描述了信息系统数据字段的值域与编码,对信息化建设与信息系统维护起着至关重要的作用。为了更好的实现跨信息系统的数据集成与共享,需要对信息系统使用的数据字典进行治理,使各信息系统使用的本地数据字典与数据字典库中的标准字典保持一致,确保各信息系统采用一套统一的数据字典。
[0003]具体的,为了实现数据字典的治理目标,需要以本地数据字典为检索条件,通过检索数据字典库,然后参照标准数据字典对本地数据字典进行扩展,从而使得本地数据字典与标准数据字典保持一致。然而,现有的数据字典的检索方法仅支持以简单的字符串作为检索条件参数,通过简单的字符串匹配对数据字典相关的描述性信息比如字典名称、字典说明等进行匹配检索,无法实现基于数据字典内容的检索,检索的准确度和效率都较低,无法满足检索需求。

技术实现思路

[0004]为解决上述问题,本专利技术提供了一种基于内容包含度的数据字典检索系统及方法。
[0005]本专利技术采用以下技术方案:
[0006]一种基于内容包含度的数据字典检索系统,包括输入模块、字典检索模块、标准字典库和输出模块;
[0007]所述输入模块用于输入检索条件字典;
[0008]所述标准字典库用于存储标准字典;
[0009]所述字典检索模块分别根据所述检索条件字典和标准字典生成对应的检索项值集合和标准项值集合,计算所述检索项值集合和标准项值集合之间的包含度,根据所述包含度对所述标准字典进行排序;
[0010]所述输出模块用于输出包含度的绝对值大于0的标准字典作为检索结果。
[0011]一种基于内容包含度的数据字典检索方法,所述检索方法基于上述检索系统实现,所述方法包括如下步骤:
[0012]S1、输入检索条件字典Q;
[0013]S2、提取检索条件字典Q的项值,并生成检索项值集合Q1;
[0014]S3、依次读取标准字典库中的标准字典D,提取所述标准字典D的项值,并生成标准项值集合D1;
[0015]S4、计算检索项值Q1和标准项值D1之间的包含度p;
[0016]S5、根据包含度p,对所述标准字典D进行排序,并输出包含度p的绝对值大于0的标准字典D作为检索结果。
[0017]进一步地,所述包含度p的计算公式如下:
[0018][0019]其中,Sim
dict
(D1,Q1)的值范围为[

1,1]。
[0020]进一步地,所述Sim
dict
(D1,Q1)的取值含义如下:
[0021]当Sim
dict
(D1,Q1)为1时,表示标准项值集合D1完全包含检索项值集合Q1,即检索项值集合Q1为标准项值集合D1的一个子集;
[0022]当Sim
dict
(D1,Q1)为

1时,表示标准项值集合D1完全被检索项值集合Q1包含,也即标准项值集合D1为检索项值集合Q1的一个子集;
[0023]当Sim
dict
(D1,Q1)为(

1,1)且Sim
dict
(D1,Q1)≠0时,表示标准项值集合D1与检索项值集合Q1之间存在部分包含,即部分字典的项值是相同的;
[0024]当Sim
dict
(D1,Q1)=0时,表示标准项值集合D1与检索项值集合Q1之间不存在任何项值相同的字典项。
[0025]采用上述技术方案后,本专利技术与
技术介绍
相比,具有如下优点:
[0026]1、本专利技术提供了一种基于内容包含度的数据字典检索系统及方法,其支持直接以数据字典作为检索条件输入参数,自动提取待检索的数据字典的项值,并根据项值计算数据字典库中每个标准数据字典与作为检索条件的数据字典之间的匹配程度,最后根据匹配程度输出匹配度最高的表示数据字典;
[0027]2、与传统的仅进行字符串匹配的检索方法不同,本专利技术采用提取数据字典项值和包含度计算相结合的方法,对标准字典进行查询检索,返回尽可能包含检索条件字典或尽可能被减速条件字典包含的标准字典,大大提高检索的精确度和效率,从而更好地满足数据字典治理过程中基于字典内容的数据字典的检索需求。
附图说明
[0028]图1为本专利技术的检索方法流程图。
具体实施方式
[0029]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0030]实施例一
[0031]一种基于内容包含度的数据字典检索系统,包括输入模块、字典检索模块、标准字典库和输出模块;
[0032]所述输入模块用于输入检索条件字典;
[0033]所述标准字典库用于存储标准字典;
[0034]所述字典检索模块分别根据所述检索条件字典和标准字典生成对应的检索项值集合和标准项值集合,计算所述检索项值集合和标准项值集合之间的包含度,根据所述包
含度对所述标准字典进行排序;
[0035]所述输出模块用于输出包含度的绝对值大于0的标准字典作为检索结果。
[0036]实施例二
[0037]如图1所示,一种基于内容包含度的数据字典检索方法,所述检索方法基于实施例一所述的检索系统实现,本实施例以医疗信息系统建设为例,某医疗信息系统中存在名称为“治愈效果”的数据字典,该字段用于记录患者进行临床治疗后的病情变化情况,信息系统中该数据字段使用的本地数据字典如下表1所示:
[0038]表1医疗信息系统中名称为“治愈效果”的数据字典;
[0039]编码值说明2好转达到好转标准或症状减轻、功能部分恢复、体征改善3稳定病情无明显变化或加重4恶化病情加重
[0040]以表1中信息系统的本地数据字典为例,找到尽可能包含查询条件字典或者尽可能被查询条件字典包含的数据标准字典,具体包括如下步骤:
[0041]S1、输入检索条件字典Q,如输入“治愈效果”;
[0042]S2、提取检索条件字典Q的项值,并生成检索项值集合Q1:{好转、稳定、恶化};
[0043]S3、依次读取标准字典库中的标准字典D,标准字典D如下表2所示,提取所述标准字典D的项值,并生成标准项值集合D1:{治愈、好转、稳定、恶化、死亡、其他};
[0044]表2标准字典库中的标准字典
[0045][0046][0047]S4、计算检索项值Q1和标准项值D1之间的包含度p;
[0048]S5、根据包含度p,对所述标准字典D进行排序,并输出包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于内容包含度的数据字典检索系统,其特征在于:包括输入模块、字典检索模块、标准字典库和输出模块;所述输入模块用于输入检索条件字典;所述标准字典库用于存储标准字典;所述字典检索模块分别根据所述检索条件字典和标准字典生成对应的检索项值集合和标准项值集合,计算所述检索项值集合和标准项值集合之间的包含度,根据所述包含度对所述标准字典进行排序;所述输出模块用于输出包含度的绝对值大于0的标准字典作为检索结果。2.一种基于内容包含度的数据字典检索方法,其特征在于:所述检索方法基于如权利要求1的所述检索系统实现,所述方法包括如下步骤:S1、输入检索条件字典Q;S2、提取检索条件字典Q的项值,并生成检索项值集合Q1;S3、依次读取标准字典库中的标准字典D,提取所述标准字典D的项值,并生成标准项值集合D1;S4、计算检索项值Q1和标准项值D1之间的包含度p;S5、根据包含度p,对所述标准字典D进行排序,并输出包含度p的绝对值大于0的标准字典D作为检索结果。3.如权利要求2所述的一种基于内容包含度的数据字典检索方法,其特征在于:所述包含度p的计算公式如下:其中,Sim
d...

【专利技术属性】
技术研发人员:徐超吴谨准郑宏晖李振叶
申请(专利权)人:厦门市妇幼保健院厦门市优生优育服务中心厦门大学附属妇女儿童医院厦门市林巧稚妇女儿童医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1