医学文本信息显示方法、装置及电子设备制造方法及图纸

技术编号:28467192 阅读:25 留言:0更新日期:2021-05-15 21:33
本发明专利技术公开了一种医学文本信息显示方法、装置及电子设备,其中方法包括:根据医学术语标准名称和医学术语标准名称对应的所有特征词建立规则库,将所获取的医学文本信息拆分为多个关键词,根据规则库中与关键词相同的特征词所属的规则生成第一候选规则集,如果医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据规则生成第二候选规则集,将第二候选规则集中的规则按照评分标准进行评分,显示评分最高的规则对应的医学术语标准名称;本发明专利技术将同一语义的医学术语的不同表达形态以标准名称显示并进行编码,从而实现医学概念标准化,解决医疗文本中的概念变体现象,具有生产简易、可解释性高的特点。的特点。的特点。

【技术实现步骤摘要】
医学文本信息显示方法、装置及电子设备


[0001]本专利技术涉及医学信息处理领域,具体涉及一种医学文本信息显示方法、装置及电子设备。

技术介绍

[0002]医学术语贯穿于临床诊疗过程中所产生的诊疗记录、文书中,存在专业性强、信息密度大、简称俗称多等多样性语言现象的特点。
[0003]针对医学术语简称俗称多、名称不统一导致信息沟通不便的现象,相关技术主要使用文本分类的正则表达式或文本分类的方法,将同一语义术语的不同表达形态,标准化为统一的术语并进行编码。然而,这种方式存在短文本浅层信号较少、编码类别数量大、类别间语义差距不显著、分布不均衡、标注成本高、表达式方法在生产和应用上过于低效等问题。

技术实现思路

[0004]本专利技术的主要目的在于提供一种医学文本信息显示方法及装置,以实现医学文本统一标准显示,解决医学文本中出现概念变体的问题。
[0005]为了实现上述目的,本专利技术的第一方面提供了一种医学文本信息显示方法,包括:
[0006]根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库;
[0007]将所获取的医学文本信息拆分为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,其中,所述第一候选规则集为规则库的子集,包含所述关键词与医学术语标准名称的对应关系;
[0008]如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,其中,所述第二候选规则集为第一候选规则集的子集;
[0009]将所述第二候选规则集中的规则按照评分标准进行评分,显示评分最高的规则对应的医学术语标准名称。
[0010]可选地,所述根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库,包括:
[0011]所述规则库由多条规则构成,所述规则的形式包括字典;
[0012]以医学术语标准名称对应的规则编码标识为字典的键、以所述医学术语标准名称和所述医学术语标准名称对应的所有特征词和特征约束为字典的值,建立规则。
[0013]可选地,所述将所获取的医学文本信息拆分为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,包括:
[0014]利用分词器将所获取的医学文本信息拆分为多个关键词;
[0015]通过倒排索引查找所述规则库中与所述关键词相同的特征词所属的规则;
[0016]将所述规则作为第一候选规则集中的元素。
[0017]可选地,所述如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,包括:
[0018]对于所述第一候选规则集中的规则,判断所述医学文本信息是否包含所述规则中的所有特征词;
[0019]如果包含,则判断所述医学文本信息是否满足所述规则中的所有特征约束;
[0020]如果满足,则将所述规则作为第二候选规则集中的元素。
[0021]可选地,所述特征词包含多组;
[0022]组间包括不同语义的特征词,组内包括相同语义的特征词,各组特征词之间的关系为逻辑与,组内特征词之间的关系为逻辑或;
[0023]所述所有特征词包括每组中的一个特征词。
[0024]可选地,所述特征约束为所述特征词的约束条件;
[0025]所述特征约束包括特征词的排除约束、否定词约束、起始约束、分隔约束、计数约束和/或顺序约束。
[0026]可选地,所述将所述第二候选规则集中的规则按照评分标准进行评分包括:
[0027]计算所述第二候选规则集中各规则所包含特征词的个数;
[0028]计算各规则对应的医学术语标准名称在文本上所包含其他医学术语标准名称的个数;
[0029]将所包含特征词的个数和其他医学术语标准名称的个数相加,得到所述规则的评分。
[0030]本专利技术的第二方面提供了一种医学文本信息显示装置,包括:
[0031]建立单元,用于根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库;
[0032]第一生成单元,用于将所获取的医学文本信息拆分为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,其中,所述第一候选规则集为规则库的子集,包含所述关键词与医学术语标准名称的对应关系;
[0033]第二生成单元,用于如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,其中,所述第二候选规则集为第一候选规则集的子集;
[0034]显示单元,用于将所述第二候选规则集中的规则按照评分标准进行评分,显示评分最高的规则对应的医学术语标准名称。
[0035]本专利技术的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项提供的医学文本信息显示方法。
[0036]本专利技术的第四方面提供了一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项提供的医学文本信息显示方法。
[0037]在本专利技术实施例提供的医学文本信息显示方法中,首先根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库,然后将所获取的医学文本信息拆分
为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,其中,所述第一候选规则集为规则库的子集,包含所述关键词与医学术语标准名称的对应关系,如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,其中,所述第二候选规则集为第一候选规则集的子集,最后将所述第二候选规则集中的规则按照评分标准进行评分,显示评分最高的规则对应的医学术语标准名称;本专利技术实施例提供的技术方案将同一语义的术语的不同表达形态,标准化为统一的术语并进行编码,从而实现医学概念标准化,解决医疗文本中的概念变体现象,将复杂的医学专业术语抽象成计算机可阅读的基于语义的规则,对规则进行模式识别,与现有文本分类方法相比,具有生产简易、可推广性好、推理性能高、可解释性高的特点。
附图说明
[0038]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本专利技术实施例提供的医学文本信息显示方法流程示意图;
[0040]图2为本专利技术实施例提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学文本信息显示方法,其特征在于,包括:根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库;将所获取的医学文本信息拆分为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,其中,所述第一候选规则集为规则库的子集,包含所述关键词与医学术语标准名称的对应关系;如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,其中,所述第二候选规则集为第一候选规则集的子集;将所述第二候选规则集中的规则按照评分标准进行评分,显示评分最高的规则对应的医学术语标准名称。2.根据权利要求1所述的方法,其特征在于,所述根据医学术语标准名称和所述医学术语标准名称对应的所有特征词建立规则库,包括:所述规则库由多条规则构成,所述规则的形式包括字典;以医学术语标准名称对应的规则编码标识为字典的键、以所述医学术语标准名称和所述医学术语标准名称对应的所有特征词和特征约束为字典的值,建立规则。3.根据权利要求1所述的方法,其特征在于,所述将所获取的医学文本信息拆分为多个关键词,根据所述规则库中与所述关键词相同的特征词所属的规则生成第一候选规则集,包括:利用分词器将所获取的医学文本信息拆分为多个关键词;通过倒排索引查找所述规则库中与所述关键词相同的特征词所属的规则;将所述规则作为第一候选规则集中的元素。4.根据权利要求1所述的方法,其特征在于,所述如果所述医学文本信息与第一候选规则集中的规则包含的所有特征词及预设的特征约束相匹配,则根据所述规则生成第二候选规则集,包括:对于所述第一候选规则集中的规则,判断所述医学文本信息是否包含所述规则中的所有特征词;如果包含,则判断所述医学文本信息是否满足所述规则中的所有特征约束;如果满足,则将所述规则作为第二候选规则集中的元素。5.根据权利要求1所述的方法,其特征在于,所述特征词包含多组;组间包括不同语义的特征词,组内包括相同语义的特征词,各组特征词之间的关系为逻辑...

【专利技术属性】
技术研发人员:杨郑彬
申请(专利权)人:北京壹永科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1