医学术语的处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:32590267 阅读:18 留言:0更新日期:2022-03-09 17:24
本说明书实施方式提供了一种医学术语处理的方法、装置、计算机设备和存储介质。包括:针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语;对所述目标候选标准医学术语分别构建多维特征向量;使用所述医学原词生成的词向量与所述多维特征向量进行相似度运算,得出所述多维特征向量对应的目标候选标准医学术语与所述医学原词的相似度;基于所述相似度在目标候选标准医学术语中确定目标标准医学术语。通过采用多种召回策略提高召回候选标准医学术语的准确率,再根据相似度计算的结果确定目标标准医学术语,提高了医学术语编码人员的工作效率。医学术语编码人员的工作效率。医学术语编码人员的工作效率。

【技术实现步骤摘要】
医学术语的处理方法、装置、计算机设备和存储介质


[0001]本说明书实施方式涉及自然语言处理领域,具体涉及医学术语的处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]在临床试验和研究中,需要对不良事件、检查项目、既往病史、适应症、用药原因、死亡原因等进行医学编码,以便将这些信息用于医学核查、统计分析、病例检索等。现有的基于字、词本身的精确或模糊匹配方法会匹配出大量无关的候选标准术语,同时也可能会漏掉语义一致但字面不一样的候选标准术语,导致需要人工对大量候选标准术语进行选择或多次检索。

技术实现思路

[0003]有鉴于此,本说明书多个实施方式致力于提供一种文献资料文本分类方法、模型构建方法、分类装置、计算机设备和计算机存储介质,以提供一种能对不同文献资料文本打上层次标签的方法。
[0004]本说明书实施方式提出了一种医学术语的处理方法,包括:针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语;其中,所述预设标准医学术语知识图谱库中包括若干标准医学术语;其中,所述医学原词对应所述标准医学术语具有关系数据;对所述目标候选标准医学术语分别构建多维特征向量;其中,所述多维特征向量基于所述目标候选标准医学术语对应所述医学原词的关系数据,以及所述目标候选标准医学术语的词向量生成;使用所述医学原词生成的词向量与所述多维特征向量进行相似度运算,得出所述多维特征向量对应的目标候选标准医学术语与所述医学原词的相似度;基于所述相似度在目标候选标准医学术语中确定目标标准医学术语。
[0005]本说明书实施方式提出了一种医学术语的处理装置,包括:候选标准医学术语召回模块,用于针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语;其中,所述预设标准医学术语知识图谱库中包括若干标准医学术语;其中,所述医学原词对应所述标准医学术语具有关系数据;多维特征向量构建模块,用于对所述目标候选标准医学术语分别构建多维特征向量;其中,所述多维特征向量基于所述目标候选标准医学术语对应所述医学原词的关系数据,以及所述目标候选标准医学术语的词向量生成;相似度运算模块,用于使用所述医学原词生成的词向量与所述多维特征向量进行相似度运算,得出所述多维特征向量对应的目标候选标准医学术语与所述医学原词的相似度;目标标准医学术语确定模块,用于基于所述相似度在候选标准医学术语中确定目标标准医学术语。
[0006]本说明书实施方式提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述实施方式所述的
方法。
[0007]本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述实施方式所述的方法。
[0008]本说明书实施方式通过采用多种召回策略提高召回候选标签的准确率,再根据相似度计算的结果确定目标标准医学术语,可以在返回的目标标准术语尽量少的前提下提高返回的目标标准术语的准确率,进一步提高初始医学原词标准化编码的准确率,从而提高了医学术语编码人员的工作效率。
附图说明
[0009]图1所示为一实施方式提供的场景示例的交互示意图。
[0010]图2所示为一实施方式提供的场景示例的交互示意图。
[0011]图3所示为一实施方式提供的一种医学术语处理的方法示意图。
[0012]图4所示为一实施方式提供的标准医学术语知识图谱库中部分知识图谱示意图。
[0013]图5所示为一实施方式提供的一种医学术语处理的装置示意图。
具体实施方式
[0014]为了使本
的人员更好的理解本说明书方案,下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本说明书保护的范围。
[0015]请参阅图1和图2。本说明书提供一个医学术语处理系统的场景示例,所述医学术语处理系统可以包括客户端和服务器。其中,服务器中存储有标准医学术语知识图谱库。其中,客户端装有实现医学术语标准化处理的程序。用户可能是医疗领域的工作者,需要确定医学原词所对应的标准医学术语。在一次医学术语处理的事件中,用户可能会希望在预设的标准医学术语知识图谱中获取输入的医学原词可能对应的标准医学术语,再由所述医疗领域的工作者进一步分析、判断。
[0016]用户首先会向客户端输入初始医学原词,客户端在接收到初始医学原词后对医学原词进行大小写转换、全半角转换、简繁体转换、分词处理、分词改写等预处理步骤得到医学原词。用户可以在客户端中确定需要使用的召回策略和各种召回策略需要返回的候选标准医学术语的个数。接着,客户端会将医学原词、需要使用的召回策略及对应返回的候选标准术语的个数发送给服务器并请求返回候选标准术语。服务器在接收到客户端发送的请求后,会将数据库中的标准医学术语的词向量与接收到的医学原词的词向量按照对应的召回策略进行匹配度运算并按照匹配度运算的结果对标准医学术语按照从大到小的顺序排序,并根据用户设定的需要召回的标准医学术语的个数返回标准医学术语,对返回后的结果进行合并去重得到目标候选标准医学术语。
[0017]当确定了目标候选标准医学术语后,客户端便会根据目标候选标准医学术语构成的词向量和目标候选标准医学术语与医学原词之间的编辑距离构建目标候选标准医学术语的特征向量。接着,客户端会将医学原词生成的词向量与目标候选标准医学术语的特征
向量输入预设的相似度计算的深度学习模型中进行相似度计算,从而得到目标候选标准医学术语与医学原词之间的相似度。根据相似度运算的结果从高到低的顺序对目标候选标准医学术语进行排序。根据设定的输出目标标准医学术语的个数,客户端会输出目标标准医学术语。最后,客户端会在执行完医学术语标准化处理的程序后将目标标准医学术语通过显示器呈现给用户。
[0018]以上所述仅为本说明书提供的一个场景示例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换等,均应包含在本专利技术的保护范围之内。
[0019]本说明书实施方式提供一种医学术语的处理系统。所述医学术语的处理系统可以包括客户端和服务器。所述客户端可以是具有网络访问能力的电子设备。具体的,例如,客户端可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、电视机、智能音箱、麦克风等。其中,智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔、智能项链等。或者,客户端也可以为能够运行于所述电子设备中的软件。服务器可以是具有一定运算处理能力的电子设备。其可以具有网络通信模块、处理器和存储器等。当然,所述服务器也可以是指运行于所述电子设备中的软体。所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学术语的处理方法,其特征在于,包括:针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语;其中,所述预设标准医学术语知识图谱库中包括若干标准医学术语;其中,所述医学原词对应所述标准医学术语具有关系数据;对所述目标候选标准医学术语分别构建多维特征向量;其中,所述多维特征向量基于所述目标候选标准医学术语对应所述医学原词的关系数据,以及所述目标候选标准医学术语的词向量生成;使用所述医学原词生成的词向量与所述多维特征向量进行相似度运算,得出所述多维特征向量对应的目标候选标准医学术语与所述医学原词的相似度;基于所述相似度在目标候选标准医学术语中确定目标标准医学术语。2.根据权利要求1所述的方法,其特征在于,针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语前的步骤,还包括:对输入的初始医学原词进行预处理得到所述医学原词;其中,所述医学原词至少包括一个词语。3.根据权利要求2所述的方法,其特征在于,对输入的初始医学原词进行预处理的步骤,包括:对所述初始医学原词进行转换;其中,所述转换至少包括以下之一:大小写转换、全半角转换、简繁体转换;对经过转换的初始医学术语原词进行分词处理,并对所述分词的词性进行标注;将所述分词进行改写得到医学原词;其中,所述改写至少包括以下之一:所述分词的错词改写、所述分词的同义词扩展;根据所述医学原词在所述标准医学术语知识图谱库中的词频设置权重。4.根据权利要求1所述的方法,其特征在于,针对医学原词从预设标准医学术语知识图谱库中召回多个标准医学术语,将所述多个标准医学术语作为目标候选标准医学术语的步骤,包括:生成所述医学原词的词向量;将所述医学原词的词向量与所述标准医学术语知识图谱库中的标准医学术语生成的词向量根据指定的召回策略进行匹配度运算;其中,所述召回策略至少包括以下之一:基于字词的匹配度运算召回、基于编辑距离的匹配度运算召回、基于词向量的匹配度运算召回、基于词频的匹配度运算召回;根据所述匹配度运算的结果确定对应的召回策略召回的候选标准医学术语。5.根据权利要求4所述的方法,其特征在于,将所述医学原词的词向量与所述标准医学术语知识图谱库中的标准医学术语生成的向量根据指定的召回策略进行匹配度运算的步骤,包括:将所述医学原词的词向量与所述标准医学术语知识图谱库中的标准医学术语生成的向量输入到预设第一深度学习模型中计算匹配度;按照所述匹配度的大小顺序,输出所述标准医学术语及所述标准医学术语对应的匹配度。
6.根据权利要求4所述的方法,其特征在于,根据所述匹配度运算的结果确定对应的召回策略召回的候选标准医学术语的步骤,包括:设定不同召回策略召回的候选标准医学术语个数;根据所述匹配度和所述个数确定不同策略召回的候选标准医学术语;对不同的策略召回的候选标准医学术语合并,合并后的候选标准医学术语作为目标候选标准医学术语。7.根...

【专利技术属性】
技术研发人员:王永明
申请(专利权)人:杭州太美星程医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1