医学术语标准化的方法、装置、设备及存储介质制造方法及图纸

技术编号:37388428 阅读:27 留言:0更新日期:2023-04-27 07:27
本申请提供了一种医学术语标准化的方法、装置、设备及存储介质。该方法包括:确定任一医学用语的语义特征;根据所述语义特征,从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索所述医学用语对应的标准术语集;其中,所述标签前缀树由所述目标分类标签下的多个标准术语组成。本申请实施例可以避免医学用语标准化后的标准术语遗漏,从而保证医学术语标准化的全面性。而且,无需对医学知识库中的每个标准术语进行与该医学术语间的概率预测,在确保医学术语标准化的准确性的基础上,通过借助目标分类标签下构建的标签前缀树,提升医学术语标准化的高效性。提升医学术语标准化的高效性。提升医学术语标准化的高效性。

【技术实现步骤摘要】
医学术语标准化的方法、装置、设备及存储介质


[0001]本申请实施例涉及自然语言处理
,具体涉及一种医学术语标准化的方法、装置、设备及存储介质。

技术介绍

[0002]在医学领域下,临床术语标准化任务已经成为医学数据统计中不可或缺的一项任务。关于同一种医学诊断、手术、药品、医疗检查、化验、症状等,通常会存在多种不同的医学用语。所以,为了保证医学数据统计的规范性,需要将原始的医学用语转换为统一的标准术语,以便研究人员对各个患者的电子病历进行相应的诊断分析。
[0003]通常情况下,可以通过预先构建的序列到序列模型对原始的医学用语进行特征分析,来预测知识库中每个标准术语的字符概率,从而得到该医学用语对应的标准术语。但是,考虑到知识库中收录有大量繁琐的标准术语,通过序列到序列模型预测每个标准术语的字符概率,来对原始的医学用语进行标准化时,会耗费极大的时间成本,且无法保证医学术语标准化的准确性,使得医学术语标准化存在一定的局限性。

技术实现思路

[0004]本申请实施例提供一种医学术语标准化的方法、装置、设备及存储介质,确保医学术语标准化的准确性,提升医学术语标准化的高效性和全面性。
[0005]第一方面,本申请实施例提供了一种医学术语标准化的方法,该方法包括:
[0006]确定任一医学用语的语义特征;
[0007]根据所述语义特征,从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索所述医学用语对应的标准术语集;
[0008]其中,所述标签前缀树由所述目标分类标签下的多个标准术语组成。
[0009]第二方面,本申请实施例提供了一种医学术语标准化的装置,该装置包括:
[0010]特征确定模块,用于确定任一医学用语的语义特征;
[0011]医学术语标准化模块,用于根据所述语义特征,从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索所述医学用语对应的标准术语集;
[0012]其中,所述标签前缀树由所述目标分类标签下的多个标准术语组成。
[0013]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
[0014]处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行本申请第一方面中提供的医学术语标准化的方法。
[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行如本申请第一方面中提供的医学术语标准化的方法。
[0016]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如本申请第一方面中提供的医学术语标准化的方
法。
[0017]本申请实施例提供一种医学术语标准化的方法、装置、设备及存储介质,对于任一医学用语,首先会确定该医学用语的语义特征。然后,根据该语义特征,从该医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索该医学用语对应的标准术语集,避免医学用语标准化后的标准术语遗漏,从而保证医学术语标准化的全面性。而且,无需对医学知识库中的每个标准术语进行与该医学术语间的概率预测,在确保医学术语标准化的准确性的基础上,通过借助目标分类标签下构建的标签前缀树,提升医学术语标准化的高效性。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例示出的一种医学术语标准化的方法的流程图;
[0020]图2为本申请实施例示出的序列到序列模型的结构示意图;
[0021]图3为本申请实施例示出的脑部手术操作的分类标签下的标签前缀树的示例性示意图;
[0022]图4为本申请实施例示出的另一种医学术语标准化的方法的流程图;
[0023]图5为本申请实施例示出的通过序列到序列模型结合标签前缀树进行医学术语标准化的原理示意图;
[0024]图6为本申请实施例示出的医学用语在当前分类标签下进行术语标准化的方法流程图;
[0025]图7为本申请实施例示出的一种医学术语标准化的装置的原理框图;
[0026]图8为本申请实施例示出的电子设备的示意性框图。
具体实施方式
[0027]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0029]为了解决对于任一医学用语存在术语标准化不准确,且时间成本耗费较大的问
Short

Term Memory,简称为LSTM)模型。
[0041]以医学用语为“双侧脑深部电刺激植入术”为例,通过Bert模型对该医学用语进行相应处理,可以得到该医学用语的文本表示向量为[m1,m2,

,m
n
]。那么,如图2所示,seq2seq模型中编码器内的循环单元的数量与该医学用语的文本表示向量的维数相同,使得医学用语的文本表示向量中每一维度下的特征值m
i
可以作为编码器中第i个循环单元的输入。然后,通过编码器中的各个循环单元依次对文本表示向量中各个维度下的特征值进行相应的特征分析,从而将最后一个特征值m
n
输入的循环单元输出的隐状态向量作为该医学用语的语义特征。
[0042]此外,本申请也可以对编码器中最后一个循环单元输出的隐状态向量进行相应的变换,来得到该医学用语的语义特征。或者,还可以对编码器中各个循环单元输出的所有隐状态向量进行统一的变换,来得到该医学用语的语义特征。本申请对此不作限定。
[0043]后续,可以将编码器对于该医学用语输出的语义特征输入到解码器中,产生解码器中第一个循环单元的字符输出和隐状态,而将解码器中第一个循环单元的字符输出和隐状态作为解码器中第二个循环单元的输入,产生第二个循环单元的字符输出和隐状态,以此循环,来得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学术语标准化的方法,其特征在于,包括:确定任一医学用语的语义特征;根据所述语义特征,从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索所述医学用语对应的标准术语集;其中,所述标签前缀树由所述目标分类标签下的多个标准术语组成。2.根据权利要求1所述的方法,其特征在于,所述根据所述语义特征,从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中,搜索所述医学用语对应的标准术语集,包括:根据所述医学用语的语义特征,确定初始分类标签,作为当前分类标签;执行标准术语搜索步骤:根据所述当前分类标签和所述当前分类标签下的隐状态向量,从所述当前分类标签下构建的标签前缀树中,搜索所述医学用语在所述当前分类标签下的目标标准术语;根据所述目标标准术语中的末尾字符和所述末尾字符下的隐状态向量,预测下一分类标签,作为新的当前分类标签,继续返回执行上述标准术语搜索步骤,直至所述下一分类标签为空白字符,得到所述医学用语对应的标准术语集。3.根据权利要求2所述的方法,其特征在于,所述根据所述当前分类标签和所述当前分类标签下的隐状态向量,从所述当前分类标签下构建的标签前缀树中,搜索所述医学用语在所述当前分类标签下的目标标准术语,包括:将所述当前分类标签下的标签前缀树中根节点的子节点,作为当前节点;根据所述当前分类标签和所述当前分类标签下的隐状态向量,预测所述当前节点下的字符概率,以确定所述医学用语在所述当前分类标签下搜索出的首个字符,并将所述首个字符作为当前字符;执行字符预测步骤:将所述当前字符在所述标签前缀树中所处节点的子节点,作为新的当前节点;根据所述当前字符在所述标签前缀树中的字符搜索轨迹和所述当前字符下的隐状态向量,预测所述新的当前节点下的字符概率,以确定所述当前字符的后一字符;...

【专利技术属性】
技术研发人员:孙小婉蔡巍张霞
申请(专利权)人:沈阳东软智能医疗科技研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1