医疗类术语标准化方法以及装置制造方法及图纸

技术编号:39433302 阅读:29 留言:0更新日期:2023-11-19 16:16
本发明专利技术公开了一种医疗类术语标准化方法以及装置,此方法基于预先训练得到的编码器模型确定与待匹配疾病文本相对应的待匹配特征向量;确定待匹配特征向量和标准向量库中各标准向量之间的向量相似度;其中,标准向量对应于标准语句,标准语句包括标准编码语句和/或形态学编码语句;基于待匹配疾病文本、各标准语句以及预先训练得到的相似判别模型,确定待匹配疾病文本与各标准语句之间的相似置信度;基于向量相似度、相似置信度以及与待匹配疾病文本相对应的形态编码分类结果,确定与待匹配疾病文本相对应的目标标准语句。本技术方案实现了有效、准确的确定与待匹配疾病文本相对应的目标标准语句,从而得到其标准编码和/或形态学编码的效果。态学编码的效果。态学编码的效果。

【技术实现步骤摘要】
医疗类术语标准化方法以及装置


[0001]本专利技术涉及计算机处理
,尤其涉及一种医疗类术语标准化方法、以及装置。

技术介绍

[0002]医生在书写病历时,由于口语化表述习惯等原因,录入到电子病历系统中的疾病名称并不能完全与ICD

10编码一致,导致电子病历信息无法被计算机识别和处理。为了解决该问题,通过智能技术将电子病历上口语化的疾病名称映射到标准ICD

10编码上,可以提高临床数据的质量,便于数据应用到下游如临床统计、分组计费等场景中。
[0003]其中一类特殊的场景是肿瘤术语标准化,可选的,可以基于用户对肿瘤类术语进行标准化处理,然而在人工的编码员对肿瘤类术语的标化过程中,部分词条仅需要给出标准编码,而部分词条需要在给出标准编码的同时提供形态学编码以辅助更准确的表述肿瘤疾病信息,比如“胃窦管状腺瘤”标化时,需要标注标准编码<D13.102,胃良性肿瘤>,同时附带形态学编码<M821100/3,管状腺瘤>方能完整表达词条信息,因此,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种医疗类术语标准化方法,其特征在于,包括:基于预先训练得到的编码器模型确定与待匹配疾病文本相对应的待匹配特征向量;确定所述待匹配特征向量和标准向量库中各标准向量之间的向量相似度;其中,所述标准向量对应于标准语句,所述标准语句包括标准编码语句和/或形态学编码语句,所述标准向量是基于所述编码器模型确定的;基于所述待匹配疾病文本、各标准语句以及预先训练得到的相似判别模型,确定所述待匹配疾病文本与各标准语句之间的相似置信度;基于所述向量相似度、相似置信度以及与所述待匹配疾病文本相对应的形态编码分类结果,确定与所述待匹配疾病文本相对应的目标标准语句;反馈所述目标标准语句。2.根据权利要求1所述的方法,其特征在于,还包括:训练得到所述编码器模型;所述训练得到所述编码器模型,包括:对于各待标准化文本,根据当前待标准化文本的标准编码语句和/或形态编码语句,确定至少一个训练样本;基于所述训练样本中的当前待标准化文本输入至待训练编码器模型中,得到第一向量;以及,将与所述当前待标准化文本的标准编码语句或形态编码语句输入至所述待训练编码器模型中,得到第二向量;基于各训练样本的第一向量和所述第二向量对所述待训练编码器模型中的模型参数进行修正;将所述待训练编码器模型中的损失函数收敛作为训练目标,得到所述编码器模型。3.根据权利要求1所述的方法,其特征在于,还包括:训练得到相似判别模型;所述训练得到所述相似判别模型,包括:获取待标准化文本、与所述待标准化文本相对应的标准编码语句或,与所述待标准化文本相对应的标准编码语句和形态编码语句;基于所述待标准化文本以及相应的标准编码语句,确定训练样本,以及基于所述待标准化文本以及相应的形态学编码语句,扩充所述训练样本;通过对训练样本中的待标准化文本以及相应的标准编码语句或形态学编码语句拼接处理,得到正样本;基于待标准化文本以及与其不相符的标准编码语句或形态学编码语句拼接处理,得到负样本;基于所述正样本以及负样本对待训练相似判别模型进行训练,得到所述相似判别模型。4.根据权利要求1所述的方法,其特征在于,还包括:训练得到形态学编码检测模型,以基于所述形态学编码检测模型对待匹配疾病文本进行处理,确定所述待匹配疾病文本是否存在形态学编码文本,以确定与所述待匹配疾病文本相对应的目标标准语句。5.根据权利要求4所述的方法,其特征在于,所述训练得到形态学编码检测模型,包括:
获取待标准...

【专利技术属性】
技术研发人员:金晓辉张俊锋
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1