一种临床术语标准化方法及装置、存储介质制造方法及图纸

技术编号:40420342 阅读:38 留言:0更新日期:2024-02-20 22:39
本申请公开了一种临床术语标准化方法及装置、存储介质,该方法包括:S1将临床术语原词输入标准词数量预测模型,得到对应的预测标准词数量;S2基于BERT‑CRF构建的关键词抽取检索模型与Jaccard文本相似度算法得到第一部分候选标准词;S3基于历史检索方法得到第二部分候选标准词,结合所述第一部分候选标准词与所述第二部分候选标准词,得到候选标准词集合;S4基于数据增强方法构建文本蕴含数据集,基于利用所述文本蕴含集训练得到的文本蕴含模型与所述预测标准词数量确定临床术语标准词。该方法能够有效的匹配临床术语原词对应的候选标准词,提高临床术语标准化任务的准确率。

【技术实现步骤摘要】

本申请涉及计算机,主要涉及一种临床术语标准化方法及装置、存储介质


技术介绍

1、电子病历作为医疗诊断的载体,记录了病人的重要信息。由于不同医生之间书写风格的差异和临床术语表达方式的多样,导致对于同一个病人,不同医生给出的电子病历的表述也有所差别。这种医学实体表达不统一的情况阻碍了研究人员对电子病历的统计和分析,也对医疗人员检索和研究相关病例产生不便。临床术语标准化是解决医学实体表达统一的方法,即对医生书写的术语给出标准术语集内对应的标准词。目前部分医院雇佣工作人员对医生给出的临床术语做标准化处理,但是临床术语标准化任务需要专业的医学知识和大量的人力成本,得到的标准化结果也不够准确。因此,临床术语标准词的自动化生成方法对电子病历的解读和利用具有重要意义。

2、2016年,宁温馨和于明在基于汉字和词语构成词向量的基础上,利用分布式语义实现中文临床术语标准化。2019年,赵逸凡等使用siamese网络架构和lstm网络搭建模型,实现了基于深度学习的电子病历实体标准化算法。2020年,黄嘉俊在基于领域知识库结合分词、实体识别和词向量表示技术的基础上,本文档来自技高网...

【技术保护点】

1.一种临床术语标准化方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤S1所述的将临床术语原词输入标准词数量预测模型之前,包括以下步骤:

3.根据权利要求1所述的方法,其特征在于,步骤S2所述的基于临床术语训练集对BERT-CRF模型进行训练,包括以下步骤:

4.根据权利要求3所述的方法,其特征在于,步骤S2所述的基于所述关键词抽取检索模型与Jaccard文本相似度算法对所述临床术语原词进行候选标准词匹配,包括以下步骤:

5.根据权利要求1所述的方法,其特征在于,步骤S3所述的基于历史检索方法匹配第二...

【技术特征摘要】

1.一种临床术语标准化方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤s1所述的将临床术语原词输入标准词数量预测模型之前,包括以下步骤:

3.根据权利要求1所述的方法,其特征在于,步骤s2所述的基于临床术语训练集对bert-crf模型进行训练,包括以下步骤:

4.根据权利要求3所述的方法,其特征在于,步骤s2所述的基于所述关键词抽取检索模型与jaccard文本相似度算法对所述临床术语原词进行候选标准词匹配,包括以下步骤:

5.根据权利要求1所述的方法,其特征在于,步骤s3所述的基于历史检索方法匹配第二部分候选标准词,所述历史检索方法是基于所述临床术语训练集与所述临床术语原词进行检索,基于所述jaccard文本相似度算法对所述检索的结果进行候选标准词的筛选,结合所述第一部分候选标准词与所述第二部分候选标准词,得到候选标准词集合,包括...

【专利技术属性】
技术研发人员:张旭戴睿煜崔建峰邱际光吴少华吴江煌
申请(专利权)人:厦门理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1