医学核心词知识库构建方法、装置、介质及终端制造方法及图纸

技术编号:41347200 阅读:14 留言:0更新日期:2024-05-20 10:02
本申请提供一种医学核心词知识库构建方法、装置、介质及终端,通过构建语料库和核心词组聚类的方式,对终选核心词条目进行成分配置,从而构建医学核心词知识库,使得终选核心词条目在应用时能满足医学变量既匹配标准医学术语,又匹配非术语正则或函数表达式的需求,从而能够满足诊疗过程中的智能诊断推荐、用药推荐等场景的使用需要,丰富了使用场景,并且多个不同的医学变量能复用相同的终选核心词条目,避免了医学变量内涵的重复生产。另外,根据正则匹配结果和术语匹配结果的一致性进行数据质控和优化,降低了质控、标注的工作量,保证了医学核心词知识库的一致性和标准性。

【技术实现步骤摘要】

本申请涉及医学数据处理,特别是涉及一种医学核心词知识库构建方法、装置、介质及终端


技术介绍

1、当前数据应用类的医疗信息软件需要从医疗数据中进行医学变量提取,经过概念定义、逻辑定义、归一化处理等过程,以变量的形式实现对医疗数据进行提取、运算和应用,建立医学知识库。正则表达式和术语编码是实现医学变量定义和归一化处理的两种常用方式,但存在以下问题:1)目前通用的医学术语编码体系如icd10等为特定场景制定,与临床诊疗过程习惯用语差异较大,难以满足诊疗过程中的智能诊断推荐、用药推荐等场景的使用需要。2)为确保术语和正则表达式取数的正确性,需要结合大量医疗数据进行标注、质控和调优,此过程目前耗费人力,实施成本高昂。3)知识库在多个项目和产品使用,需要基于项目和产品需求对术语和正则表达式做定制化更新,需要对多个内容版本做兼容和管理,现存方法难以确保多个内容版本的概念一致性,容易造成新旧版本间的冗余和混淆。


技术实现思路

1、鉴于以上所述现有技术的缺点,本申请的目的在于提供一种医学核心词知识库构建方法、装置、介质及终端本文档来自技高网...

【技术保护点】

1.一种医学核心词知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对所述语料库中的核心词条目进行同义词聚类以得到多个核心词组别的方式包括:

3.根据权利要求2所述的医学核心词知识库构建方法,其特征在于,计算所述语料库中两两核心词条目之间的相似度的方式包括:利用字符相似度算法计算得到所述语料库中两两核心词条目之间的相似度;以及/或者,利用语义相似度算法计算得到所述语料库中两两核心词条目之间的相似度。

4.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对各个终选核心词条目进行成分配置以得到医学核...

【技术特征摘要】

1.一种医学核心词知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对所述语料库中的核心词条目进行同义词聚类以得到多个核心词组别的方式包括:

3.根据权利要求2所述的医学核心词知识库构建方法,其特征在于,计算所述语料库中两两核心词条目之间的相似度的方式包括:利用字符相似度算法计算得到所述语料库中两两核心词条目之间的相似度;以及/或者,利用语义相似度算法计算得到所述语料库中两两核心词条目之间的相似度。

4.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对各个终选核心词条目进行成分配置以得到医学核心词知识库的方式包括:正则表达式配置、术语编码配置、同义词配置以及黑名单配置中的一种或者多种的组合。

5.根据权利要求1所述的医学核心词知...

【专利技术属性】
技术研发人员:马汉东张少典尹富源
申请(专利权)人:上海森亿医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1