【技术实现步骤摘要】
本申请涉及医学数据处理,特别是涉及一种医学核心词知识库构建方法、装置、介质及终端。
技术介绍
1、当前数据应用类的医疗信息软件需要从医疗数据中进行医学变量提取,经过概念定义、逻辑定义、归一化处理等过程,以变量的形式实现对医疗数据进行提取、运算和应用,建立医学知识库。正则表达式和术语编码是实现医学变量定义和归一化处理的两种常用方式,但存在以下问题:1)目前通用的医学术语编码体系如icd10等为特定场景制定,与临床诊疗过程习惯用语差异较大,难以满足诊疗过程中的智能诊断推荐、用药推荐等场景的使用需要。2)为确保术语和正则表达式取数的正确性,需要结合大量医疗数据进行标注、质控和调优,此过程目前耗费人力,实施成本高昂。3)知识库在多个项目和产品使用,需要基于项目和产品需求对术语和正则表达式做定制化更新,需要对多个内容版本做兼容和管理,现存方法难以确保多个内容版本的概念一致性,容易造成新旧版本间的冗余和混淆。
技术实现思路
1、鉴于以上所述现有技术的缺点,本申请的目的在于提供一种医学核心词知识库构建方
...【技术保护点】
1.一种医学核心词知识库构建方法,其特征在于,包括:
2.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对所述语料库中的核心词条目进行同义词聚类以得到多个核心词组别的方式包括:
3.根据权利要求2所述的医学核心词知识库构建方法,其特征在于,计算所述语料库中两两核心词条目之间的相似度的方式包括:利用字符相似度算法计算得到所述语料库中两两核心词条目之间的相似度;以及/或者,利用语义相似度算法计算得到所述语料库中两两核心词条目之间的相似度。
4.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对各个终选核心词条目进行
...【技术特征摘要】
1.一种医学核心词知识库构建方法,其特征在于,包括:
2.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对所述语料库中的核心词条目进行同义词聚类以得到多个核心词组别的方式包括:
3.根据权利要求2所述的医学核心词知识库构建方法,其特征在于,计算所述语料库中两两核心词条目之间的相似度的方式包括:利用字符相似度算法计算得到所述语料库中两两核心词条目之间的相似度;以及/或者,利用语义相似度算法计算得到所述语料库中两两核心词条目之间的相似度。
4.根据权利要求1所述的医学核心词知识库构建方法,其特征在于,对各个终选核心词条目进行成分配置以得到医学核心词知识库的方式包括:正则表达式配置、术语编码配置、同义词配置以及黑名单配置中的一种或者多种的组合。
5.根据权利要求1所述的医学核心词知...
【专利技术属性】
技术研发人员:马汉东,张少典,尹富源,
申请(专利权)人:上海森亿医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。