【技术实现步骤摘要】
一种医疗术语自动标准化方法和装置
[0001]本专利技术涉及人工智能
,具体涉及一种医疗术语自动标准化方法和装置。
技术介绍
[0002]目前国内各医疗机构使用的医学术语存在大量书写方式不统一的现象,造成信息分隔,为医疗数据的充分利用造成了障碍。现有的国际术语标准体系未能覆盖医疗机构中同一词汇的不同写法,且分类方式并不完全适用基于特定场景的临床产品应用。因此需要建立一套临床标准医学术语体系,来整合医疗数据中的多词一意的情况。由于医疗术语数据量巨大,仅通过人工进行词汇标准化存在耗时久、成本高、容易遗漏的情况。因此,急需一种能够快速对医学术语进行标准化处理的方案。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供一种医疗术语自动标准化方法和装置,以实现医疗术语自动标准化处理。
[0004]为实现上述目的,本专利技术实施例提供如下技术方案:一种医疗术语自动标准化方法,包括:获取基础数据词汇表,所述基础数据词汇表中具有基础医学词汇;基于所述基础数据词汇表对所需标准化的备选词进行分类;判断隶属于同 ...
【技术保护点】
【技术特征摘要】
1.一种医疗术语自动标准化方法,其特征在于,包括:获取基础数据词汇表,所述基础数据词汇表中具有基础医学词汇;基于所述基础数据词汇表对所需标准化的备选词进行分类;判断隶属于同一类的备选词中有无反义词,当属于同一类的不同备选词之间中具有反义词时,基于所述反义词继续对所述隶属于同一类的备选词进行再次分类;计算隶属于同一类的各个备选词之间的相似度;将相似度大于预设值的各个备选词之间建立同义词关系;确定具有同义词关系的备选词对应的标准词汇,建立所述标准词汇与其对应的备选词之间的映射关系。2.根据权利要求1所述的医疗术语自动标准化方法,其特征在于,还包括:剔除各类备选词中的无意义词汇,记为修正备选词,确定所述备选词与所述修正备选词之间的映射关系;计算隶属于同一类的各个备选词之间的相似度,所述将相似度大于预设值的各个备选词之间建立同义词关系,包括:计算隶属于同一类的各个修正备选词之间的相似度,将相似度大于预设值的各个修正备选词之间建立同义词关系。3.根据权利要求1所述的医疗术语自动标准化方法,其特征在于,所述确定具有同义词关系的备选词对应的标准词汇,包括:判断具有同义词关系的各个备选词是否存在对应的标准词汇,如果存在,将该标准词汇作为所述具有同义词关系的备选词对应的标准词汇,如果不存在,选择具有同义词关系的各个备选词中的一个备选词作为标准词汇。4.根据权利要求1所述的医疗术语自动标准化方法,其特征在于,所述基础医学词汇包括:部位、侧别和分型中的一项或多项,所述基础数据词汇表中还存储有基础医学词汇之间的同义词关系。5.根据权利要求1所述的医疗术语自动标准化方法,其特征在于,基于所述基础数据词汇表对所需标准化的备选词进行分类,包括:基于所述基础数据词汇表提取各个所需标准化的备选词中所包含的基础医学词汇;判断是否存在基础医学词汇全部相同或者是为同义词的备选词,如果是,将该备选词划分为同一类。6.一种医疗术语自动标准化装置,其特征在于,包括:基础数据词汇表采集单元,用于获取基础数据词汇表,...
【专利技术属性】
技术研发人员:王硕,胡可云,陈联忠,
申请(专利权)人:北京嘉和海森健康科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。