【技术实现步骤摘要】
一种医学术语标准化方法、系统、设备及介质
[0001]本申请涉及医学术语标准化
,尤其涉及一种医学术语标准化方法、系统、设备及介质。
技术介绍
[0002]医学术语标准化是将不同来源或格式的医学术语统一为一种标准形式的过程,旨在实现数据的互操作性。这对于数据要素共享、医疗决策支持系统、医疗科学研究等都至关重要。然而,医学术语的多样性和复杂性导致了术语间的映射和转换问题。例如,同一种疾病在不同的术语集中可能有不同的编码和名称。此外,医生在记录病人信息时可能会使用各种缩写、同义词和非正式的术语,这进一步增加了标准化的复杂性。
[0003]现有的医学术语标准化的实现方案主要为:获取医学术语原始数据;对医学术语原始数据进行分类,得到短术语类数据和长术语类数据;建立与短术语类数据对应的同义词库;根据同义词库、变体规则库、召回模型和排序模型构建医学术语标准化框架。
[0004]但是,上述方法为了使后续模型能够得到有效的训练,需要为算法提供大量的分类标注数据。而分类标注数据需要大量的时间和人力资源,也存在因为标注者的 ...
【技术保护点】
【技术特征摘要】
1.一种医学术语标准化方法,其特征在于,所述方法包括:创建医学术语数据库和数据库对应的向量化搜索引擎;其中,医学术语数据库包含若干医学术语,医学术语至少包括非标准医学术语、标准医学术语,医学术语数据库包含非标准医学术语和标准医学术语之间的对应关系;获取医学术语标注数据,使用医学术语标注数据训练预设小样本对比学习算法;通过训练好的预设小样本对比学习算法,将医学术语数据库中的医学术语进行编码,以获得对应的第一向量化表示;将第一向量化表示放入向量化搜索引擎中,以更新向量化搜索引擎;通过训练好的预设小样本对比学习算法,获取输入的待标准化医学术语对应的第二向量化表示;通过更新后的向量化搜索引擎,获取第二向量化表示在医学术语数据库中对应的标准医学术语。2.根据权利要求1所述的医学术语标准化方法,其特征在于,所述方法还包括:检测输入的待标准化医学术语是否存在于医学术语数据集中,在不存在于医学术语数据集中时,将输入的待标准化医学术语以及待标准化医学术语与标准医学术语之间的对应关系导入医学术语数据集中,以完成医学术语数据集更新;并将输入的待标准化医学术语对应的第二向量化表示,放入向量化搜索引擎中,以更新向量化搜索引擎。3.根据权利要求1所述的医学术语标准化方法,其特征在于,通过更新后的向量化搜索引擎,获取第二向量化表示在医学术语数据库中对应的标准医学术语,具体包括:通过更新后的向量化搜索引擎,获取第二向量化表示在医学术语数据库中对应的若干医学术语;通过相似度计算算法,确定相似度超过预设阈值的若干医学术语为校对医学术语;确定相似度最高的医学术语为参考医学术语;确定若干校对医学术语对应的标准医学术语中出现次数最多的为校对标准医学术语;确定参考医学术语对应的参考标准医学术语;当校对标准医学术语与参考标准医学术语一致时,确定校对标准医学术语为输入的待标准化医学术语对应的标准医学术语;在不一致时,生成校对任务至预设用户校对终端。4.根据权利要求1所述的医学术语标准化方法,其特征在于,在获取输入的待标准化医学术语对应的第二向量化表示之前,所述方法还包括:通过预设数据获取界面,获取输入的待标准化医学术语。5.一种医学术语标准化系统,其特征在于,所述系统包括:创建模块,用于创建医学术语数据库和数据库对应的向量化搜索引擎;其中,医学术语数据库包含若干医学术语,医学术语至少包括非标准医学术语...
【专利技术属性】
技术研发人员:郭鹏,邓小宁,史浩田,浦飞飞,张海音,蒋昕,唐倩,
申请(专利权)人:北方健康医疗大数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。