【技术实现步骤摘要】
应用于医学领域的词语标准化方法、装置和电子设备
[0001]本公开的实施例涉及医疗服务领域,具体涉及应用于医学领域的词语标准化方法、装置和电子设备。
技术介绍
[0002]随着大数据时代的到来,医疗健康已成为大数据应用的重要领域,医疗数据可应用于疾病的辅助诊断、治疗方案确定、流行病预测、药物副作用分析、医学临床研究等诸多方面。由于在书写医疗相关记录时用词中会有许多形态和语法的变化,也会使用不同的词序或同义词,这为医疗数据的应用带来了极大的困难。目前应用的基于规则来处理医学词语的方法不仅耗时耗力,且准确率也无法得到保障。由此,急需一种高效、准确的词语标准化的处理方法。
技术实现思路
[0003]有鉴于此,本公开实施例提供了一种应用于医学领域的词语标准化方法、装置和电子设备,以解决现有技术中如何实现医学词语标准化的问题。
[0004]本公开实施例的第一方面,提供了一种应用于医学领域的词语标准化方法,包括:获取待标准化词语;将上述待标准化词语输入至预先训练的语言处理模型,生成上述待标准化词语的空间向量;基于 ...
【技术保护点】
【技术特征摘要】
1.一种应用于医学领域的词语标准化方法,包括:获取待标准化词语;将所述待标准化词语输入至预先训练的语言处理模型,生成所述待标准化词语的空间向量;基于所述待标准化词语、所述空间向量,计算所述待标准化词语与预设标准词语库中至少一个标准词语中每个标准词语之间的相似度,得到相似度集合;基于所述相似度集合,从所述预设标准词语库中选择出目标标准词语。2.根据权利要求1所述的应用于医学领域的词语标准化方法,其特征在于,所述预设标准词语库是根据以下步骤构建得到的:获取用于构建所述预设标准词语库的第一候选标准词语集合;对于所述第一候选标准词语集合按照字粒度进行去重处理,得到处理完成的第二候选标准词语集合;利用预先设置的字粒度权重算法,计算所述第二候选标准词语集合中每个候选标准词语对应的每个字符的权重,得到所述候选标准词语的字符权重列表;基于所述第二候选标准词语集合中每个候选标准词语的字符权重列表进行组合,得到所述预设标准词语库。3.根据权利要求2所述的应用于医学领域的词语标准化方法,其特征在于,所述基于所述待标准化词语、所述空间向量,计算所述待标准化词语与预设标准词语库中至少一个标准词语中每个标准词语之间的相似度,得到相似度集合,包括:计算所述空间向量与所述预设标准词语库中至少一个标准词语中每个标准词语的空间向量之间的余弦相似度分数;基于所述待标准化词语,计算所述预设标准词语库中至少一个标准词语中每个标准词语的权重分数;对于所述预设标准词语库中的每个标准词语,将所述标准词语对应的余弦相似度分数和权重分数相加,得到用于表征所述标准词语与所述待标准化词语之间的相似度的分数。4.根据权利要求3所述的应用于医学领域的词语标准化方法,其特征在于,所述基于所述待标准化词语,计算所述预设标准词语库中至少一个标准词语中每个标准词语的权重分数,包括:基于所述待标准化词语,对所述预设标准词语库按照字粒度进行去重处理,得到去重处理后的候选词集合,其中,所述预设标准词语库中包括至少一个标准词语以及所述标准词语对应的字符权重列表;基于所述候选词集合中每个...
【专利技术属性】
技术研发人员:白焜太,杨雅婷,宋佳祥,刘硕,许娟,史文钊,
申请(专利权)人:神州医疗科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。