一种检验数据标准化的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31486324 阅读:27 留言:0更新日期:2021-12-18 12:21
本发明专利技术公开了一种检验数据标准化的方法、装置、电子设备和存储介质。该方法包括:获取待确定标准化词条的待处理文本;根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。本发明专利技术实施例解决了目前已有的检验术语匹配方法没有考虑语义层面的术语解释造成检验效果低的问题,提升了检验术语匹配的效果。提升了检验术语匹配的效果。提升了检验术语匹配的效果。

【技术实现步骤摘要】
一种检验数据标准化的方法、装置、电子设备和存储介质


[0001]本专利技术实施例涉及数据处理技术,尤其涉及一种检验数据标准化的方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,医学领域中存在大量的非结构化文本和结构化文本数据,区域化医疗数据的数据差别越来越明显,对医学数据进行数据检验时,术语标准化问题成为亟待解决的首要问题。
[0003]目前已有的检验术语方法大部分是通过字面特征进行统计打分,仅仅依靠名称相似度获得与术语相匹配的数据信息,这种传统的仅利用字面特征获取的匹配结果丢失了检验文本中的有用信息,不能及时的反馈术语准确的信息,极大的耗费人力物力,并且耽误宝贵的治疗时间,还会给病人造成不必要的经济损失。

技术实现思路

[0004]本专利技术实施例提供一种检验数据标准化的方法、装置、电子设备和存储介质,以实现对数据进行标准化处理,输出具有可读性的标准化语句。
[0005]第一方面,本专利技术实施例提供了一种检验数据标准化的方法,包括:
[0006]获取待确定标准化词条的待处理文本;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检验数据标准化的方法,其特征在于,包括:获取待确定标准化词条的待处理文本;根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。2.根据权利要求1所述的方法,其特征在于,所述根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条,包括:对所述待处理文本进行标注处理,得到与所述待处理文本相对应的待处理术语;基于所述待处理术语和所述检验术语知识库中的各待配准术语,确定与所述待处理文本相对应的第一待确定标准词条。3.根据权利要求1所述的方法,其特征在于,所述基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条,包括:将所述待处理文本和各待配准标准术语输入至预先训练得到的对比学习模型中,得到各待配准标准术语与所述待处理文本之间的相似度值;基于各相似度值,确定与所述待处理文本相对应的第二待确定标准词条。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条,包括:如果所述第一待确定标准词条和所述第二待确定标准词条中存在重复的待显示标准词条,则将所述待显示标准词条作为所述目标标准化词条;如果所述第一待确定标准词条与所述第二待确定标准词条中不存在重复的待显示标准词条,则将所述第一待确定标准词条作为所述目标标准化词条;如果仅包括第一待确定标准词条,将所述第一待确定标准词条作为所述目标标准词条;如果仅包括第二待确定标准词条,将相似度值最高的第二待确定标准词条作为所述目标标准词条。5.根据权利要求1所述的方法,其特征在于,还包括:确定检验术语知识库;所述确定检验术语知识库,包括:获取至少一条待处理检验术语语料,并基于预先确定的拆分规则,得到与每条待处理检验术语语料相对应的待处理术语;根据各待处理检验术语确定所述检验术语知识库。6.根据权...

【专利技术属性】
技术研发人员:刘霄晨罗永贵肖劲尹芳张晓璐马晶
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1