【技术实现步骤摘要】
数据匹配方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种数据匹配方法、装置、计算机设备和存储介质。
技术介绍
目前,在进行数据匹配时,如将各种命名不统一的药品名称进行匹配时,需要由后台获取待匹配的数据,基于自然语言逻辑将待匹配的数据切分成数据段,并对各数据段进行一一匹配分析,再综合各数据段匹配分析的结果确定数据匹配结果,以实现对待匹配数据的准确匹配。然而,按照自然语言逻辑将待匹配数据进行有效切分,当前难以实现,切分的精确度有限,容易切分出众多无效数据段,在进行匹配分析和综合匹配结果时需要进行繁杂的筛选甄别处理,降低了数据匹配处理的效率。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高数据匹配的处理效率的数据匹配方法、装置、计算机设备和存储介质。一种数据匹配方法,所述方法包括:当触发数据匹配操作时,展示预设的数据获取界面;在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量,药品名称匹配模型基于药品名称历史匹配数据训练得到;查询预设的药品基准名称向量表,药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相 ...
【技术保护点】
1.一种数据匹配方法,所述方法包括:/n当触发数据匹配操作时,展示预设的数据获取界面;/n在触发针对所述数据获取界面的操作后,获取通过所述操作所产生的待匹配数据信息;/n根据所述待匹配数据信息获取应用端的医疗记录,并从所述医疗记录中提取待匹配的药品匹配数据;/n通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量,所述药品名称匹配模型基于药品名称历史匹配数据训练得到;/n查询预设的药品基准名称向量表,所述药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;/n将所述药品名称匹配向量与所述药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。/n
【技术特征摘要】
1.一种数据匹配方法,所述方法包括:
当触发数据匹配操作时,展示预设的数据获取界面;
在触发针对所述数据获取界面的操作后,获取通过所述操作所产生的待匹配数据信息;
根据所述待匹配数据信息获取应用端的医疗记录,并从所述医疗记录中提取待匹配的药品匹配数据;
通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量,所述药品名称匹配模型基于药品名称历史匹配数据训练得到;
查询预设的药品基准名称向量表,所述药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;
将所述药品名称匹配向量与所述药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。
2.根据权利要求1所述的方法,其特征在于,所述药品名称匹配模型包括关键词匹配模型和上下文匹配模型;在所述通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理之前,还包括:
获取药品名称历史匹配数据,所述药品名称历史匹配数据包括药品关键词和所述药品关键词对应匹配的上下文数据;
将所述上下文数据作为CBOW模型的训练输入数据,将所述药品关键词作为所述CBOW模型的训练输出数据,通过所述上下文数据和所述药品关键词训练所述CBOW模型,得到所述关键词匹配模型;
将所述药品关键词作为Skip-gram模型的训练输入数据,将所述上下文数据作为所述Skip-gram模型的训练输出数据,通过所述药品关键词和所述上下文数据训练所述Skip-gram模型,得到所述上下文匹配模型。
3.根据权利要求2所述的方法,其特征在于,所述通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量包括:
将所述药品匹配数据输入所述上下文匹配模型中,并根据所述上下文匹配模型的隐藏层,得到上下文匹配向量;
根据所述药品匹配数据构建关键词匹配输入数据;
将所述关键词匹配输入数据输入所述关键词匹配模型中,并根据所述关键词匹配模型的隐藏层,得到关键词匹配向量;
根据所述上下文匹配向量和所述关键词匹配向量的均值,得到所述药品匹配数据对应的药品名称匹配向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述药品匹配数据构建关键词匹配输入数据包括:
将所述药品匹配数据进行两两组合,构建得到关键词匹配输入数据。
5.根据权利要求3所述的方法,其特征在于,
所述根据所述上下文匹配模型的隐藏层,得到上下文匹配向量包括:将所述上下文匹配模型的隐藏层权重,作为上下文...
【专利技术属性】
技术研发人员:唐强,耿爱香,
申请(专利权)人:平安医疗健康管理股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。