数据匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24211976 阅读:14 留言:0更新日期:2020-05-20 17:17
本申请涉及一种数据匹配方法、装置、计算机设备和存储介质。所述方法涉及神经网络分类模型,包括:当触发数据匹配操作时,展示预设的数据获取界面;在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量;查询预设的药品基准名称向量表;将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。采用本方法能够提高数据匹配的处理效率。

Data matching methods, devices, computer equipment and storage media

【技术实现步骤摘要】
数据匹配方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种数据匹配方法、装置、计算机设备和存储介质。
技术介绍
目前,在进行数据匹配时,如将各种命名不统一的药品名称进行匹配时,需要由后台获取待匹配的数据,基于自然语言逻辑将待匹配的数据切分成数据段,并对各数据段进行一一匹配分析,再综合各数据段匹配分析的结果确定数据匹配结果,以实现对待匹配数据的准确匹配。然而,按照自然语言逻辑将待匹配数据进行有效切分,当前难以实现,切分的精确度有限,容易切分出众多无效数据段,在进行匹配分析和综合匹配结果时需要进行繁杂的筛选甄别处理,降低了数据匹配处理的效率。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高数据匹配的处理效率的数据匹配方法、装置、计算机设备和存储介质。一种数据匹配方法,所述方法包括:当触发数据匹配操作时,展示预设的数据获取界面;在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量,药品名称匹配模型基于药品名称历史匹配数据训练得到;查询预设的药品基准名称向量表,药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。在其中一个实施例中,药品名称匹配模型包括关键词匹配模型和上下文匹配模型;在通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理之前,还包括:获取药品名称历史匹配数据,药品名称历史匹配数据包括药品关键词和药品关键词对应匹配的上下文数据;将上下文数据作为CBOW模型的训练输入数据,将药品关键词作为CBOW模型的训练输出数据,通过上下文数据和药品关键词训练CBOW模型,得到关键词匹配模型;将药品关键词作为Skip-gram模型的训练输入数据,将上下文数据作为Skip-gram模型的训练输出数据,通过药品关键词和上下文数据训练Skip-gram模型,得到上下文匹配模型。在其中一个实施例中,通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量包括:将药品匹配数据输入上下文匹配模型中,并根据上下文匹配模型的隐藏层,得到上下文匹配向量;根据药品匹配数据构建关键词匹配输入数据;将关键词匹配输入数据输入关键词匹配模型中,并根据关键词匹配模型的隐藏层,得到关键词匹配向量;根据上下文匹配向量和关键词匹配向量的均值,得到药品匹配数据对应的药品名称匹配向量。在其中一个实施例中,根据药品匹配数据构建关键词匹配输入数据包括:将药品匹配数据进行两两组合,构建得到关键词匹配输入数据。在其中一个实施例中,根据上下文匹配模型的隐藏层,得到上下文匹配向量包括:将上下文匹配模型的隐藏层权重,作为上下文匹配向量;根据关键词匹配模型的隐藏层,得到关键词匹配向量包括:将关键词匹配模型的隐藏层权重,作为关键词匹配向量。在其中一个实施例中,将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析包括:计算药品名称匹配向量,与药品基准名称向量表中的药品基准名称向量之间的余弦距离,并将余弦距离作为相似度分析结果。一种数据匹配装置,所述装置包括:界面展示模块,用于当触发数据匹配操作时,展示预设的数据获取界面;数据信息获取模块,用于在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;药品数据提取模块,用于根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;名称向量化处理模块,用于通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量,药品名称匹配模型基于药品名称历史匹配数据训练得到;名称向量表查询模块,用于查询预设的药品基准名称向量表,药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;相似度分析模块,用于将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:当触发数据匹配操作时,展示预设的数据获取界面;在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量,药品名称匹配模型基于药品名称历史匹配数据训练得到;查询预设的药品基准名称向量表,药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:当触发数据匹配操作时,展示预设的数据获取界面;在触发针对数据获取界面的操作后,获取通过操作所产生的待匹配数据信息;根据待匹配数据信息获取应用端的医疗记录,并从医疗记录中提取待匹配的药品匹配数据;通过预先训练的药品名称匹配模型对药品匹配数据进行名称向量化处理,得到药品匹配数据对应的药品名称匹配向量,药品名称匹配模型基于药品名称历史匹配数据训练得到;查询预设的药品基准名称向量表,药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;将药品名称匹配向量与药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。上述数据匹配方法、装置、计算机设备和存储介质,通过数据获取界面快速获取待匹配数据信息,并根据该待匹配数据信息获取对应的应用端的医疗记录,通过预先基于药品名称历史匹配数据训练得到的药品名称匹配模型,对从医疗记录中提取的待匹配的药品匹配数据进行名称向量化处理,得到对应的药品名称匹配向量,再将药品名称匹配向量,与预设的药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。在数据匹配处理过程中,通过数据获取界面快速确定待匹配的数据,再基于预先训练的药品名称匹配模型对待匹配的药品匹配数据进行名称向量化处理,再根据名称向量化处理得到的药品名称匹配向量,与药品基准名称向量表中的药品基准名称向量的相似度分析结果,确定药品匹配数据的药品名称匹配结果,不需要按照自然语言进行数据段本文档来自技高网...

【技术保护点】
1.一种数据匹配方法,所述方法包括:/n当触发数据匹配操作时,展示预设的数据获取界面;/n在触发针对所述数据获取界面的操作后,获取通过所述操作所产生的待匹配数据信息;/n根据所述待匹配数据信息获取应用端的医疗记录,并从所述医疗记录中提取待匹配的药品匹配数据;/n通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量,所述药品名称匹配模型基于药品名称历史匹配数据训练得到;/n查询预设的药品基准名称向量表,所述药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;/n将所述药品名称匹配向量与所述药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。/n

【技术特征摘要】
1.一种数据匹配方法,所述方法包括:
当触发数据匹配操作时,展示预设的数据获取界面;
在触发针对所述数据获取界面的操作后,获取通过所述操作所产生的待匹配数据信息;
根据所述待匹配数据信息获取应用端的医疗记录,并从所述医疗记录中提取待匹配的药品匹配数据;
通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量,所述药品名称匹配模型基于药品名称历史匹配数据训练得到;
查询预设的药品基准名称向量表,所述药品基准名称向量表包括药品基准名称与药品基准名称向量之间的对应关系;
将所述药品名称匹配向量与所述药品基准名称向量表中的药品基准名称向量进行相似度分析,并根据相似度分析结果确定数据匹配结果。


2.根据权利要求1所述的方法,其特征在于,所述药品名称匹配模型包括关键词匹配模型和上下文匹配模型;在所述通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理之前,还包括:
获取药品名称历史匹配数据,所述药品名称历史匹配数据包括药品关键词和所述药品关键词对应匹配的上下文数据;
将所述上下文数据作为CBOW模型的训练输入数据,将所述药品关键词作为所述CBOW模型的训练输出数据,通过所述上下文数据和所述药品关键词训练所述CBOW模型,得到所述关键词匹配模型;
将所述药品关键词作为Skip-gram模型的训练输入数据,将所述上下文数据作为所述Skip-gram模型的训练输出数据,通过所述药品关键词和所述上下文数据训练所述Skip-gram模型,得到所述上下文匹配模型。


3.根据权利要求2所述的方法,其特征在于,所述通过预先训练的药品名称匹配模型对所述药品匹配数据进行名称向量化处理,得到所述药品匹配数据对应的药品名称匹配向量包括:
将所述药品匹配数据输入所述上下文匹配模型中,并根据所述上下文匹配模型的隐藏层,得到上下文匹配向量;
根据所述药品匹配数据构建关键词匹配输入数据;
将所述关键词匹配输入数据输入所述关键词匹配模型中,并根据所述关键词匹配模型的隐藏层,得到关键词匹配向量;
根据所述上下文匹配向量和所述关键词匹配向量的均值,得到所述药品匹配数据对应的药品名称匹配向量。


4.根据权利要求3所述的方法,其特征在于,所述根据所述药品匹配数据构建关键词匹配输入数据包括:
将所述药品匹配数据进行两两组合,构建得到关键词匹配输入数据。


5.根据权利要求3所述的方法,其特征在于,
所述根据所述上下文匹配模型的隐藏层,得到上下文匹配向量包括:将所述上下文匹配模型的隐藏层权重,作为上下文...

【专利技术属性】
技术研发人员:唐强耿爱香
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1