数据匹配方法及装置、电子设备、存储介质制造方法及图纸

技术编号:31455669 阅读:35 留言:0更新日期:2021-12-18 11:21
本公开提供了一种数据匹配方法及装置、电子设备、存储介质,涉及计算机技术领域。该数据匹配方法包括:获取问题数据,并匹配所述问题数据对应的候选答案数据;将所述问题数据以及所述候选答案数据进行切字处理,生成字形式的问答对数据;将字形式的所述问答对数据输入到预训练的答案匹配模型中,以通过所述答案匹配模型确定所述问答对数据对应的相似度数据;根据所述相似度数据确定与所述问题数据对应的匹配答案数据。本公开实施例的技术方案可以提高问题自动回复的准确性,提升用户的使用体验。验。验。

【技术实现步骤摘要】
数据匹配方法及装置、电子设备、存储介质


[0001]本公开涉及计算机
,具体而言,涉及一种数据匹配方法、数据匹配装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着互联网技术的飞速发展,智能客服越来越得到人们的关注。中文健康咨询领域答案选择(Answer Selection)是指在中文健康(医疗)领域利用自然语言处理或深度学习等技术来衡量问题和候选答案的语义匹配程度,进而在诸多候选答案中选出更准确的答案。
[0003]目前,相关技术方案中采用通用的分词工具进行分词,然后再对分词后的结果进行词向量的训练,但是中文健康(医疗)领域的问答数据专业术语较多,噪声大,直接使用通用分词工具对该领域的专业用语进行分词会造成较大的语义损失,影响词向量计算的精度,进而影响答案选择匹配的准确性。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开实施例的目的在于提供一种数据匹配方法、数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:获取问题数据,并匹配所述问题数据对应的候选答案数据;将所述问题数据以及所述候选答案数据进行切字处理,生成字形式的问答对数据;将字形式的所述问答对数据输入到预训练的答案匹配模型中,以通过所述答案匹配模型确定所述问答对数据对应的相似度数据;根据所述相似度数据确定与所述问题数据对应的匹配答案数据。2.根据权利要求1所述的数据匹配方法,其特征在于,所述答案匹配模型包括双向循环神经网络层;在将字形式的所述问答对数据输入到预训练的答案匹配模型中之后,所述方法还包括:将字形式的所述问答对数据输入到所述双向循环神经网络层中,生成包含上下文信息的问答对数据。3.根据权利要求2所述的数据匹配方法,其特征在于,所述答案匹配模型还包括多尺度卷积层;在生成包含上下文信息的问答对数据之后,所述方法还包括:通过所述多尺度卷积层对所述包含上下文信息的问答对数据进行特征提取,得到所述包含上下文信息的问答对数据对应的问答对特征向量。4.根据权利要求3所述的数据匹配方法,其特征在于,所述候选答案数据包括正向答案数据以及负向答案数据;所述问答对特征向量包括问题向量、正向答案特征向量和负向答案特征向量;在通过所述答案匹配模型确定所述问答对数据对应的相似度数据,之前,所述方法还包括:计算所述问题向量与所述正向答案特征向量之间的第一相似度数据;计算所述问题向量与所述负向答案特征向量之间的第二相似度数据。5.根据权利要求4所述的数据匹配方法,其特征在于,所述通过所述答案匹配模型确定所述问答对数据对应的相似度数据,包括:将所述第一相似度数据与所述第二相似度数据输...

【专利技术属性】
技术研发人员:胡珅健
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1