问答匹配方法、装置、计算机可读存储介质及计算机设备制造方法及图纸

技术编号:38932625 阅读:20 留言:0更新日期:2023-09-25 09:36
本申请公开了一种问答匹配方法、装置、计算机可读存储介质及计算机设备,方法通过获取目标问题数据以及与目标问题数据关联的历史问题数据,并将目标问题数据与历史问题数据进行融合,得到融合问题数据;对融合问题数据进行特征提取,得到多个隐藏特征;获取与目标问题数据对应的多个候选问题数据,并对每一候选问题数据进行特征提取,得到每一候选问题对应的表征特征;基于表征特征对多个隐藏特征进行注意力处理,得到目标问题特征;根据目标问题特征与每一表征特征之间的相似关系在多个候选问题数据中确定目标候选问题数据,并确定目标候选问题数据对应的答案数据为目标问题数据的答案数据。该方法可以有效提升问答匹配的准确性。准确性。准确性。

【技术实现步骤摘要】
问答匹配方法、装置、计算机可读存储介质及计算机设备


[0001]本申请涉及计算机
,具体涉及一种问答匹配方法、装置、计算机可读存储介质及计算机设备。

技术介绍

[0002]随着人工智能技术的不断发展与普及,各类人工智能应用已经开始深入到生活的方方面面,为人们生活带来了极大的便利。
[0003]其中,基于人工智能技术的问答系统,可以根据用户输入的问题数据匹配到相应的答案数据,大大提升了用户的信息获取效率。
[0004]然而,目前问答系统在基于用户输入的问题数据匹配相应的答案数据时,存在对用户问题的意图把握不准确的情况,导致匹配得到的答案数据的准确性较差。

技术实现思路

[0005]本申请实施例提供一种问答匹配方法、装置、计算机可读存储介质及计算机设备,该方法可以有效提升问答系统的问答匹配准确性。
[0006]本申请第一方面提供一种问答匹配方法,方法包括:
[0007]获取目标问题数据以及与所述目标问题数据关联的历史问题数据,并将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据;
[0008]对所述融合问题数据进行特征提取,得到多个隐藏特征;
[0009]获取与所述目标问题数据对应的多个候选问题数据,并对每一候选问题数据进行特征提取,得到每一候选问题对应的表征特征;
[0010]基于所述表征特征对所述多个隐藏特征进行注意力处理,得到目标问题特征;
[0011]根据所述目标问题特征与每一表征特征之间的相似关系在所述多个候选问题数据中确定目标候选问题数据,并确定所述目标候选问题数据对应的答案数据为所述目标问题数据的答案数据。
[0012]相应的,本申请第二方面提供一种问答匹配装置,装置包括:
[0013]第一获取单元,用于获取目标问题数据以及与所述目标问题数据关联的历史问题数据,并将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据;
[0014]提取单元,用于对所述融合问题数据进行特征提取,得到多个隐藏特征;
[0015]第二获取单元,用于获取与所述目标问题数据对应的多个候选问题数据,并对每一候选问题数据进行特征提取,得到每一候选问题对应的表征特征;
[0016]处理单元,用于基于所述表征特征对所述多个隐藏特征进行注意力处理,得到目标问题特征;
[0017]确定单元,用于根据所述目标问题特征与每一表征特征之间的相似关系在所述多个候选问题数据中确定目标候选问题数据,并确定所述目标候选问题数据对应的答案数据为所述目标问题数据的答案数据。
[0018]在一些实施例中,所述处理单元,包括:
[0019]第一计算子单元,用于对每一表征特征与所述多个隐藏特征进行注意力计算,得到每一表征特征对应的注意力权重序列,所述注意力权重序列中包含每一隐藏特征对应的注意力权重值;
[0020]第二计算子单元,用于基于每一表征特征对应的注意力权重序列计算所述多个隐藏特征对应的目标注意力权重序列;
[0021]第一确定子单元,用于根据所述目标注意力权重序列和所述多个隐藏特征确定目标问题特征。
[0022]在一些实施例中,所述第二计算子单元,包括:
[0023]第一获取模块,用于获取每一表征特征对应的注意力权重序列中注意力值之间的对应关系;
[0024]第一计算模块,用于基于所述对应关系对所述每一表征特征对应的注意力权重序列中的权重值进行求和计算,得到目标注意力权重序列。
[0025]在一些实施例中,所述第一确定子单元,包括:
[0026]第一确定模块,用于在所述目标注意力权重序列中确定每一隐藏特征对应的目标注意力权重值;
[0027]处理模块,用于基于所述每一隐藏特征对应的目标注意力权重值对每一隐藏特征进行加权处理,得到目标问题特征。
[0028]在一些实施例中,所述第一获取单元,包括:
[0029]第一获取子单元,用于获取目标问题数据以及所述目标问题数据对应的目标问答窗口;
[0030]第二确定子单元,用于确定所述目标问题数据对应的目标时间点;
[0031]第二获取子单元,用于获取所述目标问答窗口中所述目标时间点之前预设时间段内接收到的问题数据,得到历史问题数据;
[0032]融合子单元,用于将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据。
[0033]在一些实施例中,所述第二获取子单元,包括:
[0034]第二获取模块,用于获取所述目标问题数据对应的目标账号信息;
[0035]第三获取模块,用于获取所述目标问答窗口中所述目标时间点之前预设时间段内接收到的问题数据,得到与所述预设时间段对应的问题数据集合;
[0036]第二确定模块,用于在所述问题数据集合中确定与所述目标账号信息对应的问题数据,得到历史问题数据。
[0037]在一些实施例中,所述融合子单元,包括:
[0038]分词模块,用于将所述目标问题数据与所述历史问题数据进行分词处理,得到多个分词数据;
[0039]拼接模块,用于将所述多个分词数据进行拼接,得到融合问题数据。
[0040]在一些实施例中,所述第二获取单元,包括:
[0041]第三获取子单元,获取所述目标问题数据中的关键词信息;
[0042]查找子单元,用于在预设候选问题数据库中查找与所述关键词信息匹配的问题数
据,得到多个候选问题数据;
[0043]提取子单元,用于对每一候选问题数据进行特征提取,得到每一候选问题对应的表征特征。
[0044]在一些实施例中,所述查找子单元,包括:
[0045]第二计算模块,用于基于所述关键词信息计算预设候选问题数据库中每一问题数据对应的相似性得分;
[0046]第四获取模块,获取相似性得分大于预设阈值的问题数据,得到多个候选问题数据。
[0047]在一些实施例中,所述确定单元,包括:
[0048]第三计算子单元,用于计算所述目标问题特征对应的目标特征向量与每一表征特征对应的表征向量之间的余弦相似度,得到多个相似度数值;
[0049]第三确定子单元,用于确定所述多个相似度数值中的最大值,并确定所述最大值对应的目标候选问题数据;
[0050]确定所述目标候选问题数据对应的答案数据为所述目标问题数据的答案数据。
[0051]本申请第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请第一方面所提供的问答匹配方法中的步骤。
[0052]本申请第四方面提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请第一方面所提供的问答匹配方法中的步骤。
[0053]本申请第五方面提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答匹配方法,其特征在于,所述方法包括:获取目标问题数据以及与所述目标问题数据关联的历史问题数据,并将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据;对所述融合问题数据进行特征提取,得到多个隐藏特征;获取与所述目标问题数据对应的多个候选问题数据,并对每一候选问题数据进行特征提取,得到每一候选问题对应的表征特征;基于所述表征特征对所述多个隐藏特征进行注意力处理,得到目标问题特征;根据所述目标问题特征与每一表征特征之间的相似关系在所述多个候选问题数据中确定目标候选问题数据,并确定所述目标候选问题数据对应的答案数据为所述目标问题数据的答案数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述表征特征对所述多个隐藏特征进行注意力处理,得到目标问题特征,包括:对每一表征特征与所述多个隐藏特征进行注意力计算,得到每一表征特征对应的注意力权重序列,所述注意力权重序列中包含每一隐藏特征对应的注意力权重值;基于每一表征特征对应的注意力权重序列计算所述多个隐藏特征对应的目标注意力权重序列;根据所述目标注意力权重序列和所述多个隐藏特征确定目标问题特征。3.根据权利要求2所述的方法,其特征在于,所述基于每一表征特征对应的注意力权重序列计算所述多个隐藏特征对应的目标注意力权重序列,包括:获取每一表征特征对应的注意力权重序列中注意力值之间的对应关系;基于所述对应关系对所述每一表征特征对应的注意力权重序列中的权重值进行求和计算,得到目标注意力权重序列。4.根据权利要求2所述的方法,其特征在于,所述根据所述目标注意力权重序列和所述多个隐藏特征确定目标问题特征,包括:在所述目标注意力权重序列中确定每一隐藏特征对应的目标注意力权重值;基于所述每一隐藏特征对应的目标注意力权重值对每一隐藏特征进行加权处理,得到目标问题特征。5.根据权利要求1所述的方法,其特征在于,所述获取目标问题数据以及与所述目标问题数据关联的历史问题数据,并将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据,包括:获取目标问题数据以及所述目标问题数据对应的目标问答窗口;确定所述目标问题数据对应的目标时间点;获取所述目标问答窗口中所述目标时间点之前预设时间段内接收到的问题数据,得到历史问题数据;将所述目标问题数据与所述历史问题数据进行融合,得到融合问题数据。6.根据权利要求5所述的方法,其特征在于,所述获取所述目标问答窗口中所述目标时间点之前预设时间段内接收到的问题数据,得到历史问题数据,包括:获取所述目标问题数据对应的目标账号信息;获取所述目标问答窗口中所述目标时间点之前预设时间段内接收到的问题数据,得到
与所述预设时间段对应的问题数据集合;在所述问题数据集合中确定与所述目标账号信息对应的问题数据,得到历史问题数据。7.根据权利要求5所述的方法,其特征在于,所述将所述目标问题数据与所述历史...

【专利技术属性】
技术研发人员:田振聪周霄田乐
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1