数据处理方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:33350060 阅读:25 留言:0更新日期:2022-05-08 09:53
本说明书实施例公开了一种数据处理方法、装置、电子设备及计算机存储介质。其中,该方法包括:通过将接收到的用户问题以及从预设问答数据集中查询得到与上述用户问题相关的N种信息源输入问答模型中,从而得到该用户问题的目标答案。上述N为大于或等于2的正整数;上述N种信息源中存在至少两种信息源相关联;上述问答模型基于多个用户问题、上述多个用户问题对应的N种信息源以及上述多个用户问题对应的多个标准答案训练得到。标准答案训练得到。标准答案训练得到。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机存储介质


[0001]本说明书涉及通信
,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]社区问答系统大多是使用人工撰写答案的方法构建,或者是基于信息抽取式的方法,从给定的答案中选择正确的答案,或是从给定的文章中抽取一个句子或一个片段作为答案。这些方法仅仅是基于单一数据源生成答案,其给出的答案通常与问题的相关性较差。

技术实现思路

[0003]本说明书实施例提供了一种数据处理方法、装置、电子设备及计算机存储介质,通过结合多种信息源之间的关联来理解多种信息源中包含的知识信息,然后将这些学习到的知识融入到回答用户问题的过程中,实现在多种信息源中进行推理,提高生成的答案与用户问题的一致性,从而提高用户粘性和用户体验。所述技术方案如下:
[0004]第一方面,本说明书实施例提供了一种数据处理方法,包括:
[0005]接收用户输入的用户问题;
[0006]基于上述用户问题以及N种预设信息源类型从预设问答数据集中查询得到N种信息源;上述N为大本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,所述方法包括:接收用户输入的用户问题;基于所述用户问题以及N种预设信息源类型从预设问答数据集中查询得到N种信息源;所述N为大于或等于2的正整数;所述N种信息源中存在至少两种信息源相关联;将所述用户问题以及所述N种信息源输入问答模型中,输出目标答案;所述问答模型基于多个用户问题、所述多个用户问题对应的N种信息源以及所述多个用户问题对应的多个标准答案训练得到。2.如权利要求1所述的方法,所述将所述用户问题以及所述N种信息源输入问答模型中,输出目标答案,包括:输入所述用户问题以及所述N种信息源;基于所述用户问题和所述N种信息源按照预设规则构建异构图;所述异构图包括用户问题节点以及N种信息源节点;所述异构图表征所述用户问题以及所述N种信息源之间的关系;对所述异构图中的每个节点对应的文本信息进行编码,得到所述每个节点的文本信息对应的向量;基于所述异构图对所述每个节点的文本信息对应的向量进行更新,得到更新后的每个节点对应的向量;基于所述更新后的每个节点对应的向量对所述用户问题节点的文本信息对应的向量进行解码,得到目标答案。3.如权利要求2所述的方法,所述异构图中的每个节点对应的文本信息包括至少一个字;所述对所述异构图中的每个节点对应的文本信息进行编码,得到所述每个节点的文本信息对应的向量,包括:对所述每个节点对应的文本信息中的每个字进行编码,得到所述每个字对应的向量;对所述每个节点中所述每个字对应的向量进行平均池化,得到所述每个节点的文本信息对应的向量。4.如权利要求2所述的方法,所述基于所述异构图对所述每个节点的文本信息对应的向量进行更新,得到更新后的每个节点对应的向量,包括:基于所述异构图以及所述每个节点的文本信息对应的向量计算相邻的两个节点之间的第一注意力分数;所述相邻的两个节点包括源节点和目标节点;基于所述问题节点的文本信息对应的向量以及所述源节点的文本信息对应的向量重新调整所述第一注意力分数,得到第二注意力分数;基于所述第二注意力分数、所述源节点的文本信息对应的向量、所述目标节点的文本信息对应的向量以及所述源节点与所述目标节点之间的边类型确定更新后的每个节点对应的向量。5.如权利要求4所述的方法,所述基于所述异构图以及所述每个节点的文本信息对应的向量计算相邻的两个节点之间的第一注意力分数,包括:对所述每个节点的文本信息对应的向量进行投影,得到所述每个节点对应的第一向量和第二向量;所述每个节点对应的第一向量与第二向量一一对应;
基于所述异构图、所述每个节点对应的第一向量和第二向量计算每相邻的两个节点之间的第一注意力分数。6.如权利要求4所述的方法,所述基于所述异构图以及所述每个节点的文本信息对应的向量计算相邻的两个节点之间的第一注意力分数之前,所述方法还包括:基于所述异构图确定源节点和目标节点;所述目标节点和所述源节点相邻;所述基于所述异构图以及所述每个节点的文本信息对应的向量计算相邻的两个节点之间的第一注意力分数,包括:将所述源节点的文本信息对应的向量投影至第一空间,得到所述源节点对应的第一向量,并将所述目标节点的...

【专利技术属性】
技术研发人员:高莘张寓弛王永亮董扬
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1