【技术实现步骤摘要】
标准回复确定方法、装置、设备及存储介质
本申请涉及机器语言处理
,更具体的说,是涉及一种标准回复确定方法、装置、设备及存储介质。
技术介绍
随着人工智能领域的不断壮大,越来越多的人工智能算法诞生出来,帮助机器更好地理解和处理人类的自然语言。在现实应用中,存在多种不同的项目需要进行标准回复内容的预测,示例如人机对话项目中,需要预测机器的标准回复,机器阅读理解以及知识问答项目中,需要预测对给定问题的标准回复(又可称为标准答案)等。以人机对话为例,目前,研究者们已经研发出许多人机对话系统,在人工客服、家庭助手、学习指导等方面广泛应用。然而,当前的对话系统仍处于初步阶段,人机交互过程中,机器仅能够依据人机对话历史来预测标准回复,使得预测的标准回复质量不高。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种标准回复确定方法、装置、设备及存储介质,以解决现有技术预测的标注回复质量不高的问题。具体方案如下:一种标准回复确定方法,包括:获取待预测标准回复的目标项目的候选回复集合、所述目标项目相关的背景知识,及所述目标项目的项目数据;基于所述背景知识和所述项目数据,确定关注项目数据的背景知识的第一特征表示;基于所述背景知识、所述项目数据和所述每一候选回复,确定关注背景知识及项目数据的每一候选回复的第二特征表示;确定所述项目数据的第三特征表示,并基于所述第三特征表示、所述第一特征表示及所述每一候选回复的第二特征表示,确定每一候选回复作为标准回复的概率; ...
【技术保护点】
1.一种标准回复确定方法,其特征在于,包括:/n获取待预测标准回复的目标项目的候选回复集合、所述目标项目相关的背景知识,及所述目标项目的项目数据;/n基于所述背景知识和所述项目数据,确定关注项目数据的背景知识的第一特征表示;/n基于所述背景知识、所述项目数据和所述每一候选回复,确定关注背景知识及项目数据的每一候选回复的第二特征表示;/n确定所述项目数据的第三特征表示,并基于所述第三特征表示、所述第一特征表示及所述每一候选回复的第二特征表示,确定每一候选回复作为标准回复的概率;/n基于各候选回复的概率,从中选取标准回复。/n
【技术特征摘要】
1.一种标准回复确定方法,其特征在于,包括:
获取待预测标准回复的目标项目的候选回复集合、所述目标项目相关的背景知识,及所述目标项目的项目数据;
基于所述背景知识和所述项目数据,确定关注项目数据的背景知识的第一特征表示;
基于所述背景知识、所述项目数据和所述每一候选回复,确定关注背景知识及项目数据的每一候选回复的第二特征表示;
确定所述项目数据的第三特征表示,并基于所述第三特征表示、所述第一特征表示及所述每一候选回复的第二特征表示,确定每一候选回复作为标准回复的概率;
基于各候选回复的概率,从中选取标准回复。
2.根据权利要求1所述的方法,其特征在于,所述第一特征表示、所述第二特征表示及所述第三特征表示的确定过程,包括:
确定所述背景知识的编码特征、所述项目数据的编码特征及每一候选回复的编码特征;
将所述项目数据的编码特征作为所述项目数据的第三特征表示;
基于所述背景知识的编码特征和所述项目数据的编码特征,确定关注项目数据的背景知识的第一特征表示;
基于所述背景知识的编码特征、所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注背景知识及项目数据的每一候选回复的第二特征表示。
3.根据权利要求2所述的方法,其特征在于,所述基于所述背景知识的编码特征、所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注背景知识及项目数据的每一候选回复的第二特征表示,包括:
基于所述背景知识的编码特征和所述每一候选回复的编码特征,确定关注背景知识的每一候选回复的第四特征表示;
基于所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注项目数据的每一候选回复的第五特征表示;
将每一候选回复的第四特征表示与第五特征表示进行拼接,得到关注背景知识及项目数据的每一候选回复的第二特征表示。
4.根据权利要求2所述的方法,其特征在于,所述确定所述背景知识的编码特征、所述项目数据的编码特征及每一候选回复的编码特征,包括:
对所述背景知识中每条知识进行编码,并将各条知识的编码结果进行联合表示,得到背景知识的编码特征;
对所述项目数据中每条语句进行编码,并将各条语句的编码结果进行联合表示,得到项目数据的编码特征;
对每一候选回复进行编码,得到对应的编码特征。
5.根据权利要求2所述的方法,其特征在于,所述基于所述背景知识的编码特征和所述项目数据的编码特征,确定关注项目数据的背景知识的第一特征表示,包括:
将所述项目数据的编码特征与所述背景知识的编码特征间进行交叉注意力计算,得到关注项目数据的背景知识的第一特征表示。
6.根据权利要求3所述的方法,其特征在于,所述基于所述背景知识的编码特征和所述每一候选回复的编码特征,确定关注背景知识的每一候选回复的第四特征表示,包括:
将所述背景知识的编码特征与所述每一候选回复的编码特征进行交叉注意力计算,得到关注背景知识的每一候选回复的第四特征表示;
所述基于所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注项目数据的每一候选回复的第五特征表示,包括:
将所述项目数据的编码特征与所述每一候选回复的编码特征进行交叉注意力计算,得到关注项目数据的每一候选回复的第五特征表示。
7.根据权利要求1所述的方法,其特征在于,所述目标项目为人机对话回复预测项目;所述背景知识包括人机对话回复预测项目相关的背景知识图谱,所述项目数据包括人机对话历史;
所述获取待预测标准...
【专利技术属性】
技术研发人员:王可心,李直旭,刘庆升,
申请(专利权)人:安徽淘云科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。