【技术实现步骤摘要】
一种对话回复方法、装置、服务器及存储介质
本专利技术属于聊天机器人
,具体涉及一种对话回复方法、装置、服务器及存储介质。
技术介绍
目前的智能客服系统,主要是基于知识点匹配的问答。首先通过人工挖掘或者借助算法形式的自动化挖掘,将用户的常见问题总结为几百个到几千个知识点。每个知识点包括一个标准问和标准答案。之后的在线客服端,根据用户输入的问题匹配已有的知识点,并将匹配到的知识点告诉用户。这种基于知识点匹配的问答存在几个明显的不足:首先,答案需要事先根据挖掘的知识点进行编写,知识点的挖掘以及答案的编写需要消耗很大的人力成本;其次,知识点的挖掘是根据用户历史问题来总结的,如果某个问题之前没有被或者很少被问过,就不会出现在知识点中,那么即使这个问题可以在知识文库中找到合适的答案,通过知识点匹配的方式也无法给出用户满意的答复。此外,所有的背景文本都是动态更新的,知识点的及时更新严重依赖于运营人员的响应效率,且更新知识点同样也需要消耗人力成本。
技术实现思路
鉴于此,本专利技术实施例在于提供一种对话回复方法、装置、服务器及存储介质,以实现在无人工干预的情况下随知识图库的更新而自动更新答案,进而极大地节约了人力资源,提升了工作效率。本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供了一种对话回复方法,包括:获取用户输入的问题信息;通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知 ...
【技术保护点】
1.一种对话回复方法,其特征在于,包括:/n获取用户输入的问题信息;/n通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;/n向所述用户反馈所述答案。/n
【技术特征摘要】
1.一种对话回复方法,其特征在于,包括:
获取用户输入的问题信息;
通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;
向所述用户反馈所述答案。
2.根据权利要求1所述的方法,其特征在于,所述预设网络模型包括:卷积神经网络,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:
通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;
通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量;
计算所述句子表示向量与各个整体表示向量的相似度;
将最大相似度对应的知识文本作为目标知识文本。
3.根据权利要求1所述的方法,其特征在于,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:
获取所述问题信息中的关键词;
从所述预设知识图库中过滤掉不包含所述关键词的知识文本,得到剩余知识文本;
通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本。
4.根据权利要求3所述的方法,其特征在于,所述预设网络模型包括:卷积神经网络,通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本,包括:
通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;
通过所述卷积神经网络和所述注意力机制获得所述剩余知识文本中各个知识文本的整体表示向量;
计算所述句子表示向量与各个整体表示向量的相似度;
将最大相似度对应的知识文本作为目标知识文本。
5.根据权利要求2或4所述的方法,其特征在于,通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量,包括:
将所述问题信息中的每个字转换成字向量,得到字向量序列;
通过所述卷积神经网络对所述字向量序列进行卷积处理,得到卷积特征;
通过所述注意力机制对所述卷积特征进行线性加权求和,得到所述句子表示向量。
6.根据权利要求2所述的方法,其特征在于,通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量,包括:
将所述预设知识图库中第i个知识文本中的每句话中的每个词转换成词向量,得到表征所述第i个知识文本中的每句话的词向量序列;
通过所述卷积神经网络对所述第i个知识文本中的每句话的词向量序列分别进行卷积处理,得到所述第i个知识文本中的每句话的卷积特征;
通过所述注意力机制对所述第i个知识文本中的每句话的卷积特征分别进行线性加权求和,得到所述i个知识文本中的每句话的句子表示向量;
通过所述注意力机制对所述i个知识文本的各句子表示向量进行线性加权求和,得到所述i个知识文本的整体表示向量,其中,i依次取1至n,n为所述预设知识图库中的知识文本数。
7.根据权利要求1所述的方法,其特征在于,所述预设网络模型还包括:双向长短时记忆循环神经网络和序列标注模型,从所述目标知识文本中提取出与所述问题信息相对应的答案,包括:
计算所述目标知识文本中每个词对应的词向量与所述问题信息对应的句子表示向量之间的相关性;
基于相关性计算结果来扩充所述目标知识文本中每个词对应的词向量表示;
使用所述双向长短时记忆循环神经网络对扩充后的词向量表示进行特征提取,得到包含时序特征的输出特征;
将所述输出特征输入所述序列标注模型中,获得序列标注结果;
从所述序列标注结果中提取出标注为答案的信息。
8.根据权利要求1所述的方法,其特征在于,通过以下方法获得所述预设网络模型:
使用相同的训练样本、使用相同的模型结构独立训练出多个不同的网络模型;
利用所述多个不同的网络模型分别对同一个问题信息进行...
【专利技术属性】
技术研发人员:徐江,冯浩,吴康康,王鹏,李奘,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。