一种对话回复方法、装置、服务器及存储介质制造方法及图纸

技术编号:25479640 阅读:26 留言:0更新日期:2020-09-01 23:00
本发明专利技术涉及一种对话回复方法、装置、服务器及存储介质,属于聊天机器人技术领域。该方法包括:获取用户输入的问题信息;通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;向所述用户反馈所述答案。该方法不再是采用现有的基于知识点匹配的问答方法,而是采用基于阅读理解的自然语言处理方法,使得可以在无人工干预的情况下随知识图库的更新而自动更新答案,在提高答案的准确性的同时,还可以提高用户的体验感,最为重要的是,极大地节约了人力资源,提升了工作效率。

【技术实现步骤摘要】
一种对话回复方法、装置、服务器及存储介质
本专利技术属于聊天机器人
,具体涉及一种对话回复方法、装置、服务器及存储介质。
技术介绍
目前的智能客服系统,主要是基于知识点匹配的问答。首先通过人工挖掘或者借助算法形式的自动化挖掘,将用户的常见问题总结为几百个到几千个知识点。每个知识点包括一个标准问和标准答案。之后的在线客服端,根据用户输入的问题匹配已有的知识点,并将匹配到的知识点告诉用户。这种基于知识点匹配的问答存在几个明显的不足:首先,答案需要事先根据挖掘的知识点进行编写,知识点的挖掘以及答案的编写需要消耗很大的人力成本;其次,知识点的挖掘是根据用户历史问题来总结的,如果某个问题之前没有被或者很少被问过,就不会出现在知识点中,那么即使这个问题可以在知识文库中找到合适的答案,通过知识点匹配的方式也无法给出用户满意的答复。此外,所有的背景文本都是动态更新的,知识点的及时更新严重依赖于运营人员的响应效率,且更新知识点同样也需要消耗人力成本。
技术实现思路
鉴于此,本专利技术实施例在于提供一种对话回复方法、装置、服务器及存储介质,以实现在无人工干预的情况下随知识图库的更新而自动更新答案,进而极大地节约了人力资源,提升了工作效率。本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供了一种对话回复方法,包括:获取用户输入的问题信息;通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;向所述用户反馈所述答案。本申请实施例中,先根据用户输入的问题信息从预设知识图库中确定出问题信息所在的答案的目标知识文本,然后再从目标知识文本中提取出与问题信息相对应的答案,最后向用户反馈提取出的答案,不再是采用现有的基于知识点匹配的问答方法,而是采用基于阅读理解的自然语言处理方法。这种对话回复方式使得可以在无人工干预的情况下随知识图库的更新而自动更新答案,在提高答案的准确性同时,还可以提高用户的体验感,最为重要的是,极大地节约了人力资源,提升了工作效率。结合第一方面实施例的一种可能的实施方式,所述预设网络模型包括:卷积神经网络,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量;计算所述句子表示向量与各个整体表示向量的相似度;将最大相似度对应的知识文本作为目标知识文本。本申请实施例中,首先通过卷积神经网络和注意力机制获得问题信息的句子表示向量以及获得预设知识图库中各个知识文本的整体表示向量,然后再计算句子表示向量与各个整体表示向量的相似度,最后将最大相似度对应的知识文本作为目标知识文本,保证了答案定位的准确性和可靠性。结合第一方面实施例的一种可能的实施方式,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:获取所述问题信息中的关键词;从所述预设知识图库中过滤掉不包含所述关键词的知识文本,得到剩余知识文本;通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本。本申请实施例中,可以根据问题信息中的关键词对预设知识图库中的知识文本进行过滤,以将明显不匹配的知识文本筛选出来,然后再从剩余的知识文本中确定出与所述问题信息匹配度最高的目标知识文本,以此来减少计算量,节约计算成本,提高答案反馈的效率。结合第一方面实施例的一种可能的实施方式,所述预设网络模型包括:卷积神经网络,通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本,包括:通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;通过所述卷积神经网络和所述注意力机制获得所述剩余知识文本中各个知识文本的整体表示向量;计算所述句子表示向量与各个整体表示向量的相似度;将最大相似度对应的知识文本作为目标知识文本。结合第一方面实施例的一种可能的实施方式,通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量,包括:将所述问题信息中的每个字转换成字向量,得到字向量序列;通过所述卷积神经网络对所述字向量序列进行卷积处理,得到卷积特征;通过所述注意力机制对所述卷积特征进行线性加权求和,得到所述句子表示向量。本申请实施例中,先将问题信息中的每个字转换成字向量,得到字向量序列,然后再利用卷积神经网络对字向量序列进行特征提取,得到卷积特征,最后再使用注意力机制对卷积特征进行线性加权求和,即可得到句子表示向量,通过该方式对问题信息进行处理后,能显著提高计算问题信息与知识文本之间的匹配度的计算速率。结合第一方面实施例的一种可能的实施方式,通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量,包括:将所述预设知识图库中第i个知识文本中的每句话中的每个词转换成词向量,得到表征所述第i个知识文本中的每句话的词向量序列;通过所述卷积神经网络对所述第i个知识文本中的每句话的词向量序列分别进行卷积处理,得到所述第i个知识文本中的每句话的卷积特征;通过所述注意力机制对所述第i个知识文本中的每句话的卷积特征分别进行线性加权求和,得到所述i个知识文本中的每句话的句子表示向量;通过所述注意力机制对所述i个知识文本的各句子表示向量进行线性加权求和,得到所述i个知识文本的整体表示向量,其中,i依次取1至n,n为所述预设知识图库中的知识文本数。结合第一方面实施例的一种可能的实施方式,所述预设网络模型还包括:双向长短时记忆循环神经网络和序列标注模型,从所述目标知识文本中提取出与所述问题信息相对应的答案,包括:计算所述目标知识文本中每个词对应的词向量与所述问题信息对应的句子表示向量之间的相关性;基于相关性计算结果来扩充所述目标知识文本中每个词对应的词向量表示;使用所述双向长短时记忆循环神经网络对扩充后的词向量表示进行特征提取,得到包含时序特征的输出特征;将所述输出特征输入所述序列标注模型中,获得序列标注结果;从所述序列标注结果中提取出标注为答案的信息。本申请实施例中,在定位到答案所在的目标知识文本后,通过计算目标知识文本中每个词对应的词向量与问题信息对应的句子表示向量之间的相关性,并以此来扩充目标知识文本中每个词对应的词向量表示,并在此基础上使用双向长短时记忆循环神经网络来进行时序特征提取,最后再经过序列标注模型获取标注结果,并从标注结果中提取出对应的答案,以便答复用户,该方式使得可以在无人工干预的情况下随知识图库的更新而自动更新答案,同时可以提高答案的准确性,进而可以提高用户的体验感,最为重要的是,可以极大的节约人力资源,提升工作效率。结合第一方面实施例的一种可能的实施方式,通过以下方法获得所述预设网络模型:使用相同的训练样本、使用相同的模型结构独立训练出多个不同的网络模型;利用所述多个不同的网络模型分别对同一个问题信息进行答案预测,并将各自的预测结果作为本文档来自技高网...

【技术保护点】
1.一种对话回复方法,其特征在于,包括:/n获取用户输入的问题信息;/n通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;/n向所述用户反馈所述答案。/n

【技术特征摘要】
1.一种对话回复方法,其特征在于,包括:
获取用户输入的问题信息;
通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,并从所述目标知识文本中提取出与所述问题信息相对应的答案,其中,所述预设知识图库中包含有多个知识文本;
向所述用户反馈所述答案。


2.根据权利要求1所述的方法,其特征在于,所述预设网络模型包括:卷积神经网络,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:
通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;
通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量;
计算所述句子表示向量与各个整体表示向量的相似度;
将最大相似度对应的知识文本作为目标知识文本。


3.根据权利要求1所述的方法,其特征在于,通过预设网络模型从预设知识图库中确定出与所述问题信息匹配度最高的目标知识文本,包括:
获取所述问题信息中的关键词;
从所述预设知识图库中过滤掉不包含所述关键词的知识文本,得到剩余知识文本;
通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本。


4.根据权利要求3所述的方法,其特征在于,所述预设网络模型包括:卷积神经网络,通过预设网络模型从所述剩余知识文本中确定出与所述问题信息匹配度最高的目标知识文本,包括:
通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量;
通过所述卷积神经网络和所述注意力机制获得所述剩余知识文本中各个知识文本的整体表示向量;
计算所述句子表示向量与各个整体表示向量的相似度;
将最大相似度对应的知识文本作为目标知识文本。


5.根据权利要求2或4所述的方法,其特征在于,通过所述卷积神经网络和注意力机制获得所述问题信息的句子表示向量,包括:
将所述问题信息中的每个字转换成字向量,得到字向量序列;
通过所述卷积神经网络对所述字向量序列进行卷积处理,得到卷积特征;
通过所述注意力机制对所述卷积特征进行线性加权求和,得到所述句子表示向量。


6.根据权利要求2所述的方法,其特征在于,通过所述卷积神经网络和所述注意力机制获得所述预设知识图库中各个知识文本的整体表示向量,包括:
将所述预设知识图库中第i个知识文本中的每句话中的每个词转换成词向量,得到表征所述第i个知识文本中的每句话的词向量序列;
通过所述卷积神经网络对所述第i个知识文本中的每句话的词向量序列分别进行卷积处理,得到所述第i个知识文本中的每句话的卷积特征;
通过所述注意力机制对所述第i个知识文本中的每句话的卷积特征分别进行线性加权求和,得到所述i个知识文本中的每句话的句子表示向量;
通过所述注意力机制对所述i个知识文本的各句子表示向量进行线性加权求和,得到所述i个知识文本的整体表示向量,其中,i依次取1至n,n为所述预设知识图库中的知识文本数。


7.根据权利要求1所述的方法,其特征在于,所述预设网络模型还包括:双向长短时记忆循环神经网络和序列标注模型,从所述目标知识文本中提取出与所述问题信息相对应的答案,包括:
计算所述目标知识文本中每个词对应的词向量与所述问题信息对应的句子表示向量之间的相关性;
基于相关性计算结果来扩充所述目标知识文本中每个词对应的词向量表示;
使用所述双向长短时记忆循环神经网络对扩充后的词向量表示进行特征提取,得到包含时序特征的输出特征;
将所述输出特征输入所述序列标注模型中,获得序列标注结果;
从所述序列标注结果中提取出标注为答案的信息。


8.根据权利要求1所述的方法,其特征在于,通过以下方法获得所述预设网络模型:
使用相同的训练样本、使用相同的模型结构独立训练出多个不同的网络模型;
利用所述多个不同的网络模型分别对同一个问题信息进行...

【专利技术属性】
技术研发人员:徐江冯浩吴康康王鹏李奘
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1