基于意图识别的智能答疑方法、服务器及存储介质技术

技术编号:24168937 阅读:33 留言:0更新日期:2020-05-16 02:19
本发明专利技术公开了一种基于意图识别的智能答疑方法,应用于服务器,该方法包括获取客户端上传的第一语音数据,将第一语音数据进行转化得到文本数据,将得到的文本数据输入向量提取模型输出文本句向量,将文本句向量输入意图识别模型输出意图类型,根据输出的意图类型,从数据库中找到对应的预设答疑系统作为目标答疑系统,将该意图类型对应的文本数据发放至目标答疑系统,分别计算文本数据与目标答疑系统中各个预设答复进行相似度值计算,找出相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至客户端。本发明专利技术能够提高数据库的查询效率,减少对话系统的反馈延迟。

Intelligent answer method, server and storage medium based on intention recognition

【技术实现步骤摘要】
基于意图识别的智能答疑方法、服务器及存储介质
本专利技术涉及数据处理
,尤其涉及一种基于意图识别的智能答疑方法、服务器及存储介质。
技术介绍
随着人工智能技术的快速发展,人工智能技术越来越多地应用在生活中,例如智能答疑,用户通过文字或者语音的形式将问题传递给智能答疑终端,智能答疑终端识别用户的问题后在数据库中查找对应的答案反馈给用户。目前大多数智能答疑终端能做到的只是当与用户进行对话时,答疑系统将根据用户的提问与预先设置在数据库中的答案进行匹配,得到相似度高的答案反馈给用户,但是,随着业务量增大,该方式会降低数据库的查询效率,增加对话系统的反馈延迟,影响用户体验。因此,如何提高数据库的查询效率,减少对话系统的反馈延迟成为了亟需解决的技术问题。
技术实现思路
本专利技术的主要目的在于提供一种基于意图识别的智能答疑方法、服务器及存储介质,旨在如何提高数据库的查询效率,减少对话系统的反馈延迟的问题。为实现上述目的,本专利技术提供的一种基于意图识别的智能答疑方法,应用于服务器,该方法包括:获取步骤:获取客户端上传的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;识别步骤:将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;发放步骤:根据所述输出的意图类型,从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统,将该意图类型对应的文本数据发放至所述目标答疑系统;及反馈步骤:利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。优选地,所述向量提取模型由BERT模型训练得到,所述向量提取模型包括:向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。优选地,所述意图识别模型由CNN模型训练得到,所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。优选地,所述利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算包括:利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分,将所有所述第一词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词;利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分,将所有所述第二词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词。优选地,所述计分算法为:其中,Vi、Vj和Vk表示从所述文本数据或预设答复中提取的词语节点,S(Vi)、S(Vj)分别表示词语节点Vi、Vj的得分,Wji表示Vi和Vj两个词语节点之间边的权重,Wjk表示Vj和Vk两个词语节点之间边的权重,In(Vi)表示指向词语节点Vi的节点集合,Out(Vj)表示词语节点Vj指向的节点集合,d表示阻尼系数。优选地,所述相似度值计算规则采用杰卡德相似系数算法:其中,A表示每个文本数据中所有第一关键词语构成的第一词集,B表示每个预设答复中所有第二关键词语构成的第二词集,J(A,B)表示文本数据与预设答复之间的杰卡德相似系数,A∩B表示第一词集与第二词集之间相同关键词语的总个数,A∪B表示第一词集与第二词集中所有关键词语的总个数。为实现上述目的,本专利技术还进一步提供一种服务器,所述服务器包括存储器和处理器,所述存储器上存储有基于意图识别的智能答疑程序,所述基于意图识别的智能答疑程序被所述处理器执行时实现如下步骤:获取步骤:获取客户端上传的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;识别步骤:将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;发放步骤:根据所述输出的意图类型,从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统,将该意图类型对应的文本数据发放至所述目标答疑系统;及反馈步骤:利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。优选地,所述目标提取模型为SSD模型,所述向量提取模型由BERT模型训练得到,所述向量提取模型包括:向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。优选地,所述计分算法为:其中,Vi、Vj和Vk表示从所述文本数据或预设答复中提取的词语节点,S(Vi)、S(Vj)分别表示词语节点Vi、Vj的得分,Wji表示Vi和Vj两个词语节点之间边的权重,Wjk表示Vj和Vk两个词语节点之间边的权重,In(Vi)表示指向词语节点Vi的节点集合,Out(Vj)表示词语节点Vj指向的节点集合,d表示阻尼系数。为实现上述目的,本专利技术进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于意图识别本文档来自技高网...

【技术保护点】
1.一种基于意图识别的智能答疑方法,应用于服务器,其特征在于,该方法包括:/n获取步骤:获取客户端上传的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;/n识别步骤:将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;/n发放步骤:根据所述输出的意图类型,从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统,将该意图类型对应的文本数据发放至所述目标答疑系统;及/n反馈步骤:利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。/n

【技术特征摘要】
1.一种基于意图识别的智能答疑方法,应用于服务器,其特征在于,该方法包括:
获取步骤:获取客户端上传的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;
识别步骤:将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;
发放步骤:根据所述输出的意图类型,从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统,将该意图类型对应的文本数据发放至所述目标答疑系统;及
反馈步骤:利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。


2.如权利要求1所述的基于意图识别的智能答疑方法,其特征在于,所述向量提取模型由BERT模型训练得到,所述向量提取模型包括:
向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;
Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及
基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。


3.如权利要求1所述的基于意图识别的智能答疑方法,其特征在于,所述意图识别模型由CNN模型训练得到,所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。


4.如权利要求1所述的基于意图识别的智能答疑方法,其特征在于,所述利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算包括:
利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分,将所有所述第一词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词;
利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分,将所有所述第二词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词。


5.如权利要求4所述的基于意图识别的智能答疑方法,其特征在于,所述计分算法为:



其中,Vi、Vj和Vk表示从所述文本数据或预设答复中提取的词语节点,S(Vi)、S(Vj)分别表示词语节点Vi、Vj的得分,Wji表示Vi和Vj两个词语节点之间边的权重,Wjk表示Vj和Vk两个词语节点之间边的权重,In(Vi)表示指向词语节点Vi的节点集合,Out(Vj)表示词语节点Vj指向的节点集合,d表示阻尼系数。

【专利技术属性】
技术研发人员:郑继发
申请(专利权)人:深圳物控智联科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1