多轮对话场景下的话术推荐方法和装置制造方法及图纸

技术编号:21605616 阅读:20 留言:0更新日期:2019-07-13 18:15
本说明书实施例提供一种多轮对话场景下的话术推荐方法和装置,方法包括:首先针对当前用户问句,获取上文信息;接着将当前用户问句和上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;然后将预设数目个答案中的各答案、各答案对应的标准问题、各句述求信息,输入到预先训练的上下文模型中,通过上下文模型的输出得到各答案与当前用户问句的匹配分数;再根据各答案与当前用户问句的匹配分数由高到低的排序,从各答案中选择部分答案;最后将部分答案作为推荐话术,推荐给客服,从而能够有效地利用上下文信息辅助人机对话系统生成相应推荐话术。

Speech Recommendation Method and Device in Multi-Round Dialogue Scene

【技术实现步骤摘要】
多轮对话场景下的话术推荐方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及多轮对话场景下的话术推荐方法和装置。
技术介绍
客服作为企业直接接触用户和消费者的重要环节,很大程度上影响着企业的销售业绩、服务质量和企业形象。随着云计算和人工智能技术的发展,原先的客服工作通过在线客服、客服机器人等实现分流和效率提升。在一些售前咨询、高转化需求场景下,使用客服机器人风险比较高,可以采用人机协作的方式,由机器根据用户问句向人工客服推荐话术,人工客服可以对推荐的话术进行编辑修改或者直接发送,不仅能够提升回复效率,还能减少企业培训成本,把企业的业务经验和销售经验通过实时推荐的方式辅助客服人员,达到知识传递的效果。在人机协作的场景下,对于用户而言,他默认聊天的对象是客服人员,对话内容会更加随意和口语化,通过多轮交互才能获取用户完整意图;对于客服而言,在与用户对话过程中,需要机器推荐的内容就是客服准备回复,需要做到想客服之所想。对于多轮次问答,机器人往往无法抓住聊天中的有用信息,而这些信息作为整个聊天中的上下文,对于机器人理解对话有着至关重要的作用。因此,如何有效地利用上下文信息辅助人机对话系统生成相应推荐话术,是一个亟需解决的问题。
技术实现思路
本说明书一个或多个实施例描述了一种多轮对话场景下的话术推荐方法和装置,能够有效地利用上下文信息辅助人机对话系统生成相应推荐话术。第一方面,提供了一种多轮对话场景下的话术推荐方法,方法包括:针对当前用户问句,获取所述当前用户问句的上文信息;将所述当前用户问句和所述当前用户问句的上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;其中,所述知识库包含多组问答对,每组问答对包括对应的标准问题和答案;将所述预设数目个答案中的各答案、各答案对应的标准问题、各句所述述求信息,输入到预先训练的上下文模型中,通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数;根据各答案与所述当前用户问句的匹配分数由高到低的排序,从所述各答案中选择部分答案;将所述部分答案作为推荐话术,推荐给客服。在一种可能的实施方式中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:从用户和客服的对话日志中,获取多组一类训练样本;其中,每组一类训练样本包括回答和作为所述述求信息的所述回答的上文信息;根据所述回答,在预先建立的所述知识库中做相似检索,得到所述回答的相似答案,及所述相似答案对应的标准问题;将所述回答、所述相似答案对应的标准问题和所述回答的上文信息,作为一组二类训练样本。进一步地,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:基于多组所述一类训练样本,对所述上下文模型进行预训练;基于多组所述二类训练样本,对预训练后的所述上下文模型进行微调。进一步地,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:根据所述回答,在预先建立的所述知识库中做相似检索,若无法得到所述回答的相似答案,及所述相似答案对应的标准问题,则将所述回答、预先设定的默认标准问题和所述回答的上文信息,作为一组二类训练样本;基于多组所述二类训练样本,对所述上下文模型进行训练。在一种可能的实施方式中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数,包括:根据所述预设数目个答案中的目标答案包含的各词对应的词向量,得到所述预设数目个答案中的目标答案对应的句子的初始向量表达;根据所述目标答案对应的知识点标题包含的各词对应的词向量,得到所述知识点标题对应的句子的初始向量表达;根据各句所述述求信息包含的各词对应的词向量,得到各句所述述求信息对应的句子的初始向量表达;根据各句述求信息对应的句子的初始向量表达和所述目标答案对应的句子的初始向量表达二者之间的交互信息,以及各句述求信息对应的句子的初始向量表达和所述知识点标题对应的句子的初始向量表达二者之间的交互信息,得到各句述求信息对应的第一交互矩阵;根据各句述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数。进一步地,所述根据各句述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数之前,所述方法还包括:将所述目标答案对应的句子的初始向量表达作为自注意力模型的输入,通过所述自注意力模型的输出得到所述目标答案对应的句子的二次向量表达;将所述知识点标题对应的句子的初始向量表达作为所述自注意力模型的输入,通过所述自注意力模型的输出得到所述知识点标题对应的句子的二次向量表达;将各句所述述求信息对应的句子的初始向量表达作为自注意力模型的输入,通过所述自注意力模型的输出得到各句所述述求信息对应的句子的二次向量表达;根据各句所述述求信息对应的句子的二次向量表达和所述目标答案对应的句子的二次向量表达二者之间的交互信息,以及各句所述述求信息对应的句子的二次向量表达和所述知识点标题对应的句子的二次向量表达二者之间的交互信息,得到各句所述述求信息对应的第二交互矩阵;根据各句所述述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数,包括:根据各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数。进一步地,所述根据各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数,包括:将各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵经过卷积和池化,得到各句所述述求信息对应的句子的三次向量表达;将各句所述述求信息对应的句子的三次向量表达作为序列模型的输入,得到所述目标答案与所述当前用户问句的匹配分数。进一步地,所述序列模型为门控循环神经网络(gatedrecurrentunit,GRU)模型或长短期记忆网络(longshort-termmemorynetwork,LSTM)模型。第二方面,提供了一种多轮对话场景下的话术推荐装置,装置包括:第一获取单元,用于针对当前用户问句,获取所述当前用户问句的上文信息;第一检索单元,用于将所述当前用户问句和所述第一获取单元获取的所述当前用户问句的上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;其中,所述知识库包含多组问答对,每组问答对包括对应的标准问题和答案;匹配单元,用于将所述第一检索单元得到的预设数目个答案中的各答案、各答案对应的标准问题、各句所述述求信息,输入到预先训练的上下文模型中,通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数;选择单元,用于根据所述匹配单元得到的各答案与所述当前用户问句的匹配分数由高到低的排序,从所述第一检索单元得到的各答案中选择部分答案;推荐单元,用于将所述选择单元选择的部分答案作为推荐话术,推荐给客服。第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时本文档来自技高网...

【技术保护点】
1.一种多轮对话场景下的话术推荐方法,所述方法包括:针对当前用户问句,获取所述当前用户问句的上文信息;将所述当前用户问句和所述当前用户问句的上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;其中,所述知识库包含多组问答对,每组问答对包括对应的标准问题和答案;将所述预设数目个答案中的各答案、各答案对应的标准问题、各句所述述求信息,输入到预先训练的上下文模型中,通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数;根据各答案与所述当前用户问句的匹配分数由高到低的排序,从所述各答案中选择部分答案;将所述部分答案作为推荐话术,推荐给客服。

【技术特征摘要】
1.一种多轮对话场景下的话术推荐方法,所述方法包括:针对当前用户问句,获取所述当前用户问句的上文信息;将所述当前用户问句和所述当前用户问句的上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;其中,所述知识库包含多组问答对,每组问答对包括对应的标准问题和答案;将所述预设数目个答案中的各答案、各答案对应的标准问题、各句所述述求信息,输入到预先训练的上下文模型中,通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数;根据各答案与所述当前用户问句的匹配分数由高到低的排序,从所述各答案中选择部分答案;将所述部分答案作为推荐话术,推荐给客服。2.如权利要求1所述的方法,其中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:从用户和客服的对话日志中,获取多组一类训练样本;其中,每组一类训练样本包括回答和作为所述述求信息的所述回答的上文信息;根据所述回答,在预先建立的所述知识库中做相似检索,得到所述回答的相似答案,及所述相似答案对应的标准问题;将所述回答、所述相似答案对应的标准问题和所述回答的上文信息,作为一组二类训练样本。3.如权利要求2所述的方法,其中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:基于多组所述一类训练样本,对所述上下文模型进行预训练;基于多组所述二类训练样本,对预训练后的所述上下文模型进行微调。4.如权利要求2所述的方法,其中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数之前,所述方法还包括:根据所述回答,在预先建立的所述知识库中做相似检索,若无法得到所述回答的相似答案,及所述相似答案对应的标准问题,则将所述回答、预先设定的默认标准问题和所述回答的上文信息,作为一组二类训练样本;基于多组所述二类训练样本,对所述上下文模型进行训练。5.如权利要求1所述的方法,其中,所述通过所述上下文模型的输出得到各答案与所述当前用户问句的匹配分数,包括:根据所述预设数目个答案中的目标答案包含的各词对应的词向量,得到所述预设数目个答案中的目标答案对应的句子的初始向量表达;根据所述目标答案对应的知识点标题包含的各词对应的词向量,得到所述知识点标题对应的句子的初始向量表达;根据各句所述述求信息包含的各词对应的词向量,得到各句所述述求信息对应的句子的初始向量表达;根据各句述求信息对应的句子的初始向量表达和所述目标答案对应的句子的初始向量表达二者之间的交互信息,以及各句述求信息对应的句子的初始向量表达和所述知识点标题对应的句子的初始向量表达二者之间的交互信息,得到各句述求信息对应的第一交互矩阵;根据各句述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数。6.如权利要求5所述的方法,其中,所述根据各句述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数之前,所述方法还包括:将所述目标答案对应的句子的初始向量表达作为自注意力模型的输入,通过所述自注意力模型的输出得到所述目标答案对应的句子的二次向量表达;将所述知识点标题对应的句子的初始向量表达作为所述自注意力模型的输入,通过所述自注意力模型的输出得到所述知识点标题对应的句子的二次向量表达;将各句所述述求信息对应的句子的初始向量表达作为自注意力模型的输入,通过所述自注意力模型的输出得到各句所述述求信息对应的句子的二次向量表达;根据各句所述述求信息对应的句子的二次向量表达和所述目标答案对应的句子的二次向量表达二者之间的交互信息,以及各句所述述求信息对应的句子的二次向量表达和所述知识点标题对应的句子的二次向量表达二者之间的交互信息,得到各句所述述求信息对应的第二交互矩阵;根据各句所述述求信息对应的所述第一交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数,包括:根据各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数。7.如权利要求6所述的方法,其中,所述根据各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵,得到所述目标答案与所述当前用户问句的匹配分数,包括:将各句所述述求信息对应的所述第一交互矩阵和所述第二交互矩阵经过卷积和池化,得到各句所述述求信息对应的句子的三次向量表达;将各句所述述求信息对应的句子的三次向量表达作为序列模型的输入,得到所述目标答案与所述当前用户问句的匹配分数。8.如权利要求7所述的方法,其中,所述序列模型为门控循环神经网络GRU模型或长短期记忆网络LSTM模型。9.一种多轮对话场景下的话术推荐装置,所述装置包括:第一获取单元,用于针对当前用户问句,获取所述当前用户问句的上文信息;第一检索单元,用于将所述当前用户问句和所述第一获取单元获取的所述当前用户问句的上文信息作为述求信息,在预先建立的知识库中做相似检索,得到预设数目个答案,及每个答案对应的标准问题;其中,所述知识库包...

【专利技术属性】
技术研发人员:王子豪崔恒斌
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1