问答语句检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36088877 阅读:59 留言:0更新日期:2022-12-24 11:05
本申请提供一种问答语句检索方法、装置、电子设备及存储介质,通过获取第一提问语句,第一提问语句为基于自然语言的字符串;将第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,匹配值表征待选语句作为第一提问语句的回答语句的合理程度,其中,语句处理模型用于根据第一提问语句在至少两个评估维度下的特征信息,生成各待选语句对应的匹配值;基于各待选语句的匹配值,得到目标回答语句。由于语句处理模型能够解析第一提问语句在多个评估维度下的特征信息,并基于各评估维度下的特征信息对语料库中的待选语句作为回答语句的合理程度进行评估,使得到的匹配值能够兼顾多个评估维度下的特征,提高匹配准确性和命中率。确性和命中率。确性和命中率。

【技术实现步骤摘要】
问答语句检索方法、装置、电子设备及存储介质


[0001]本申请涉及自然语言处理
,尤其涉及一种问答语句检索方法、装置、电子设备及存储介质。

技术介绍

[0002]当前,随着互联网电商、在线教育、金融等各行各业客户服务量的高速增长,传统的客户服务模式已无法全面满足企业发展的业务需求,服务成本大幅增长,在这样的大背景下,以人工智能技术为核心的智能客服问答系统应运而生。通过智能客服问答系统进行问答语句检索,企业可以通过互联网向无数顾客提供多渠道的在线客户服务,从而可以在保证服务质量和服务效率的同时,大幅降低企业客服成本的开支。
[0003]现有技术中,智能客服问答系统通常是基于预训练的语言模型来针对用户输入的提问语句,从语料库中进行语句检索,得到最匹配的回答语句,并反馈给用户,完成智能问答的过程。
[0004]然而,现有技术中的问答语句的检索方法,存在匹配准确性差、命中率低等问题。

技术实现思路

[0005]本申请提供一种问答语句检索方法、装置、电子设备及存储介质,用以解决上述问答语句的检索过程中存在的匹配准确性差、命中率低等问题。
[0006]第一方面,本申请提供了一种问答语句检索方法,包括:
[0007]获取第一提问语句,所述第一提问语句为基于自然语言的字符串;将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程度,其中,所述语句处理模型用于根据所述第一提问语句在至少两个评估维度下的特征信息,生成各待选语句对应的匹配值;基于各所述待选语句的匹配值,得到目标回答语句。
[0008]在一种可能的实现方式中,所述语句处理模型包括多任务层和输出层,所述将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,包括:通过所述多任务层,获取所述第一提问语句在目标评估维度上的第一特征信息;通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值。
[0009]在一种可能的实现方式中,所述目标评估维度包括语句相似性维度和语义相关性维度;通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值,包括:通过所述输出层,计算所述第一特征信息与所述第二特征信息的语句相似度,和/或语义相关度,得到各所述第二特征信息对应的匹配值。
[0010]在一种可能的实现方式中,所述语句处理模型还包括共享层,所述方法还包括:通过所述共享层,对所述第一提问语句进行编码,得到第一提问语句中的各字词单元对应的
嵌入向量,所述嵌入向量表征所述字词单元在所述第一提问语句中的上下文信息。
[0011]在一种可能的实现方式中,所述共享层包括第一共享层和第二共享层,所述第一共享层用于提取所述第一提问语句中的各字词单元对应的词向量;所述第二共享层用于基于Transformer编码器,将所述词向量转换为所述嵌入向量。
[0012]在一种可能的实现方式中,所述方法还包括:获取至少两个目标任务对应的样本数据,所述目标任务用于确定对应评估维度下的回答语句;基于所述样本数据对预设的多任务模型进行训练,得到所述语句处理模型。
[0013]在一种可能的实现方式中,基于所述样本数据对预设的多任务模型进行训练,得到所述语句处理模型,包括:基于所述样本数据,分别对预设的至少两个多任务模型进行训练,生成对应的第一多任务模型;基于各所述第一多任务模型集合,进行知识蒸馏,得到所述语句处理模型。
[0014]第二方面,本申请提供了一种问答语句检索装置,包括:
[0015]接收模块,用于获取第一提问语句,所述第一提问语句为基于自然语言的字符串;
[0016]处理模块,用于将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程度,其中,所述语句处理模型用于根据所述第一提问语句在至少两个评估维度下的特征信息,生成各待选语句对应的匹配值;
[0017]输出模块,用于基于各所述待选语句的匹配值,得到目标回答语句。
[0018]在一种可能的实现方式中,所述语句处理模型包括多任务层和输出层,所述处理模块在将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值时,具体用于:通过所述多任务层,获取所述第一提问语句在目标评估维度上的第一特征信息;通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值。
[0019]在一种可能的实现方式中,所述目标评估维度包括语句相似性维度和语义相关性维度;所述处理模块在通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值时,具体用于:通过所述输出层,计算所述第一特征信息与所述第二特征信息的语句相似度,和/或语义相关度,得到各所述第二特征信息对应的匹配值。
[0020]在一种可能的实现方式中,所述语句处理模型还包括共享层,所述处理模块,还用于:
[0021]通过所述共享层,对所述第一提问语句进行编码,得到第一提问语句中的各字词单元对应的嵌入向量,所述嵌入向量表征所述字词单元在所述第一提问语句中的上下文信息。
[0022]在一种可能的实现方式中,所述共享层包括第一共享层和第二共享层,所述第一共享层用于提取所述第一提问语句中的各字词单元对应的词向量;所述第二共享层用于基于Transformer编码器,将所述词向量转换为所述嵌入向量。
[0023]在一种可能的实现方式中,所述问答语句检索装置,还包括:训练模块,所述训练模块用于:获取至少两个目标任务对应的样本数据,所述目标任务用于确定对应评估维度下的回答语句;基于所述样本数据对预设的多任务模型进行训练,得到所述语句处理模型。
[0024]在一种可能的实现方式中,所述训练模块在基于所述样本数据对预设的多任务模型进行训练,得到所述语句处理模型时,具体用于:基于所述样本数据,分别对预设的至少两个多任务模型进行训练,生成对应的第一多任务模型;基于各所述第一多任务模型集合,进行知识蒸馏,得到所述语句处理模型。
[0025]第三方面,本申请提供了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
[0026]所述存储器存储计算机执行指令;
[0027]所述处理器执行所述存储器存储的计算机执行指令,以实现如本申请实施例第一方面任一项所述的问答语句检索方法。
[0028]第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本申请实施例第一方面任一项所述的问答语句检索方法。
[0029]根据本申请实施例的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答语句检索方法,其特征在于,所述方法包括:获取第一提问语句,所述第一提问语句为基于自然语言的字符串;将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程度,其中,所述语句处理模型用于根据所述第一提问语句在至少两个评估维度下的特征信息,生成各待选语句对应的匹配值;基于各所述待选语句的匹配值,得到目标回答语句。2.根据权利要求1所述的方法,其特征在于,所述语句处理模型包括多任务层和输出层,所述将所述第一提问语句输入语句处理模型,得到预设语料库内的各待选语句的匹配值,包括:通过所述多任务层,获取所述第一提问语句在目标评估维度上的第一特征信息;通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值。3.根据权利要求2所述的方法,其特征在于,所述目标评估维度包括语句相似性维度和语义相关性维度;通过所述输出层,处理所述第一特征信息和各所述待选语句在所述目标评估维度下的第二特征信息,得到各所述第二特征信息对应的匹配值,包括:通过所述输出层,计算所述第一特征信息与所述第二特征信息的语句相似度,和/或语义相关度,得到各所述第二特征信息对应的匹配值。4.根据权利要求2所述的方法,其特征在于,所述语句处理模型还包括共享层,所述方法还包括:通过所述共享层,对所述第一提问语句进行编码,得到第一提问语句中的各字词单元对应的嵌入向量,所述嵌入向量表征所述字词单元在所述第一提问语句中的上下文信息。5.根据权利要求4所述的方法,其特征在于,所述共享层包括第一共享层和第二共享层,所述第一共享层用于提...

【专利技术属性】
技术研发人员:张浩陈明浩张舒沁
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1