基于用户问句生成标准问题的方法和装置制造方法及图纸

技术编号:24353529 阅读:39 留言:0更新日期:2020-06-03 02:05
本说明书实施例提供一种基于用户问句生成标准问题的方法和装置,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。能够提高标准问题的生产效率,相应提升标准问题的覆盖率。

Method and device for generating standard questions based on user questions

【技术实现步骤摘要】
基于用户问句生成标准问题的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于用户问句生成标准问题的方法和装置。
技术介绍
随着人工智能的发展,智能客服应运而生。智能客服即通过机器人客服与用户对话,解答用户问题。在智能客服中,通常预先确定一批提问方式很标准的问题,简称为标准问题,用于对用户提问进行匹配来识别用户真实意图。现有技术中,通常通过人工挖掘的方式生产标准问题,例如,运营人员凭经验或者从线上用户问题中人工选择标准问题。这需要运营人员对业务有深入的了解,能够想象用户可能问到的各种问题。这对运营人员十分有难度,标准问题的生产效率低,也导致提升标准问题的覆盖率很困难。因此,希望能有改进的方案,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
技术实现思路
本说明书一个或多个实施例描述了一种基于用户问句生成标准问题的方法和装置,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。第一方面,提供了一种基于用户问句生成标准问题的方法,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。在一种可能的实施方式中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:<br>判断所述第一数目是否小于或等于预设数目;若所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。进一步地,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,还包括:若所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;对所述各组用户问句分别进行拼接处理,得到各组用户问句分别对应的所述第一输入文本。在一种可能的实施方式中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:识别所述第一数目轮的用户问句中的闲聊语句;删除所述第一数目轮的用户问句中的闲聊语句,得到第二数目轮的用户问句;对所述第二数目轮的用户问句进行拼接处理,得到第一输入文本。在一种可能的实施方式中,所述文本生成模型基于训练样本预先训练;所述训练样本通过如下方式获取:获取用户与机器人客服的第二多轮对话;从所述第二多轮对话中提取用户问句和匹配成功的标准问题,以作为训练样本。在一种可能的实施方式中,所述获取目标用户与人工客服的第一多轮对话之前,所述方法还包括:确定在所述第一多轮对话之前,所述目标用户与机器人客服进行了第三多轮对话,所述第三多轮对话中未得到匹配成功的标准问题。在一种可能的实施方式中,所述文本生成模型包括编码器和解码器;所述将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题,包括:将所述第一输入文本输入所述编码器,得到语义向量;将所述语义向量输入所述解码器,得到所述第一多轮对话对应的标准问题。第二方面,提供了一种基于用户问句生成标准问题的装置,装置包括:获取单元,用于获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取单元,用于提取所述获取单元获取的第一多轮对话中第一数目轮的用户问句;拼接单元,用于对所述提取单元提取的第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;生成单元,用于将所述拼接单元得到的第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。通过本说明书实施例提供的方法和装置,首先获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;然后提取所述第一多轮对话中第一数目轮的用户问句;接着对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;最后将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。由上可见,本说明书实施例,基于目标用户与人工客服的多轮对话,利用预先训练的文本生成模型,生成标准问题,这种自动生成的方式相对于人工挖掘的方式,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的基于用户问句生成标准问题的方法流程图;图3示出根据一个实施例的文本生成模型的结构图;图4示出根据一个实施例的基于用户问句生成标准问题的装置的示意性框图。具体实施方式下面结合附图,对本说明书提供的方案进行描述。图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及基于用户问句生成标准问题。可以理解的是,在智能客服中,通常采用配置知识库(标准问题+标准答案)的方式来回答用户的问题,知识库需要长期的积累才能逐步完善。生产知识库最重要的是生产标准问题,通常做法是运营人员凭经验或者从线上用户问题中人工选择标准问题。这需要运营人员对业务有深入的了解,能够想象用户可能问到的各种问题。这对运营人员十分有难度,也导致提升知识库的覆盖率很困难。参照图1,在人工客服对用户进行服务时,用户跟人工客服的对话形成对话日志数据,本说明书实施例,不是从该日志对话数据中人工挖掘标准问题,而是基于该日志对话数据中的用户问句,利用预先训练的文本生成模型生成标准问题。这种自动生成的方式相对于人工挖掘的方式,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。其中,上述文本生成模型为一种神经网络模型,输入是一段或多段文本,输出是生成的一段文本。图2示出根据一个实施例的基于用户问句生成标准问题的方法流程图,该方法可以基于图1所示的实施场景。如图2所示,该实施例中基于用户问句生成标准问题的方法包括以下步骤:步骤21,获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;步骤22,提取所述第一多轮对话中第一数目轮的用户问句;步骤23,对所本文档来自技高网...

【技术保护点】
1.一种基于用户问句生成标准问题的方法,所述方法包括:/n获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;/n提取所述第一多轮对话中第一数目轮的用户问句;/n对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;/n将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。/n

【技术特征摘要】
1.一种基于用户问句生成标准问题的方法,所述方法包括:
获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;
提取所述第一多轮对话中第一数目轮的用户问句;
对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;
将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。


2.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
判断所述第一数目是否小于或等于预设数目;
若所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。


3.如权利要求2所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,还包括:
若所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;
对所述各组用户问句分别进行拼接处理,得到各组用户问句分别对应的所述第一输入文本。


4.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
识别所述第一数目轮的用户问句中的闲聊语句;
删除所述第一数目轮的用户问句中的闲聊语句,得到第二数目轮的用户问句;
对所述第二数目轮的用户问句进行拼接处理,得到第一输入文本。


5.如权利要求1所述的方法,其中,所述文本生成模型基于训练样本预先训练;
所述训练样本通过如下方式获取:
获取用户与机器人客服的第二多轮对话;
从所述第二多轮对话中提取用户问句和匹配成功的标准问题,以作为训练样本。


6.如权利要求1所述的方法,其中,所述获取目标用户与人工客服的第一多轮对话之前,所述方法还包括:
确定在所述第一多轮对话之前,所述目标用户与机器人客服进行了第三多轮对话,所述第三多轮对话中未得到匹配成功的标准问题。


7.如权利要求1所述的方法,其中,所述文本生成模型包括编码器和解码器;
所述将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题,包括:
将所述第一输入文本输入所述编码器,得到语义向量;
将所述语义向量输入所述解码器,得到所述第一多轮对话对应的标准问题。


8.一种基于用户问句生成标准问题的装置,所述装置包括:
获取单元,用于获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;
提取单元,用于提取所述获取单元获取的第一多轮对话中第一数...

【专利技术属性】
技术研发人员:蒋亮温祖杰张家兴
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1