【技术实现步骤摘要】
基于用户问句生成标准问题的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于用户问句生成标准问题的方法和装置。
技术介绍
随着人工智能的发展,智能客服应运而生。智能客服即通过机器人客服与用户对话,解答用户问题。在智能客服中,通常预先确定一批提问方式很标准的问题,简称为标准问题,用于对用户提问进行匹配来识别用户真实意图。现有技术中,通常通过人工挖掘的方式生产标准问题,例如,运营人员凭经验或者从线上用户问题中人工选择标准问题。这需要运营人员对业务有深入的了解,能够想象用户可能问到的各种问题。这对运营人员十分有难度,标准问题的生产效率低,也导致提升标准问题的覆盖率很困难。因此,希望能有改进的方案,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
技术实现思路
本说明书一个或多个实施例描述了一种基于用户问句生成标准问题的方法和装置,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。第一方面,提供了一种基于用户问句生成标准问题的方法,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。在一种可能的实施方式中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:< ...
【技术保护点】
1.一种基于用户问句生成标准问题的方法,所述方法包括:/n获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;/n提取所述第一多轮对话中第一数目轮的用户问句;/n对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;/n将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。/n
【技术特征摘要】
1.一种基于用户问句生成标准问题的方法,所述方法包括:
获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;
提取所述第一多轮对话中第一数目轮的用户问句;
对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;
将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。
2.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
判断所述第一数目是否小于或等于预设数目;
若所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。
3.如权利要求2所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,还包括:
若所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;
对所述各组用户问句分别进行拼接处理,得到各组用户问句分别对应的所述第一输入文本。
4.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
识别所述第一数目轮的用户问句中的闲聊语句;
删除所述第一数目轮的用户问句中的闲聊语句,得到第二数目轮的用户问句;
对所述第二数目轮的用户问句进行拼接处理,得到第一输入文本。
5.如权利要求1所述的方法,其中,所述文本生成模型基于训练样本预先训练;
所述训练样本通过如下方式获取:
获取用户与机器人客服的第二多轮对话;
从所述第二多轮对话中提取用户问句和匹配成功的标准问题,以作为训练样本。
6.如权利要求1所述的方法,其中,所述获取目标用户与人工客服的第一多轮对话之前,所述方法还包括:
确定在所述第一多轮对话之前,所述目标用户与机器人客服进行了第三多轮对话,所述第三多轮对话中未得到匹配成功的标准问题。
7.如权利要求1所述的方法,其中,所述文本生成模型包括编码器和解码器;
所述将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题,包括:
将所述第一输入文本输入所述编码器,得到语义向量;
将所述语义向量输入所述解码器,得到所述第一多轮对话对应的标准问题。
8.一种基于用户问句生成标准问题的装置,所述装置包括:
获取单元,用于获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;
提取单元,用于提取所述获取单元获取的第一多轮对话中第一数...
【专利技术属性】
技术研发人员:蒋亮,温祖杰,张家兴,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。