【技术实现步骤摘要】
一种用户意图的语料扩展方法和系统
本申请涉及数据处理领域,特别涉及一种用户意图的语料扩展方法和系统。
技术介绍
随着人工智能的发展,机器可以通过对人类语言进行分析,识别语句的含义,实现人机交互。问答为人机交互的一种典型应用场景,机器需要识别出提用户说的话的意图,才能准确的给出后续的对话。用户意图可以通过建立自然语言模型来预测。然而,模型的建立需要大量的训练语料,在训练模型的语料数量有限的情况下,需要挖掘更多的用户语料,做数据增强,提升模型对用户意图的识别效果。因此,亟需一种用户意图的语料扩展方法和系统。
技术实现思路
本说明书一个方面提供一种用户意图的语料扩展方法,所述方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一 ...
【技术保护点】
1.一种用户意图的语料扩展方法,包括:/n获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;/n从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;/n确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;/n从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。/n
【技术特征摘要】
1.一种用户意图的语料扩展方法,包括:
获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;
从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;
确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;
从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。
2.如权利要求1所述的方法,所述从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,包括:
获取所述用户意图的至少一条用户语料;
将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料。
3.如权利要求1所述的方法,所述从至少一条第二服务话术中,确定与所述第一服务话术之间的相似度满足第一预设条件的至少一条第三服务话术,包括:
基于第一编码模型对所述第一服务话术,以及所述至少一条第二服务话术进行向量表示;
计算所述第一服务话术的向量与所述第二服务话术的向量之间的第一距离;
将所述第一距离小于第一阈值的第二服务话术作为所述第三服务话术。
4.如权利要求2所述的方法,所述将与所述至少一条用户语料的相似度满足第二预设条件的候选扩展语料,作为所述目标扩展语料,包括:
基于第二编码模型对所述至少一条用户语料,以及所述至少一条候选扩展语料进行向量表示;
判断所述至少一条用户语料中是否存在与所述候选扩展语料的向量距离小于第二阈值的语料;
是则将所述候选扩展语料作为所述目标扩展语料。
5.如权利要求2所述的方法,通过匹配模型,确定所述第一服务话术和所述第二服务话术之间的相似度,或/和确定所述用户语料和所述候选扩展语料之间的相似度。
6.如权利要求2所述的方法,所述方法还包括:
获取用户对所述第一服务话术的回答话语;
将所述回答话语输入意图分类模型,确定所述用户的意图;所述意图分类模型基于所述至少一条用户语料和/或所述至少一条目标扩展语料训练得到。
7.一种用户意图的语料扩展系统,包括:
第一获取模块,用于获取第一服务话术和用户意图...
【专利技术属性】
技术研发人员:金春祥,刘佳,崔恒斌,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。