【技术实现步骤摘要】
交互意图路径的挖掘方法以及装置
本说明书实施例涉及数据处理
,特别涉及一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
随着人工智能的发展,智能机器人以更低的成本和更高的产能,进一步地推动了营销业务的发展。然而智能机器人的智能系统的质量极大地取决于知识库对于可能发生的用户提问的覆盖程度,由于每日会从业务场景中新增大量用户的用户语音信息,这些语料可以作为扩充知识库的重要来源。而这些用户语音信息有着严重的同质性,不同的语句可能包含着相同的意图,另一方面,过多冗余语料的引入不利于知识库的构建和维护,因此如何构建以及有效更新知识库成为一个亟待解决的重要问题。
技术实现思路
有鉴于此,本说明书实施例提供了一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种交互意图路径的挖掘方法,包括:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。可选的,所述按照所述词桶规则的规则顺序对所述词桶词单 ...
【技术保护点】
1.一种交互意图路径的挖掘方法,包括:/n获取交互过程中用户输入的用户语音信息对应的文本数据;/n对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;/n将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;/n按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。/n
【技术特征摘要】
1.一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
2.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
3.根据权利要求2所述的交互意图路径的挖掘方法,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。
4.根据权利要求3所述的交互意图路径的挖掘方法,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。
5.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
6.根据权利要求5所述的交互意图路径的挖掘方法,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
7.根据权利要求6所述的交互意图路径的挖掘方法,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:
根据所述新词单元...
【专利技术属性】
技术研发人员:严文君,潘岩,高俊鑫,刘磊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。