交互意图路径的挖掘方法以及装置制造方法及图纸

技术编号:23890758 阅读:22 留言:0更新日期:2020-04-22 06:22
本说明书实施例提供交互意图路径的挖掘方法以及装置,其中所述交互意图路径的挖掘方法包括:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。

Mining method and device of interactive intention path

【技术实现步骤摘要】
交互意图路径的挖掘方法以及装置
本说明书实施例涉及数据处理
,特别涉及一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
随着人工智能的发展,智能机器人以更低的成本和更高的产能,进一步地推动了营销业务的发展。然而智能机器人的智能系统的质量极大地取决于知识库对于可能发生的用户提问的覆盖程度,由于每日会从业务场景中新增大量用户的用户语音信息,这些语料可以作为扩充知识库的重要来源。而这些用户语音信息有着严重的同质性,不同的语句可能包含着相同的意图,另一方面,过多冗余语料的引入不利于知识库的构建和维护,因此如何构建以及有效更新知识库成为一个亟待解决的重要问题。
技术实现思路
有鉴于此,本说明书实施例提供了一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种交互意图路径的挖掘方法,包括:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。可选的,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;若否,将所述任意一个交互意图路径加入所述意图知识库。可选的,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:获取所述意图知识库中新增的交互意图路径对应的回复信息;建立所述回复信息与所述新增的交互意图路径的关联关系。可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。可选的,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。可选的,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:根据所述新词单元创建新词桶规则;按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;将所述新规则顺序嵌入所述规则顺序。可选的,所述获取交互过程中用户输入的用户语音信息对应的文本数据,包括:获取交互过程中用户输入的超过一轮交互的用户语音信息;通过语音识别将所述用户语音信息转化为文本数据。可选的,所述获取交互过程中用户输入的用户语音信息对应的文本数据步骤执行之后,并所述对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元步骤执行之前,还包括:根据预设词典对所述文本数据进行修正。可选的,在所述语句中存在多个与所述多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,相应的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径,包括:将与所述任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元;按照所述词桶规则的规则顺序对所述组合词桶词单元以及未组合的词桶词单元进行串联,生成所述语句对应的交互意图路径。根据本说明书实施例的第二方面,提供了一种交互意图路径的挖掘装置,包括:获取模块,被配置为获取交互过程中用户输入的用户语音信息对应的文本数据;分词模块,被配置为对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;提取模块,被配置为将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;生成模块,被配置为按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。根据本说明书实施例的第三方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述交互意图路径的挖掘方法的步骤。本说明书一个实施例,通过将交互中用户输入的用户语音信息对应的文本数据中的各个语句进行分词,将分词后获得的词单元依次与预先根据业务需要配置的多个词桶规则匹配,提取各个语句中与各个词桶规则匹配的词桶词单元,实现了引入与业务场景相关的业务词汇规则作为词桶规则,并根据业务场景需要灵活地配置词桶规则,而按照各个词桶规则的规则顺序对所述各个语句中的词桶词单元以及对应的词桶规则进行串联,生成各个语句对应的交互意图路径,实现了通过设置词桶规则的规则顺序,将提取出的词桶词单元的按照规则顺序进行排序,提升了生成的交互意图路径可理解性,并进一步提高了交互意图路径的准确性。附图说明图1是本说明书一个实施例提供的一种交互意图路径的挖掘方法的流程图;图2是本说明书一个实施例提供的一种应用于电销机器人的交互意图路径的挖掘方法的处理流程图;图3是本说明书一个实施例提供的一种交互意图路径的挖掘装置的结构示意图;图4是本说明书一个实施例提供的一种计算设备的结构框图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书本文档来自技高网...

【技术保护点】
1.一种交互意图路径的挖掘方法,包括:/n获取交互过程中用户输入的用户语音信息对应的文本数据;/n对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;/n将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;/n按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。/n

【技术特征摘要】
1.一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。


2.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。


3.根据权利要求2所述的交互意图路径的挖掘方法,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。


4.根据权利要求3所述的交互意图路径的挖掘方法,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。


5.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。


6.根据权利要求5所述的交互意图路径的挖掘方法,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。


7.根据权利要求6所述的交互意图路径的挖掘方法,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:
根据所述新词单元...

【专利技术属性】
技术研发人员:严文君潘岩高俊鑫刘磊
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1