用户意图识别方法、装置以及电子设备制造方法及图纸

技术编号:34202358 阅读:40 留言:0更新日期:2022-07-20 11:00
本申请实施例提供了一种用户意图识别方法、装置以及电子设备,所述方法包括:获取待处理的用户对话数据;采用至少两种聚类算法对所述用户对话数据进行聚类,得到聚类结果;获取所述聚类结果之间的交集作为目标聚类结果;依据所述目标聚类结果进行用户意图识别,得到用户意图数据。本申请实施例利用至少两种聚类算法对应的聚类结果,并保留两者的交集作为目标聚类结果,由于仅保留了高质量的目标聚类结果,因此基于目标聚类结果进行用户意图识别,可以获得高质量的用户意图数据。可以获得高质量的用户意图数据。可以获得高质量的用户意图数据。

User intention identification method, device and electronic device

【技术实现步骤摘要】
用户意图识别方法、装置以及电子设备


[0001]本申请实施例涉及计算机
,特别是涉及一种用户意图识别方法、一种用户意图识别装置、一种电子设备以及一种存储介质。

技术介绍

[0002]随着互联网的快速发展,建立在互联网之上的各种应用也层出不穷。为了提高用户的应用体验,通常需要挖掘用户的用户意图数据,以为用户提供与其用户意图相匹配的服务。
[0003]然而,目标的意图挖掘方法无法高效地从海量、高噪声且无标注的用户对话数据中,挖掘出高质量的用户意图数据,正是如此,也无法基于用户意图数据训练各种模型,为用户提供更好的服务。
[0004]因此,如何获取高质量的用户意图数据,是亟待解决的问题。

技术实现思路

[0005]本申请实施例提供了一种用户意图识别方法,以获取高质量的用户意图数据。
[0006]相应的,本申请实施例还提供了一种用户意图识别装置、一种电子设备以及一种存储介质,用以保证上述方法的实现及应用。
[0007]为了解决上述问题,本申请实施例公开了一种用户意图识别方法,所述方法包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户意图识别方法,其特征在于,所述方法包括:获取待处理的用户对话数据;采用至少两种聚类算法对所述用户对话数据进行聚类,得到聚类结果;获取所述聚类结果之间的交集作为目标聚类结果;依据所述目标聚类结果进行用户意图识别,得到用户意图数据。2.根据权利要求1所述的方法,其特征在于,在获取待处理的用户对话数据后,所述方法还包括:对所述用户对话数据进行分词,得到对话分词;确定所述对话分词的词性,保留包含指定词性的对话分词所对应的用户对话数据;对保留的所述用户对话数据进行去重处理。3.根据权利要求1所述的方法,其特征在于,所述采用至少两种聚类算法对所述用户对话数据进行聚类,得到聚类结果,包括:依据所述用户对话数据转换得到意图向量;采用至少两种聚类算法对所述意图向量进行聚类,得到聚类结果。4.根据权利要求3所述的方法,其特征在于,所述依据所述用户对话数据转换得到意图向量,包括:将所述用户对话数据转换为句向量;采用自编码器对所述句向量进行降维处理,得到意图向量。5.根据权利要求1所述的方法,其特征在于,所述获取所述聚类结果之间的交集作为目标聚类结果,包括:获取所述聚类结果之间的交集;采用匈牙利算法确定所述交集中的最大交集,作为目标聚类结果。6.根据权利要求1所述的方法,其特征在于,所述目标聚类结果包括簇结果,所述依据所述目标聚类结果进行用户意图识别,得到用户意图数据,包括:采用至少两种关键字提取算法,分别获取所述簇结果的关键字以及所述关键字对应的关键字分数;从所述关键字提取算法对应的关键字分数中,分别确定最高关键字分数;针对所述关键字,采用所述关键字提取算法对应的关键字分数以及所述最高关键字分数计算权重总分数;依据所述权重总分数从所述关键字中提取出目标关键字。7.根据权利要求6所述的方法,其特征在于,还包括:计算所述目标关键字与指定语料,在指定窗口大小内的共现次数;所述指定窗口大小用于表征在一文本中所述目标关键字与所述指定语料之间允许出现的单词的数量,所述共现次数用于表征所述目标关键字与所述指定语料同时出现的次数;当所述共现次数满足预设阈值时,将所述目标关键字和指定语料组合为关键短语。8.根据权利要求6所述的方法,其特征在于,还包括:依据所述簇结果的所述目标关键字的所述权重总分数得到簇分数;按照所述簇分数在所述聚类结...

【专利技术属性】
技术研发人员:林廷恩黎槟华武玉川李永彬孙健
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1