一种基于多参数K-means算法的意图识别方法、装置和电子设备制造方法及图纸

技术编号:26377657 阅读:42 留言:0更新日期:2020-11-19 23:46
本发明专利技术提供了一种基于多参数K‑means算法的意图识别方法、装置和电子设备。该方法包括:建立样本数据集,该样本数据集包括多个由对话文本转化得到的语义向量;使用K‑means算法对样本数据集进行多轮聚类处理,每一轮聚类采用不同的k值,并输出初始的聚类结果;设定融合策略,并确定待融合的初始的聚类结果,融合策略包括融合参数和融合规则;根据融合规则,对待融合的初始的聚类结果进行融合处理,形成最终的聚类结果;基于最终的聚类结果,对当前用户对话输入的语音,进行意图识别。本发明专利技术的方法采用改进了的K‑means算法,实现了更精确的意图分类和识别,提高了意图聚类质量,还优化了方法。

【技术实现步骤摘要】
一种基于多参数K-means算法的意图识别方法、装置和电子设备
本专利技术涉及计算机信息处理领域,具体涉及一种基于多参数K-means算法的意图识别方法、装置和电子设备。
技术介绍
随着互联网技术的发展,对话系统在电商、智能设备等方面有着广泛的应用,越来越引起人们的关注。意图识别是对话系统中首要且重要的任务,并且是一个多分类问题,相应地,需要使用一个多分类的模型来做对应的处理。事实上,分类问题是机器学习的基本问题,与其对应的还有回归、聚类等等。聚类,就是将已有的数据对象进行分类,让每一类内部之间的相似度尽可能的大,每一类外部之间的相似度尽可能的小。一般情况下,在对数据进行划分的过程中,只靠信息之间简单的相似性作为准则,没有任何背景知识和相应的假设,不需要定义类别和性质,按照自然属性进行分类,由此,聚类分析被认为是一种无监督分析方法。聚类在许多领域中都得到应用,如:生物学,统计学,神经网络,信息检索,图像处理和数据挖掘。但是,如何利用这些领域知识来提高聚类分析的质量,是半监督聚类分析的重要研究内容。现有的聚类算法一般分为五本文档来自技高网...

【技术保护点】
1.一种基于多参数K-means算法的意图识别方法,应用于智能语音机器人中对用户意图的识别,其特征在于,包括:/n建立样本数据集,该样本数据集包括多个由对话文本转化得到的语义向量,所述对话文本是用户与智能语音机器人进行对话时输入的语音所转化;/n使用K-means算法对所述样本数据集进行多轮聚类处理,每一轮聚类采用不同的k值,并输出初始的聚类结果,所述k值是K-means算法中初始中心向量的个数;/n设定融合策略,并确定待融合的初始的聚类结果,所述融合策略包括融合参数和融合规则;/n根据所述融合规则,对所述待融合的初始的聚类结果进行融合处理,形成最终的聚类结果;/n基于所述最终的聚类结果,对当...

【技术特征摘要】
1.一种基于多参数K-means算法的意图识别方法,应用于智能语音机器人中对用户意图的识别,其特征在于,包括:
建立样本数据集,该样本数据集包括多个由对话文本转化得到的语义向量,所述对话文本是用户与智能语音机器人进行对话时输入的语音所转化;
使用K-means算法对所述样本数据集进行多轮聚类处理,每一轮聚类采用不同的k值,并输出初始的聚类结果,所述k值是K-means算法中初始中心向量的个数;
设定融合策略,并确定待融合的初始的聚类结果,所述融合策略包括融合参数和融合规则;
根据所述融合规则,对所述待融合的初始的聚类结果进行融合处理,形成最终的聚类结果;
基于所述最终的聚类结果,对当前用户与智能语音机器人进行对话时输入的语音,进行意图识别。


2.根据权利要求1所述的意图识别方法,其特征在于,所述设定融合策略包括:
设定多个融合参数,该融合参数包括同一类内的纯度、整体纯度、纯度增益、噪音比率、同一类内的覆盖度和轮廓系数中的至少两个;
纯度达到纯度设定阈值和/或噪音比率小于噪音设定阈值。


3.根据权利要求1或2所述的意图识别方法,其特征在于,所述设定融合策略还包括:
设定融合规则,所述融合规则包括设定语义相同或相近的第一规则、向量相似度超过设定阈值的第二规则;
按照所述第一规则和/或第二规则对待融合的不同类集合进行融合处理,自适应选定最优k’值。


4.根据权利要求1至3中任一项所述的意图识别方法,其特征在于,还包括:
设定样本服从正态分布,初始的聚类结果中的类数量随着所述多轮聚类处理的轮数增加而增加,并且在所述多轮聚类处理的轮数达到特定轮数时,初始的聚类结果中的类数量逐渐减小;
基于融合参数中至少一个参数最优的规则,确定Qrglow类集合和Qrghigh类集合作为待融合的初始的聚类结果。


5.根据权利要求1至4中任一项所述的意图识别方法,其特征在于,还包括:
根据所述融合规则,筛选所述Qrglow类集合和Qrghigh类集合...

【专利技术属性】
技术研发人员:孔醍刘宗全张家兴
申请(专利权)人:北京奇保信安科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1