模型训练、智能客服问题聚类方法及相关装置制造方法及图纸

技术编号:35748740 阅读:27 留言:0更新日期:2022-11-26 18:53
本发明专利技术涉及人工智能技术领域,提供了一种模型训练、智能客服问题聚类方法及相关装置,所述方法包括:将训练集输入聚类特征表示模型,得到每个训练数据的特征向量,训练集包括有标签的训练数据和无标签的训练数据;对每个特征向量进行聚类,得到聚类簇和每个聚类簇对应的簇标签;当聚类簇不满足聚类条件时,根据标签集和/或每个簇标签,对每个簇标签进行迭代优化,标签集包括训练集中每个有标签的训练数据的真实标签;基于训练数据及优化后的簇标签,对聚类特征表示模型进行训练,得到训练后的聚类特征表示模型。本发明专利技术利用真实标签对初始簇标签进行调整,再利用调整后的簇标签进行模型训练,使训练出的聚类特征表示模型的聚类效果更好。效果更好。效果更好。

【技术实现步骤摘要】
模型训练、智能客服问题聚类方法及相关装置


[0001]本专利技术涉及人工智能
,具体而言,涉及一种模型训练、智能客服问题聚类方法及相关装置。

技术介绍

[0002]新意图发现是智能客服问答系统的一项重要的任务,检测发现新的用户意图,不仅能提高问答系统的服务质量,还能通过分析发现的新意图,发现可能提供商业机会和指导改进方向的潜在的用户兴趣。通常将新意图发现作为一个聚类问题。
[0003]实际应用场景中大量的问题是无标签标注数据,只有少量的问题是有标签标注数据,如何充分利用无标签标注数据和少量的有标签标注数据进行聚类分析是本领域技术人员亟待解决的问题。

技术实现思路

[0004]本专利技术的目的在于提供了一种模型训练、智能客服问题聚类方法及相关装置,其能够在聚类特征表示模型训练时充分利用有标签标注数据和无标签标注数据,使训练出的聚类特征表示模型的聚类效果更好,最终利用该聚类特征表示模型能够对智能客服问题进行准确聚类,并根据聚类结果及时发现新的用户意图。
[0005]为了实现上述目的,本专利技术实施例采用的技术方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:将训练集输入聚类特征表示模型,得到每个训练数据的特征向量,所述训练集包括有标签的训练数据和无标签的训练数据;对每个所述特征向量进行聚类,得到聚类簇和每个所述聚类簇对应的簇标签;当所述聚类簇不满足聚类条件时,根据标签集和/或每个所述簇标签,对每个所述簇标签进行迭代优化,所述标签集包括所述训练集中每个有标签的训练数据的真实标签;基于所述训练数据及优化后的簇标签,对所述聚类特征表示模型进行训练,得到训练后的聚类特征表示模型。2.如权利要求1所述的模型训练方法,其特征在于,所述根据所述标签集和/或每个所述簇标签,对每个所述簇标签进行迭代优化的步骤,包括:根据所述有标签的训练数据的真实标签,修改与所述有标签的训练数据对应的簇标签,获得所述优化后的簇标签。3.如权利要求1所述的模型训练方法,其特征在于,所述根据所述标签集和/或每个所述簇标签,对每个所述簇标签进行迭代优化的步骤,还包括:将当前迭代的簇标签与前次迭代的簇标签进行对齐,获得优化后的簇标签,其中,所述当前迭代的簇标签中有标签的训练数据的簇标签具体为:根据所述有标签的训练数据的真实标签,修改与所述有标签的训练数据对应的簇标签后得到的优化后的簇标签。4.如权利要求2或3所述的模型训练方法,其特征在于,所述基于所述训练数据及优化后的簇标签,对所述聚类特征表示模型进行训练,得到训练后的聚类特征表示模型的步骤,包括:将所述训练数据、所述无标签的训练数据对应的簇标签以及所述优化后的簇标签对所述聚类特征表示模型进行参数优化,获得优化后的聚类特征表示模型;将所述训练集输入所述优化后的聚类特征表示模型,得到每一所述训练数据的优化特征向量;对每个所述优化特征向量进行聚类,得到优化聚类簇和每个所述优化聚类簇对应的优化簇标签;当所述优化聚类簇满足聚类条件时,所述优化后的聚类特征表示模型为所述训练后的聚类特征表示模型。5.如权利要求4所述的模型训练方法,其特征在于,所述方法还包括:针对每个特征向量,计算所述特征向量的簇内距离和簇间距离,所述簇内距离为所述特征向量与其所属的目标聚类簇中其他特征向量的距离平均值,所述簇间距离为所述特征向量与除所述目标聚类簇之外的每个其他聚类簇中所有特征向量的距离平均值的最小值;根据每个特征向量的簇内距离和簇间距离,计算轮廓系数;若所述轮廓系数收敛,则判定所述聚类簇满足聚类条件;若所述轮廓系数不收敛,则判定所述聚类簇不满足聚类条件。6.如权利要求2所述的模型训练方法,其特征在于,所述根据所述有标签的训练数据的真实标签,修改与所述有标签的训练数据对应的簇标签,获得所述优化后的簇标签的步骤,包括:根据每个所述真实标签对应的特征向量,得到每个所述真实标签的类别中心;
根据每个所述簇...

【专利技术属性】
技术研发人员:邱霞霞廖智霖娄东方高峰林金曙陈哲
申请(专利权)人:恒生电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1