聚类分析方法、装置、设备及存储介质制造方法及图纸

技术编号:26597828 阅读:22 留言:0更新日期:2020-12-04 21:20
本申请实施例提供一种聚类分析方法、装置、设备及存储介质,基于预先配置的聚类模型,分别获取目标系统在第一时刻时的第一对象集的第一聚类结果、目标系统在第二时刻时的第二对象集的第二聚类结果,根据第一聚类结果和第二聚类结果,确定第二聚类结果相对于第一聚类结果的纯度信息,最后根据上述纯度信息,确定是否需要更新聚类模型。该技术方案中,通过将第二聚类结果相对于第一聚类结果的纯度信息作为判断指标,其能够确定出合适的模型重训练时机,不仅能够避免用户聚类不准确的问题,而且可以避免人力和时间浪费的问题,提高了策略实施效果。

【技术实现步骤摘要】
聚类分析方法、装置、设备及存储介质
本申请实施例涉及自然语言处理
,尤其涉及一种聚类分析方法、装置、设备及存储介质。
技术介绍
聚类是将一群物理对象或者抽象对象划分成相似的对象类的过程,这个相似的对象类通常叫做类或类簇。在实际应用中,企业为了提高业务转化、促进交易,需要根据不同的用户群体制定不同的策略方案,因而,如何对用户进行聚类是实现策略处理的前提。目前,用户聚类方法主要是基于聚类模型对用户进行聚类,该聚类模型的建立需要大量的人群标注数据,人群标注数据是专业人员通过对一定时期内的用户行为进行分析得到的,但不同时期的用户行为数据可能会发生较大变化,需要重新对用户行为进行分析进而重新训练得到聚类模型,又由于人群标注的工作量比较大,成本高,所以,现有技术中通常选择一个固定时间间隔定期训练聚类模型,以保证低训练成本和模型的适用性。然而,在实现本专利技术过程中,专利技术人发现上述方案至少存在如下问题:现有技术中的固定时间间隔是研究人员根据聚类模型的历史更新时间设定的,其仅能表征历史一段时间段内模型更新的时间间隔,无法准确表征正在使本文档来自技高网...

【技术保护点】
1.一种聚类分析方法,其特征在于,包括:/n基于预先配置的聚类模型,分别获取第一对象集的第一聚类结果、第二对象集的第二聚类结果,所述第一对象集是目标系统在第一时刻的目标对象集,所述第二对象集是所述目标系统在第二时刻的目标对象集;/n根据所述第一聚类结果和所述第二聚类结果,确定所述第二聚类结果相对于所述第一聚类结果的纯度信息,所述纯度信息用于指示所述第一对象集和所述第二对象集的对象聚类变化信息;/n根据所述纯度信息,确定是否需要更新所述聚类模型。/n

【技术特征摘要】
1.一种聚类分析方法,其特征在于,包括:
基于预先配置的聚类模型,分别获取第一对象集的第一聚类结果、第二对象集的第二聚类结果,所述第一对象集是目标系统在第一时刻的目标对象集,所述第二对象集是所述目标系统在第二时刻的目标对象集;
根据所述第一聚类结果和所述第二聚类结果,确定所述第二聚类结果相对于所述第一聚类结果的纯度信息,所述纯度信息用于指示所述第一对象集和所述第二对象集的对象聚类变化信息;
根据所述纯度信息,确定是否需要更新所述聚类模型。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一聚类结果和所述第二聚类结果,确定所述第二聚类结果相对于所述第一聚类结果的纯度信息,包括:
根据所述第一聚类结果和所述第二聚类结果,确定所述第一对象集和所述第二对象集的对象聚类关联信息;
根据所述对象聚类关联信息,确定对象聚类关联矩阵,所述对象聚类关联矩阵中的行用于表征所述第一聚类结果对应聚类信息,所述对象聚类关联矩阵中的列用于表征所述第二聚类结果对应聚类信息;
根据所述对象聚类关联矩阵和预设的纯度计算公式,确定所述第二聚类结果相对于所述第一聚类结果的纯度信息。


3.根据权利要求2所述的方法,其特征在于,所述纯度计算公式如下所示:






其中,P为所述第二聚类结果相对于所述第一聚类结果的纯度信息,i为所述第一聚类结果中聚类的变量,j为所述第二聚类结果中聚类的变量,k为聚类的总数量;
mij为所述对象聚类变更矩阵中第i行、第j列的元素,用于表征所述第一聚类结果中的第i个聚类与所述第二聚类结果中的第j个聚类的对象交集;

为所述第一对象集和所述第二对象集中的对象合并且去重后的对象总数量;

为所述第一聚类结果中属于第i个聚类的对象总数量;pi为所述第一聚类结果中第i个聚类的纯度信息。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预先配置的聚类模型,分别获取第一对象集的第一聚类结果、第二对象集的第二聚类结果,包括:
获取所述聚类模型的聚类信息,所述聚类信息包括:聚类数量和每个聚类的类中心;
基于所述聚类数量和每个聚类的类中心,对所述第一对象集中的对象进行聚类划分,得到所述第一聚...

【专利技术属性】
技术研发人员:岳小芬
申请(专利权)人:京东数字科技控股股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1