【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质
[0001]本专利技术涉及计算机
,特别涉及一种数据处理方法、装置、电子设备及存储介质。
技术介绍
[0002]聚类算法是机器学习中涉及对数据进行分组的一种算法。在给定的数据集中,我们可以通过聚类算法将其分成一些不同的组。在理论上,相同的组的数据之间有相同的属性或者是特征,不同组数据之间的属性或者特征相差就会比较大。
[0003]然而,聚类算法的种类很多,有基于密度的聚类算法,基于层次的聚类算法、基于网格的聚类算法等等。然而在将聚类算法应用在给定的数据集进行数据分类的时候,很难去评价针对该数据集,哪种聚类算法更合适,这就导致基于聚类算法去推荐对象的时候,减少了对象推荐的准确性。
技术实现思路
[0004]为了解决现有技术的问题,本专利技术实施例提供了一种数据处理方法、装置、电子设备及存储介质。技术方案如下:
[0005]一方面,提供了一种数据处理方法,方法包括:
[0006]获取K个聚类结果;K个聚类结果中的每个聚类结果包括多个对象簇; ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取K个聚类结果;所述K个聚类结果中的每个聚类结果包括多个对象簇;所述K个聚类结果基于K种不同的第一聚类方式分别对对象集合进行聚类操作确定,所述第一聚类方式基于聚类算法和聚类特征确定;所述K为大于等于4的整数;基于所述K个聚类结果确定聚类组合;所述聚类组合包括从所述K个聚类结果中确定的L个第一聚类结果;所述L为大于等于2的整数;基于所述聚类组合中的L个第一聚类结果分别包含的多个对象簇确定所述聚类组合对应的多个核对象集;根据所述聚类组合对应的多个核对象集从所述K个聚类结果中确定目标聚类结果;基于所述目标聚类结果和账号信息向所述账号信息对应的设备发送目标对象;所述目标对象为所述对象集合中的对象;所述目标对象包括和所述账号信息相匹配的对象描述数据、对象标识数据和对象内容数据中的至少一个。2.根据权利要求1所述的数据处理方法,其特征在于,所述聚类组合的数量为一个;所述基于所述聚类组合中的L个第一聚类结果分别包含的多个对象簇确定所述聚类组合对应的多个核对象集,包括:基于所述L个第一聚类结果中的每个第一聚类结果包括的多个对象簇确定多个对象交集;每个对象交集为L个对象簇之间的交集,所述L个对象簇中的每个对象簇分别来源于所述L个第一聚类结果;确定所述多个对象交集中的每个对象交集对应的L个对象簇中的每个对象簇的中心对象集;基于所述多个对象交集中的每个对象交集,以及所述每个对象交集对应的L个对象簇中的每个对象簇的中心对象集确定每个对象交集对应的核对象集;根据所述每个对象交集对应的核对象集确定所述聚类组合对应的多个核对象集。3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述聚类组合对应的多个核对象集从所述K个聚类结果中确定目标聚类结果,包括:获取第二聚类结果;所述第二聚类结果为所述K个聚类结果中,除所述第一聚类结果之外的聚类结果;所述第二聚类结果的数量大于等于2;确定所述第二聚类结果中的每个第二聚类结果包括的多个对象簇中的每个对象簇的中心对象集;基于所述聚类组合对应的多个核对象集和所述每个第二聚类结果包括的多个对象簇中的每个对象簇的中心对象集,从所述第二聚类结果中确定所述目标聚类结果。4.根据权利要求2或者3所述的数据处理方法,其特征在于,所述确定所述多个对象交集中的每个对象交集对应的L个对象簇中的每个对象簇的中心对象集,包括:确定所述L个对象簇中的每个对象簇中的中心对象;基于所述每个对象簇中的中心对象和所述中心对象所属的对象簇中的非中心对象确定所述每个对象簇对应的距离信息集;基于所述每个对象簇对应的距离信息集确定每个对象簇的中心对象集。5.根据权利要求2或者3所述的数据处理方法,其特征在于,所述基于所述L个第一聚类结果中的每个第一聚类结果包括的多个对象簇确定多个对象交集,包括:
基于所述L个第一聚类结果中的每个第一聚类结果包括的多个对象簇确定Q个待处理交集;每个待处理交集为L个对象簇之间的交集,所述L个对象簇中的每个对象簇分别来源于所述L个第一聚类结果;所述待处理交集的数量基于所述每个第一聚类结果包括的对象簇的数量的乘积确定;基于所述Q个待处理交集中的对象数量和预设对象数量从所述Q个待处理交集过滤得到所述多个对象交集。6.根据权利要求3所述的数据处理方法,其特征在于,所述基于所述聚类组合对应的多个核对象集和所述每个第二聚类结果包括的多个对象簇中的每个对象簇的中心对象集,从所述第二聚类结果中确定所述目标聚类结果,包括:针对所述多个核对象集中每个核对象集,执行:将当前正在执行的核对象集作为当前核对象集;确定所述每个第二聚类结果对应的中心对象集和所述当前核对象集之间的待对比比值;所述待对比比值的数量和所述第二聚类结果的数量相同;将待对比比值中的预设比值对应的第二聚类结果确定为所述当前核对象集对应的准目标聚类结果;直至对所述多个核对象集中的每个核对象集执行完毕,将获取准目标聚类结果次数最多的第二...
【专利技术属性】
技术研发人员:刘兵,孙振龙,胡博,刘祺,梁铭霏,李靖,张博,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。