【技术实现步骤摘要】
一种对象聚类方法、装置及存储设备
本专利技术涉及信息处理
,特别涉及一种对象聚类方法、装置及存储设备。
技术介绍
现有许多社区类的应用程序,比如K歌或直播等应用程序,同一社区内的用户之间可以通过各自的应用客户端进行互动,比如评论,点赞,送礼或送花等,因此,挖掘出具有相同兴趣的用户对于社区的深入分析具有非常重要的意义。具体地,服务器会先确定各个相似群体,然后就可以根据相似群体中的用户信息进行信息推荐,比如,将相似群体中一个用户的应用客户端关注的信息推荐给相似群体中其他用户的应用客户端等,且服务器还可以引导用户的应用客户端关注相似群体中的其他用户等,这对于加强社区用户的应用客户端之间互动,提高产品的粘性具有非常重要的意义。其中,在确定相似群体时,服务器一般先获取各个用户的特征向量,然后通过聚类方法,比如K均值(k-means)等方式,将特征向量的距离较近的用户划分到同一个相似群体中。但是通过这种方法在确定一个用户属于哪个相似群体时,需要计算该用户的特征信息与各个相似群体中每个用户的特征向量之间的距离,计算量比较大;另外,用特征向量来表示一个用户也是比较困难的事情,特征选取的好坏直接决定了聚类的效果。
技术实现思路
本专利技术实施例提供一种对象聚类方法、装置及存储设备,实现了根据第一对象组分别与至少一个第二对象组之间的关联值,确定第一对象组与哪个第二对象组进行聚类。本专利技术实施例第一方面提供一种对象聚类方法,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一 ...
【技术保护点】
一种对象聚类方法,其特征在于,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。
【技术特征摘要】
1.一种对象聚类方法,其特征在于,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。2.如权利要求1所述的方法,其特征在于,确定所述第一对象组与某一个第二对象组之间的关联值,具体包括:确定所述第一对象组内的第一对象,与某一第二对象组内的第二对象之间,基于至少一个维度的关联分值;所述第一对象和第二对象是相关联的对象;如果所述第一对象和第二对象都为一个,则将所述第一对象与第二对象之间基于至少一个维度的关联分值的数学计算值作为所述第一对象组与第二对象组之间的关联值。3.如权利要求2所述的方法,其特征在于,确定所述第一对象组与某一个第二对象组之间的关联值,还包括:如果所述第一对象为一个,第二对象为多个,则计算一个第一对象分别与多个第二对象之间基于至少一个维度的关联分值的数学计算值,得到多个数学计算值,将所述多个数学计算值之和作为所述第一对象组与第二对象组的关联值;如果所述第一对象为多个,第二对象为多个,则分别计算所述多个第一对象中每个第一对象与相关联的第二对象之间基于至少一个维度的关联分值的数学计算值,得到多个数学计算值,将所述多个数学计算值之和作为所述第一对象组与第二对象组的关联值。4.如权利要求2所述的方法,其特征在于,如果所述对象为用户,所述第一对象为第一用户,第二对象为第二用户,所述至少一个维度包括:所述第一用户和第二用户分别通过应用客户端操作的信息,则所述基于至少一个维度的关联分值具体包括:所述第一用户通过应用客户端操作的第一信息,与第二用户通过应用客户端操作的第二信息中相同的信息条数,除以所述第一信息和第二信息的信息条数之和,得到的商值。5.如权利要求1所述的方法,其特征在于,所述预置的聚类度的函数计算式包括:其中,∑in为所述第一对象组内对象之间的关联值之和,某一第二对象组内对象之间的关联值之和,与所述第一对象组与某一第二对象组之间关联值相加后的值;所述∑tot为所述第一对象组和某一第二对象组中对象,与其它对象组的对象之间的关联值之和;所述m包括所有对象之间的关联值之和。6.如权利要求1至5任一项所述的方法,其特征在于,所述至少一个聚类度中第一聚类度满足预置的第一条件,具体包括:如果所述至少一个聚类度包括一个聚类度,所述第一聚类度对应的整体聚类度大于当前整体聚类度,所述当前整体聚类度为所述第一聚类度对应的第二对象组与第一对象组在聚类之前所有对象组的聚类度之和,所述第一聚类度对应的整体聚类度为所述第一聚类度对应的第二对象组与第一对象组在聚类之后所有对象组的聚类度之和;如果所述至少一个聚类度包括多个聚类度,所述第一聚类度对应的整体聚类度大于所述当前...
【专利技术属性】
技术研发人员:黄安埠,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。