一种对象聚类方法、装置及存储设备制造方法及图纸

技术编号:17655700 阅读:53 留言:0更新日期:2018-04-08 08:48
本发明专利技术实施例公开了对象聚类方法、装置及存储设备,应用于信息处理技术领域。在本实施例的方法中,对象聚类装置在进行对象聚类时,会根据对象组之间的关联值得到聚类度,然后再根据聚类度确定将哪些对象组进行聚类。这样通过对象组之间的关联值表示对象组之间的亲密程度,与现有技术中需要通过对象之间的特征向量的距离来表示对象之间的亲密程度相比,大大地减少了计算量;且省去了用特征向量来表示一个对象,从而能提升对象聚类的效果。

【技术实现步骤摘要】
一种对象聚类方法、装置及存储设备
本专利技术涉及信息处理
,特别涉及一种对象聚类方法、装置及存储设备。
技术介绍
现有许多社区类的应用程序,比如K歌或直播等应用程序,同一社区内的用户之间可以通过各自的应用客户端进行互动,比如评论,点赞,送礼或送花等,因此,挖掘出具有相同兴趣的用户对于社区的深入分析具有非常重要的意义。具体地,服务器会先确定各个相似群体,然后就可以根据相似群体中的用户信息进行信息推荐,比如,将相似群体中一个用户的应用客户端关注的信息推荐给相似群体中其他用户的应用客户端等,且服务器还可以引导用户的应用客户端关注相似群体中的其他用户等,这对于加强社区用户的应用客户端之间互动,提高产品的粘性具有非常重要的意义。其中,在确定相似群体时,服务器一般先获取各个用户的特征向量,然后通过聚类方法,比如K均值(k-means)等方式,将特征向量的距离较近的用户划分到同一个相似群体中。但是通过这种方法在确定一个用户属于哪个相似群体时,需要计算该用户的特征信息与各个相似群体中每个用户的特征向量之间的距离,计算量比较大;另外,用特征向量来表示一个用户也是比较困难的事情,特征选取的好坏直接决定了聚类的效果。
技术实现思路
本专利技术实施例提供一种对象聚类方法、装置及存储设备,实现了根据第一对象组分别与至少一个第二对象组之间的关联值,确定第一对象组与哪个第二对象组进行聚类。本专利技术实施例第一方面提供一种对象聚类方法,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。本专利技术实施例第二方面提供一种对象聚类装置,包括:对象组确定单元,用于确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;关联确定单元,用于确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;计算单元,用于根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;聚类单元,用于如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。本专利技术实施例第三方面提供一种存储设备,所述存储设备储存多条指令,所述指令适于由处理器加载并执行如本专利技术实施例第一方面所述的对象聚类方法。本专利技术实施例第四方面提供一种服务器,包括处理器和存储设备,所述处理器,用于实现各个指令;所述存储设备用于储存多条指令,所述指令用于由处理器加载并执行如本专利技术实施例第一方面所述的对象聚类方法。可见,在本实施例的方法中,对象聚类装置在进行对象聚类时,会根据对象组之间的关联值得到聚类度,然后再根据聚类度确定将哪些对象组进行聚类。这样通过对象组之间的关联值表示对象组之间的亲密程度,与现有技术中需要通过对象之间的特征向量的距离来表示对象之间的亲密程度相比,大大地减少了计算量;且省去了用特征向量来表示一个对象,从而能提升对象聚类的效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种对象聚类方法应用于的场景的示意图;图2是本专利技术一个实施例提供的一种对象聚类方法的流程图;图3a是本专利技术一个实施例中一种第一对象组和第二对象组之间的关系示意图;图3b是本专利技术一个实施例中另一种第一对象组和第二对象组之间的关系示意图;图3c是本专利技术一个实施例中另一种第一对象组和第二对象组之间的关系示意图;图3d是本专利技术一个实施例中又一种第一对象组和第二对象组之间的关系示意图;图3e是本专利技术一个实施例中一种各个对象组之间的关系示意图;图3f是本专利技术一个实施例中又一种各个对象组之间的关系示意图;图4是本专利技术应用实施例提供的一种对象聚类方法的流程图;图5a是本专利技术应用实施例中各个用户之间的关系示意图;图5b是本专利技术应用实施例中一种用户组1与用户组2之间的关系示意图;图5c是本专利技术应用实施例中另一种用户组1与用户组2之间的关系示意图;图6是本专利技术实施例提供的一种对象聚类装置的结构示意图;图7是本专利技术实施例提供的另一种对象聚类装置的结构示意图;图8是本专利技术实施例提供的一种服务器的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术实施例提供一种对象聚类方法,主要是对象聚类装置所执行的方法。可以应用于如图1所示的场景中,该场景中包括应用服务器和多个(图1中以n个为例说明)应用客户端。其中,应用客户端为社区类应用的客户端,比如K歌或直播等客户端,一个用户可以使用用户信息,并通过应用客户端登录应用服务器,这样一个应用客户端可以对应一个用户;应用服务器可以通过用户信息识别出用户,并对识别出的用户进行聚类。这种情况下,对象聚类装置具体为应用服务器,应用服务器将用户作为对象进行聚类。本专利技术实施例的对象聚类方法还可以应用于其它场景,比如,需要对其它虚拟物品,或是歌曲等进行聚类的场景,在这里并不对本专利技术实施例的对象聚类方法的场景进行限制。具体地,在本专利技术实施例中,对象聚类装置可以通过如下方法进行对象聚类:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果至少一个聚类度中第一聚类度满足预置的第一条件,将第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。可见,对象聚类装置在进行对象聚类时,会根据对象组之间的关联值得到聚类度,然后再根据聚类度确定将哪些对象组进行聚类。这样可以通过对象组之间的关联值表示对象组之间的亲密程度,与现有技术中需要通过对象之间的特征向量的距离来表示对象之间的亲密程度相比,大大地减少了计算量;且省去本文档来自技高网...
一种对象聚类方法、装置及存储设备

【技术保护点】
一种对象聚类方法,其特征在于,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。

【技术特征摘要】
1.一种对象聚类方法,其特征在于,包括:确定与第一对象组相关联的至少一个第二对象组,其中,任一对象组中包括至少一个对象;确定所述第一对象组分别与至少一个第二对象组之间的关联值,得到至少一个关联值;根据所述至少一个关联值及预置的聚类度的函数计算式分别计算对应的聚类度,得到至少一个聚类度;如果所述至少一个聚类度中第一聚类度满足预置的第一条件,将所述第一聚类度对应的第二对象组与第一对象组聚类到同一对象组中。2.如权利要求1所述的方法,其特征在于,确定所述第一对象组与某一个第二对象组之间的关联值,具体包括:确定所述第一对象组内的第一对象,与某一第二对象组内的第二对象之间,基于至少一个维度的关联分值;所述第一对象和第二对象是相关联的对象;如果所述第一对象和第二对象都为一个,则将所述第一对象与第二对象之间基于至少一个维度的关联分值的数学计算值作为所述第一对象组与第二对象组之间的关联值。3.如权利要求2所述的方法,其特征在于,确定所述第一对象组与某一个第二对象组之间的关联值,还包括:如果所述第一对象为一个,第二对象为多个,则计算一个第一对象分别与多个第二对象之间基于至少一个维度的关联分值的数学计算值,得到多个数学计算值,将所述多个数学计算值之和作为所述第一对象组与第二对象组的关联值;如果所述第一对象为多个,第二对象为多个,则分别计算所述多个第一对象中每个第一对象与相关联的第二对象之间基于至少一个维度的关联分值的数学计算值,得到多个数学计算值,将所述多个数学计算值之和作为所述第一对象组与第二对象组的关联值。4.如权利要求2所述的方法,其特征在于,如果所述对象为用户,所述第一对象为第一用户,第二对象为第二用户,所述至少一个维度包括:所述第一用户和第二用户分别通过应用客户端操作的信息,则所述基于至少一个维度的关联分值具体包括:所述第一用户通过应用客户端操作的第一信息,与第二用户通过应用客户端操作的第二信息中相同的信息条数,除以所述第一信息和第二信息的信息条数之和,得到的商值。5.如权利要求1所述的方法,其特征在于,所述预置的聚类度的函数计算式包括:其中,∑in为所述第一对象组内对象之间的关联值之和,某一第二对象组内对象之间的关联值之和,与所述第一对象组与某一第二对象组之间关联值相加后的值;所述∑tot为所述第一对象组和某一第二对象组中对象,与其它对象组的对象之间的关联值之和;所述m包括所有对象之间的关联值之和。6.如权利要求1至5任一项所述的方法,其特征在于,所述至少一个聚类度中第一聚类度满足预置的第一条件,具体包括:如果所述至少一个聚类度包括一个聚类度,所述第一聚类度对应的整体聚类度大于当前整体聚类度,所述当前整体聚类度为所述第一聚类度对应的第二对象组与第一对象组在聚类之前所有对象组的聚类度之和,所述第一聚类度对应的整体聚类度为所述第一聚类度对应的第二对象组与第一对象组在聚类之后所有对象组的聚类度之和;如果所述至少一个聚类度包括多个聚类度,所述第一聚类度对应的整体聚类度大于所述当前...

【专利技术属性】
技术研发人员:黄安埠
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1