【技术实现步骤摘要】
对象集群画像确定方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种对象集群画像确定方法、装置、计算机设备和存储介质。
技术介绍
[0002]对象与对象的关系可以构成一个庞大、复杂的对象关系网络。对对象关系网络进行分析和信息挖掘具有重要意义,例如,可以从对象关系网络中定位特定性质的团体,来提高风险控制能力,可以从对象关系网络中聚合具有相同爱好、兴趣的对象,从而进行精准的信息推荐。
[0003]传统技术中,通常是基于人工从对象关系网络中定位对象集群,例如,基于群众所提供的信息定位特定性质的团体,但是,这样的处理方式不仅效率低下而且不能准确地识别出完整的对象集群。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高对象集群定位效率和准确性的对象集群画像确定方法、装置、计算机设备和存储介质。
[0005]一种对象集群画像确定方法,所述方法包括:
[0006]获取对象行为数据集合;所述对象行为数据集合包括多个候选对象标识对应的行为数据, ...
【技术保护点】
【技术特征摘要】
1.一种对象集群画像确定方法,其特征在于,所述方法包括:获取对象行为数据集合;所述对象行为数据集合包括多个候选对象标识对应的行为数据,所述行为数据是从候选对象标识对应的单据中提取的;基于相似行为参考信息,从所述对象行为数据集合中检索相似行为数据,将存在相似行为数据的候选对象标识形成关联对象标识,得到至少一组关联对象标识;基于同一组关联对象标识对应的相似行为数据,得到各组关联对象标识对应的相似行为统计信息;基于各个相似行为统计信息建立对象标识关系图;所述对象标识关系图包括关联对象标识对应的对象节点和基于相似行为统计信息确定的节点关联信息;基于所述节点关联信息,对所述对象标识关系图中的对象节点进行对象聚类,得到至少一个对象集群子图;基于同一对象集群子图对应的各个候选对象标识的行为数据,生成各个对象集群子图对应的对象集群画像。2.根据权利要求1所述的方法,其特征在于,所述相似行为参考信息包括行为触发地点、行为触发时间、行为类型和资源消耗信息;所述基于相似行为参考信息,从所述对象行为数据集合中检索相似行为数据,将存在相似行为数据的候选对象标识形成关联对象标识,得到至少一组关联对象标识,包括:从所述对象行为数据集合中,获取行为触发地点、行为触发时间、行为类型和资源消耗信息匹配的行为数据作为相似行为数据,得到至少一组相似行为数据;将同一组相似行为数据对应的候选对象标识作为关联对象标识,得到各组关联对象标识。3.根据权利要求2所述的方法,其特征在于,所述行为触发地点匹配是指行为数据对应的行为触发地点一致,所述行为触发时间匹配是指行为数据对应的行为触发时间的时间间隔小于预设时间间隔,所述行为类型匹配是指行为数据对应的行为类型一致,所述资源消耗信息匹配是指行为数据对应的资源消耗信息的信息差异小于预设阈值。4.根据权利要求1所述的方法,其特征在于,所述基于同一组关联对象标识对应的相似行为数据,得到各组关联对象标识对应的相似行为统计信息,包括:从同一组关联对象标识对应的相似行为数据中,统计相似行为触发次数,得到各组关联对象标识对应的相似行为触发次数;基于所述各组关联对象标识对应的相似行为触发次数,得到各组关联对象标识对应的相似行为统计信息。5.根据权利要求4所述的方法,其特征在于,所述基于所述各组关联对象标识对应的相似行为触发次数,得到各组关联对象标识对应的相似行为统计信息,包括:基于同一组关联对象标识对应的相似行为数据计算行为数据差异,基于行为数据差异计算行为相似度,得到各组关联对象标识对应的行为相似度;融合同一组关联对象标识对应的相似行为触发次数和行为相似度,得到所述各组关联对象标识对应的相似行为统计信息。6.根据权利要求1所述的方法,其特征在于,所述基于各个相似行为统计信息建立对象标识关系图,包括:
获取大于预设统计信息的相似行为统计信息所对应的关联对象标识作为目标对象标识;将各组目标对象标识对应的候选对象标识作为对象节点,基于各组目标对象标识对应的相似行为统计信息,计算各组对象节点对应的节点关联信息;基于所述各组对象节点对应的节点关联信息连接各组对象节点,得到所述对象标识关系图。7.根据权利要求1所述的方法,其特征在于,所述基于所述节点关联信息,对所述对象标识关系图中的对象节点进行对象聚类,得到至少一个对象集群子图,包括:从所述对象标识关系图中识别连通子图,得到至少一个第一级集群子图;基于所述第一级集群子图对应的节点关联信息,对所述第一级集群子图中的对象节点进行对象聚类,得到各个第一级集群子图分别对应的第二级集群子图;基于所述各个第一级集群子图和各个第二级集群子图,得到所述对象集群子图。8.根据权利要求7所述的方法,其特征在于,所述基于所述第一级集群子图对应的节点关联信息,对所述第一级集群子图中的对象节点进行对象聚类,得到各个第一级集群子图分别对应的第二级集群子图,包括:从所述各个第一级集群子图中确定当前集群子图;从当前集群子图中确定目标对象节点;配置当前集群子图中各个对象节点之间的聚类参数为第一参数;基于当前集群子图对应的节点关联信息和聚类参数,计算当前集群子图对应的第一节点紧密度;将目标对象节点和对应的邻接对象节点之间的聚类参数更新为第二参数,计算当前集群子图对应的第二节点紧密度;基于所述第一节点紧密度和所述第二节点紧密度,确定目标对象节点和对应的邻接对象节点之间的目标聚类参数,基于目标对象节点和对应的邻接对象节点之间的目标聚类参数更新当前集群子图中目标对象节点和对应的邻接对象节点之间的聚类参数;将下一对象节点作为目标对象节点,返回所述基于当前集群子图对应的节点关联信息和聚类参数,计算当前集群子图对应的第一节点紧密度的步骤执行,直至满足第一收敛条件,得到当前集群子图中各个对象节点之间的目标聚类参数;基于当前集群子图中各个对象节点之间的目标聚类参数,压缩当前集群子图,得到更新集群子图;将更新集群子图作为当前集群子图,返回所述从当前集群子图中确定目标对象节点的步骤执行,直至满足第二收敛条件,得到第一级集群子图对应的第二级集群子图。9.根据权利要求8所述的方法,其特征在于,所述基于当前集群子图对应的节点...
【专利技术属性】
技术研发人员:李晓雯,叶志豪,赵瑞辉,郑建光,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。