一种对多个用户进行用户群划分的方法、装置与设备制造方法及图纸

技术编号:8594000 阅读:157 留言:0更新日期:2013-04-18 07:11
本发明专利技术的目的是提供一种用于基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。其中,本发明专利技术获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备
技术介绍
现有技术中一般基于用户属性,如基于用户所属行业分类、地域等,直接对多个用户进行用户群划分;或是通过确定用户的分类体系,构建被标注的客户分类样本,通过训练分类模型从而对多个用户进行用户群划分。但是,基于用户属性直接划分的方式所涉及的用户属性信息维度有限,在复杂的网络应用场景中则无法得到正确划分后的用户群;同时,由于不同的业务需求需要不同类型的分类体系,因而通过构建训练分类模型体系进行划分的方式的构建成本较大,且静态的分类体系构建无法有效地适应复杂多变的网络应用环境。
技术实现思路
本专利技术的目的是提供一种基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。根据本专利技术的一个方面,提供了一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现本文档来自技高网...

【技术保护点】
一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤:a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。

【技术特征摘要】
1.一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。2.根据权利要求1所述的方法,其中,所述步骤c包括-当所述共现关系强度不小于预定的关系强度阈值时,通过CNM算法,基于下式来构建初始化模块度增量矩阵AQ,其中,初始化将所述用户拓扑关系网中每个节点上的一个用户作为一个用户群3.根据权利要求2所述的方法,其中,该方法还包括-基于C匪算法,根据下式在所述用户拓扑关系网中确定每个用户群的用户群内交互关系强度Q = Σ j (θπ—aj )。其中,i表示用户拓扑关系网中划分后的用户群i ;表示用户群i中处于群内的边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例;%表示用户群i所关联的所有边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例。4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括-提取划分后的属于同一用户群的多个用户的相同特征信息;-将所述相同特征信息标注为该用户群的描述信息。5.根据权利要求4所述的方法,其中,所述相同特征信息包括以下至少任一项-用户属性信息;-同一用户群的多个用户的发布信息对应的相同关键词。6...

【专利技术属性】
技术研发人员:闫新发黄启友谢剑董贯慧
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1