用于确定用户社群信息的方法和装置制造方法及图纸

技术编号:24708307 阅读:48 留言:0更新日期:2020-07-01 00:00
本公开的实施例公开了用于确定用户社群信息的方法和装置。该方法的一具体实施方式包括:获取预设的用户集合的用户信息,构建连通图;通过采样从连通图中提取出连通子图,提取出连通子图的用户关系特征和社群特征;基于连通子图对应的用户关系特征和社群特征,分别确定连通子图对应的用户关系先验信息和社群先验信息,基于用户关系先验信息和社群先验信息,以及连通子图,采用预设的主题模型估计出连通子图对应的用户子集中的用户所属社群的分布信息;基于连通子图对应的用户子集中的用户所属社群的分布信息,确定对应用户的社群归属信息。该实施方式的主题模型估计出的用户所属社群的分布信息,耦合了用户的社群特征和关系特征,从而提高了确定用户社群归属信息准确性。

【技术实现步骤摘要】
用于确定用户社群信息的方法和装置
本公开的实施例涉及计算机
,具体涉及机器学习领域,尤其涉及一种用于确定用户社群信息的方法和装置。
技术介绍
社群可以按照关联关系来定义,比如相近的地理区域或者社会关系,也可以按照抽象的思想定义,比如共同爱好或者精神情感等。在互联网领域,如电商或互联网金融等,用户之间往往存在千丝万缕的联系,比如拥有共同绑定手机号或者银行卡号的用户,或者热爱购买相同商品或理财产品的用户,挖掘这种联系与用户本身特性之间的关系可以更好的服务于多种业务。而在这些特性之中,用户的社群标签可以标识出用户本身的性质,可用于后续建模或其他数据分析。相关技术中,一般通过规则匹配、传统机器学习中的有监督学习、无监督学习或图算法确定用户的社群归属信息。其中规则匹配仅能基于直观的标准对个体进行识别;有监督分类模型受限于已有标签的数量,泛化性较差,且无法发现用户的隐含社群类型;无监督模型与图关联模型只能提取局部信息。
技术实现思路
本公开的实施例提出了用于确定用户社群信息的方法和装置。第一方面,本公开的实本文档来自技高网...

【技术保护点】
1.一种用于确定用户社群信息的方法,其中,包括:/n获取预设的用户集合的用户信息,并基于所述用户集合中的用户信息构建连通图,所述连通图中的节点表征用户,所述连通图中的边基于各用户的用户信息表征的用户间关系构建;/n通过采样从所述连通图中提取出连通子图,并基于所述连通子图对应的用户子集中各用户的用户信息提取出所述连通子图的用户关系特征和社群特征,其中,所述用户关系特征表征所述连通子图中对应的用户子集中单个用户的关联特征,所述社群特征表征所述连通子图对应的用户子集的社群分布特征;/n基于所述连通子图的用户关系特征和社群特征,确定所述连通子图对应的用户关系先验信息和社群先验信息;/n基于所述用户关系...

【技术特征摘要】
1.一种用于确定用户社群信息的方法,其中,包括:
获取预设的用户集合的用户信息,并基于所述用户集合中的用户信息构建连通图,所述连通图中的节点表征用户,所述连通图中的边基于各用户的用户信息表征的用户间关系构建;
通过采样从所述连通图中提取出连通子图,并基于所述连通子图对应的用户子集中各用户的用户信息提取出所述连通子图的用户关系特征和社群特征,其中,所述用户关系特征表征所述连通子图中对应的用户子集中单个用户的关联特征,所述社群特征表征所述连通子图对应的用户子集的社群分布特征;
基于所述连通子图的用户关系特征和社群特征,确定所述连通子图对应的用户关系先验信息和社群先验信息;
基于所述用户关系先验信息和所述社群先验信息,以及所述连通子图,采用预设的主题模型估计出所述连通子图对应的用户子集中的用户所属社群的分布信息;
基于所述连通子图对应的用户子集中的用户所属社群的分布信息,确定对应用户的社群归属信息。


2.根据权利要求1所述的方法,其中,
所述连通子图的用户关系特征和社群特征,包括所述用户子集中每个用户的用户关系特征和社群特征,以及所述基于所述连通子图的用户关系特征和社群特征,确定所述连通子图对应的用户关系先验信息和社群先验信息,包括:
基于每个用户对应的用户关系特征和社群特征,分别确定所述用户子集中各用户的特征集中度,基于所述用户子集中各用户的特征集中度确定所述连通子图对应的用户关系先验信息;
基于所述连通子图的用户关系特征和社群特征,确定所述连通子图的特征集中度,将所述连通子图的特征集中度确定为所述连通子图对应的社群先验信息。


3.根据权利要求1所述的方法,其中,通过采样从所述连通图中提取出连通子图,包括:
基于预设条件,对所述连通图进行随机游走采样,从中提取出预设数量的连通子图。


4.根据权利要求1所述的方法,其中,基于所述用户关系先验信息和所述社群先验信息,以及所述连通子图,采用预设的主题模型估计出所述连通子图对应的用户子集中的用户所属社群的分布信息,包括:
将所述连通子图、社群、用户分别作为主题模型的文档、主题、词汇,基于所述预设的主题模型执行如下操作:
基于所述社群先验信息和所述用户关系先验信息,对所述连通子图进行随机游走采样,估计出连通子图中各社群的分布信息和各社群中用户的分布信息;
基于所述连通子图中各社群的分布信息,对所述连通子图中的社群进行随机游走采样,估计出社群子集;
基于所述各社群中用户的分布信息和所述社群子集,估计用户所属社群的分布信息。


5.根据权利要求1至4之一所述的方法,其中,基于所述连通子图对应的用户子集中的用户所属社群的分布信息,确定对应用户的社群归属信息,包括:
基于所述连通子图中得到的用户所属社群的分布信息,采用投票机制确定对应用户的社群归属类型。


6.一种用于确定用户社群信息的装置,其中,包括:
连通图构建单元,被配置成获取预设的用户集合的用户信息,并基于所述用户集合中的用户信息构建连通图,所述连通图中的节点表征用户,所...

【专利技术属性】
技术研发人员:张一凡王虎黄志翔彭南博
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1