基于层自编码器的多源用户属性推断方法技术

技术编号:23764972 阅读:23 留言:0更新日期:2020-04-11 19:21
本发明专利技术提供了一种基于层自编码器的多源用户属性推断方法。该方法包括:从用户在多个社交媒体上发布的动态信息中提取用户的行为特征;通过最小化重构误差和同一用户不同社交媒体上动态行为特征映射到同一人口属性空间的差异,所述层自编码器利用非线性映射输出用户的稳定的人口属性特征;针对每个用户的稳定的人口属性特征训练一个分类器,通过所述分类器对每个用户的人口属性特征进行分类。本发明专利技术用多源的异构信息有利于寻找不同社交媒体上的共享模式。利用层自编码器更精确地建模动态行为和稳定人口属性之间的关系。使用大量的未标注的数据,相比于有标注的数据,省时省力,降低对数据的要求,从而提高分类器对用户属性推断的准确率。

Multi-source user attribute inference method based on layer self encoder

【技术实现步骤摘要】
基于层自编码器的多源用户属性推断方法
本专利技术涉及网络信息提取
,尤其涉及一种基于层自编码器的多源用户属性推断方法。
技术介绍
社交媒体上的信息指的是用户于社交媒体间的互动行为,如发布的动态、好友关系和填写的个人信息等。用户属性包括性别、年龄、学历和宗教信仰等。社交媒体上的信息是随着时间和平台的变化而变化的,而人口统计属性,如性别、年龄、婚姻状况和职业等在很长时间内都是稳定的,并且不会随着平台的变化而变化,所以动态行为特征与稳定人口属性之间是矛盾的,已有的方法不能很好的解决该矛盾。现有技术中的一种从社交媒体信息中获取用户属性信息的方法为:利用单源社交媒体信息去推断用户属性,或利用两源信息去解决动态行为特征与静态人口属性之间的矛盾。上述现有技术中的从社交媒体信息中获取用户属性信息的方法的缺点为:该方法利用的信息较少,捕捉到的行为特征是有限的。该方法采用线性方法建模,如CPME(oupledprojectionmatrixextraction,对偶投影矩阵提取),只能建模动态行为和稳定人口属性之间的部分关系。本文档来自技高网...

【技术保护点】
1.一种基于层自编码器的多源用户属性推断方法,其特征在于,包括:/n从用户在多个社交媒体上发布的动态信息中提取用户的行为特征;/n将用户的行为特征输入到层自编码器两两进行重构,通过最小化重构误差和同一用户不同社交媒体上动态行为特征映射到同一人口属性空间的差异,所述层自编码器利用非线性映射输出用户的稳定的人口属性特征;/n针对每个用户的稳定的人口属性特征训练一个分类器,通过所述分类器对每个用户的人口属性特征进行分类。/n

【技术特征摘要】
1.一种基于层自编码器的多源用户属性推断方法,其特征在于,包括:
从用户在多个社交媒体上发布的动态信息中提取用户的行为特征;
将用户的行为特征输入到层自编码器两两进行重构,通过最小化重构误差和同一用户不同社交媒体上动态行为特征映射到同一人口属性空间的差异,所述层自编码器利用非线性映射输出用户的稳定的人口属性特征;
针对每个用户的稳定的人口属性特征训练一个分类器,通过所述分类器对每个用户的人口属性特征进行分类。


2.根据权利要求1所述的方法,其特征在于,所述的从用户在多个社交媒体上发布的动态信息中提取用户的行为特征,包括:
针对每个用户,分别从三个社交媒体上提取出该用户的无标注的动态的行为特征fg、ft和fy,并对行为特征fg、ft和fy两两分组。


3.根据权利要求2所述的方法,其特征在于,所述的将用户的行为特征输入到层自编码器两两进行重构,包括:
设置encoder和decoder分别是解码器和编码器,将所述用户的行为特征fg、ft和fy输入到encoder和decoder两两进行重构,encoder和decoder输出用户的隐特征;
所述重构的计算公式所示:




































encoder和decoder分别是解码器和编码器,其上标表示重构的源社交媒体和目标社交媒体,其中,目标社交媒体在前,源社交媒体在后;
h为通过encoder和decoder得到的隐特征,其上标表示重构的源社交媒体和目标社交媒体,其中,目标社交媒体在前,源社交媒体在后;
f~为通过重构得到的动态行为特征,其上标表示重构的源社交媒体和目标社交媒体,其中,目标社交媒体在前,源社交媒体在后;
softplus是激活函数,其公式表达如下所示:
y=log(1+ex)
W和b是一对权重,上标表示重构的源社交媒体和目标社交媒体,其中,目标社交媒体在前,源社交媒体在后,下标为e时,表示其是编码器中的参数,下标为d时,表示其是解码器中的参数。

【专利技术属性】
技术研发人员:张博宇丁相国桑基韬于剑
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1