当前位置: 首页 > 专利查询>东华大学专利>正文

基于时空关系学习的移动社交网络用户关系推断方法技术

技术编号:25837517 阅读:47 留言:0更新日期:2020-10-02 14:18
本发明专利技术提供了一种基于时空关系学习的移动社交网络用户关系推断方法,本发明专利技术同时考虑了个体之间的移动性和社交性。考虑社交网结构对社会联系预测的有效性,该模型首先基于用户的移动性构建一个初步的社交图,然后从初步构建的社交图中抽取用户对的社交网络结构特征,最后综合移动性和社交性两个方面的特征进行朋友关系推断。我们的模型一旦训练完成,可以较好地迁移不同的场景对用户之间的朋友关系进行预测。通过对两个真实世界数据集的实验证明我们的方法始终优于现有的方法。此外,我们的模型对于具有少量签到数据和不具备碰面事件的关系也有效。

【技术实现步骤摘要】
基于时空关系学习的移动社交网络用户关系推断方法
本专利技术涉及一种基于时空关系学习的移动社交网络用户关系推断方法,利用用户的移动信息。
技术介绍
近些年来,随着Facebook、Twitter和微博这类移动社交网络应用的普及,用户可以及时地发布其正在访问的感兴趣地点(一家网红餐厅、一个旅游景点等)与好友共享。虽然这类社交方式给人们的交友带来了极大的方便,但存在泄露用户社交关系的风险。移动社交网络的用户也逐渐意识到这一点,例如,一项针对Facebook用户的大规模研究表明:Facebook用户隐藏好友列表的比例从2010年的17.2%上升到2011年的56.2%。但很少有用户知道利用具有时空关系的签到记录可以推断其朋友,从而准确地揭露用户之间隐藏的社交关系。现有的基于时空关系的社交关系推断方法主要分为两类:第一类是基于特征选择的启发式方法,通过观察选择碰面次数、共享位置数、共享位置流行程度等有效特征作为衡量用户之间是否具有朋友关系的衡量标准。但这些方法对所需的移动数据提出了很多假设和限制,这在很大程度上缩小了它们的适用范围。例如,几乎所有现有的有效方法都只能在两个个体共享位置的情况下使用。另一类方法是基于特征学习的方法,通过机器学习的方法将用户的移动特征向量化,利用向量之间的相似程度作为推断用户对是否具有朋友关系的标准。但该类方法针对个体建模且丢失移动数据中的时间信息,因此无法直接获得较为准确的关系推断。
技术实现思路
本专利技术的目的是提供一种能够利用用户移动信息准确推断用户社交关系的模型。为了达到上述目的,本专利技术的技术方案是提供了一种基于时空关系学习的移动社交网络用户关系推断方法,其特征在于,包括以下步骤:步骤1、提取用户对之间的交互行为特征,利用该特征推断两个用户之间是否具有朋友关系,包括以下步骤:步骤101、将移动数据所有用户签到涉及的兴趣点POIs按照经纬度划分到I×J的网格中,同时将时间划分为M个时间片段,构建一个I×J×M的时空矩阵STD,其中,时间维度上将时间分为长度τ的等长时间片,空间维度上将空间均匀地划分为大小相等的网格,递归地将每个网格划分为四个相等的网格,直到兴趣点POIs的数量在每个网格小于阈值σ;步骤102、将每个用户对(ua,ub)的轨迹均投影到时空矩阵STD中,用户的每一个签到都可以投影到一个特定的方格中,对于每个方格,计算:该时间段内用户ua访问过的兴趣点数na;用户ub访问过的兴趣点数nb;用户ua和用户ub共同访问过的兴趣点数na,b,由此获得用户对(ua,ub)的时空矩阵式中三元组表示第m时间段内用户ua和ub在第i行第j列的位置网格中移动信息的统计量;步骤103、将每对用户对(ua,ub)的时空矩阵O(a,b)编码成一个低维向量,并利用该低维向量计算用户ua和用户ub存在朋友关系的概率,获得初始的社交关系图G=(U,E),U是图中的顶点的集合,表示所有具有移动信息的用户;E是边的集合,表示两个用户之间具有朋友关系,其中,时空矩阵O(a,b)的大小通过参数σ和τ来调整;步骤2、为每个用户提取一个k可达的子图来描述用户之间的网络结构,对于给定的初始的社交关系图G=(U,E),定义提取用户对(ua,ub)的k-可达子图的步骤如下:步骤201、设置路径长度为2,将初始化为空图;步骤202、在初始的社交关系图G中找出(ua,ub)之间所有长度为2条的路径,并将找到的所有路径表示为然后删除社交关系图G中和中均出现的点和边删除,除了用户ua和用户ub本身;步骤203、逐步增加路径长度,重复步骤202,直到路径长度超过k;步骤3、根据初始的社交关系图G,对于每对用户对(ua,ub)的k-可达子图进行编码,基于累加的原则对相同长度路径的编码,对不同长度的路径的编码结果进行拼接,实现对用户对k-可达子图的向量化,获得用户对的综合特征向量;步骤4、利用分类器根据用户对的综合特征向量进行0/1分类,其中1是朋友,0为不是朋友,获得最新的预测社交图。步骤5、利用最新的社交图,更新用户对的结构特征,进而重新进行预测,直到预测结果不再发生变化,即获得最终预测的社交网络图。优选地,步骤103中,将时空矩阵O(a,b)输入一个具有R个隐藏层的自动编码器,该自动编码器将其编码成d维的向量,获得重构的时空矩阵使其与编码器的输入O(a,b)接近,该训练过程的优化目标为:式中,表示混合网络中自编码器网络的损失函数,即尽可能地使得解码后的重构时空矩阵与编码前的时空矩阵O(a,b)相同。;自动编码器采用有监督训练实现编码过程的重构和区别,即为自动编码器添加一个分类网络来监控其编码过程,该过程的损失函数为:式中,表示预测结果,即分类网络的输出结果;y表示样本标签;n表示训练样本的个数,即训练数据集中涉及到的用户对的个数。为了获取更具有识别力的向量表示,对整合混合网络作出以下约束:式中,表示整个混合网络的总体损失函数;一旦训练完成,编码器将从自动编码器网络中取出,用于对用户集中的任何一对用户时空关系矩阵进行编码和初步关系推断。本专利技术提供了一种新的社交关系推理模型,该模型同时考虑了个体之间的移动性和社交性。考虑社交网结构对社会联系预测的有效性,该模型首先基于用户的移动性构建一个初步的社交图,然后从初步构建的社交图中抽取用户对的社交网络结构特征,最后综合移动性和社交性两个方面的特征进行朋友关系推断。我们的模型一旦训练完成,可以较好地迁移不同的场景对用户之间的朋友关系进行预测。通过对两个真实世界数据集的实验证明我们的方法始终优于现有的方法。此外,我们的模型对于具有少量签到数据和不具备碰面事件的关系也有效。附图说明图1为用户移动关系映射朋友关系的示意图;图2为社交关系推断模型的系统结构图;图3为交互行为特征抽取过程示意图;图4为k-可达子图编码过程的示意图;图5(a)为Brightkite数据集中空间粒度大小对朋友关系推断准确性的影响结果图;图5(b)为Gawalla数据集中空间粒度大小对朋友关系推断准确性的影响结果图;图6(a)为Brightkite数据集中时间粒度对朋友关系推断准确性的影响结果图;图6(b)为Gawalla数据集中时间粒度对朋友关系推断准确性的影响结果图;图7(a)为Brightkite数据集中特征向量维度对朋友关系推断准确性的影响结果图;图7(b)为Gawalla数据集中特征向量维度对朋友关系推断准确性的影响结果图;图8(a)为Brightkite数据集中迭代次数对朋友关系推断准确性的影响结果图;图8(b)为Gawalla数据集中迭代次数对朋友关系推断准确性的影响结果图;图9(a)为Brightkite数据集中用户签到数对朋友关系推断准确性的影响结果图;图9(b)为Gawalla数据集中用户签到数对朋友关系推断准确性的本文档来自技高网...

【技术保护点】
1.一种基于时空关系学习的移动社交网络用户关系推断方法,其特征在于,包括以下步骤:/n步骤1、提取用户对之间的交互行为特征,利用该特征推断两个用户之间是否具有朋友关系,包括以下步骤:/n步骤101、将移动数据所有用户签到涉及的兴趣点POIs按照经纬度划分到I×J的网格中,同时将时间划分为M个时间片段,构建一个I×J×M的时空矩阵STD,其中,时间维度上将时间分为长度τ的等长时间片,空间维度上将空间均匀地划分为大小相等的网格,递归地将每个网格划分为四个相等的网格,直到兴趣点POIs的数量在每个网格小于阈值σ;/n步骤102、将每个用户对(u

【技术特征摘要】
1.一种基于时空关系学习的移动社交网络用户关系推断方法,其特征在于,包括以下步骤:
步骤1、提取用户对之间的交互行为特征,利用该特征推断两个用户之间是否具有朋友关系,包括以下步骤:
步骤101、将移动数据所有用户签到涉及的兴趣点POIs按照经纬度划分到I×J的网格中,同时将时间划分为M个时间片段,构建一个I×J×M的时空矩阵STD,其中,时间维度上将时间分为长度τ的等长时间片,空间维度上将空间均匀地划分为大小相等的网格,递归地将每个网格划分为四个相等的网格,直到兴趣点POIs的数量在每个网格小于阈值σ;
步骤102、将每个用户对(ua,ub)的轨迹均投影到时空矩阵STD中,用户的每一个签到都可以投影到一个特定的方格中,对于每个方格,计算:该时间段内用户ua访问过的兴趣点数na;用户ub访问过的兴趣点数nb;用户ua和用户ub共同访问过的兴趣点数na,b,由此获得用户对(ua,ub)的时空矩阵式中三元组表示第m时间段内用户ua和ub在第i行第j列的位置网格中移动信息的统计量;
步骤103、将每对用户对(ua,ub)的时空矩阵O(a,b)编码成一个低维向量,并利用该低维向量计算用户ua和用户ub存在朋友关系的概率,获得初始的社交关系图G=(U,E),U是图中的顶点的集合,表示所有具有移动信息的用户;E是边的集合,表示两个用户之间具有朋友关系,其中,时空矩阵O(a,b)的大小通过参数σ和τ来调整;
步骤2、为每个用户提取一个k可达的子图来描述用户之间的网络结构,对于给定的初始的社交关系图G=(U,E),定义提取用户对(ua,ub)的k-可达子图的步骤如下:
步骤201、设置路径长度为2,将初始化为空图;
步骤202、在初始的社交关系图G中找出(ua,ub)之间所有长度为2条的路径,并将找到的所有路径表示为然后删除社交关系图G中和中...

【专利技术属性】
技术研发人员:陶玉婷常姗朱弘恣王佳程杜坷坷
申请(专利权)人:东华大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1