一种对在线社交网络中账户进行关联的方法技术

技术编号:13306630 阅读:96 留言:0更新日期:2016-07-10 01:53
本发明专利技术公开了一种基于节点相似度的对多个在线社交网络(OSN)中账户进行关联的方法,从OSN网站账户中提取好友关系来关联不同OSN平台上属于同一实体用户的多个账户。该专利五个部分:数据预处理部分对OSN的账户节点关系图进行预处理;节点序列提取部分通过随机游走获得账户节点序列集合;账户向量表示部分通过词转向量工具word2vec生成每个账户的向量模型;计算线性变换矩阵部分通过梯度下降法求得从一个OSN到另一个OSN的线性变换矩阵W;获取关联账户部分将其中一个OSN中的账户映射到另一OSN的坐标空间,通过相似度度量和阈值筛选,得到所有账户对应的关联账户或者对应的候选集。本发明专利技术避免了因账户不真实的特征信息对账户关联结果带来的误差,故而提高了账户关联的健壮性。

【技术实现步骤摘要】

本专利技术属于网络信息
,更为具体地讲,涉及一种对在线社交网络中账户进行关联的方法
技术介绍
账户关联是用来挖掘一个用户在各种在线社交网络中的所有可能账户信息的主要技术手段,可用于追踪进行网络犯罪的恶意用户以阻止恶意事件蔓延、深度挖掘账户信息以优化推荐方法,检测到账户信息被盗后进行危险预警以保护其他网站的账户安全。传统账户关联方法提取的特征包括账户本身的个人信息如性别、年龄、地理位置,以及用户行为规律如文本写作风格、检索词使用习惯、鼠标停留时间等。然而由于涉及个人隐私,个人信息往往不真实全面;用户行为规律的数据也大多不易获取,且存在误差,故而传统账户关联方法的准确性不高。此外,传统账户关联方法需要账户的信息基本真实,其思路是穷尽账户本身具有的重要特征属性来尽可能全面地表达一个用户,通过特征提取概括建模,而后按模型过滤掉不相关的候选项账户,从而找到一个相似度最高的账户作为关联账户。尽管传统账户关联方法完成了账户关联的任务,但传统账户关联方法所需的数据输<br>入信息较多,且本文档来自技高网...

【技术保护点】
一种对在线社交网络中账户进行关联的方法,其特征在于,包括以下步骤:(1)、根据需求确定需要进行账户关联的两个在线社交网络,将两个在线社交网络OSN_X、OSN_Y中各自的账户间存在的好友关系表示为由代表账户的节点集V和代表账户间好友关系的边集E组成的无向图即账户节点关系图,得到两个在线社交网络OSN_X、OSN_Y各自的账户节点关系图RD_X、RD_Y;(2)、分别对两个账户节点关系图RD_X、RD_Y中所有节点进行遍历,得到在线社交网络OSN_X、OSN_Y各自的账户节点序列集WalkList_X、WalkList_Y;对于在线社交网络OSN_X,遍历账户节点关系图RD_X中的所有节点,依次...

【技术特征摘要】
1.一种对在线社交网络中账户进行关联的方法,其特征在于,包括以下步骤:
(1)、根据需求确定需要进行账户关联的两个在线社交网络,将两个在线社交网络OSN_
X、OSN_Y中各自的账户间存在的好友关系表示为由代表账户的节点集V和代表账户间好友
关系的边集E组成的无向图即账户节点关系图,得到两个在线社交网络OSN_X、OSN_Y各自的
账户节点关系图RD_X、RD_Y;
(2)、分别对两个账户节点关系图RD_X、RD_Y中所有节点进行遍历,得到在线社交网络
OSN_X、OSN_Y各自的账户节点序列集WalkList_X、WalkList_Y;
对于在线社交网络OSN_X,遍历账户节点关系图RD_X中的所有节点,依次选择一个节点
作为开始节点进行随机游走,游走时从开始节点或到达节点的邻居节点中,随机选择一个
邻居节点作为下一跳,直到走过的节点形成一个长度L的节点序列;每次遍历结束可得到以
不同节点作为起点的节点序列集,多趟循环遍历账户节点关系图RD_X中的所有节点,得到
账户节点序列集WalkList_X,这样,以某个节点开始的节点序列就有多条;
对于在线社交网络OSN_Y,采用相同的方法进行处理,得到账户节点序列集WalkList_
X、WalkList_Y;
(3)、将两个账户节点序列集WalkList_X、WalkList_Y分别采用词转向量工具Word2Vec
进行转换,分别得到账户在S维空间(S一般取值范围在几十到几百之间)的分布式表示的账
户向量模型Model_X、Model_Y,具体为:
将OSN_X对应的账户节点序列集WalkList_X中的所有节点序列作为语料输入词转向量
工具Word2Vec中,按照设置的窗口(window)以及维度(size)进行转换,得到各个账户xi对
应的向量Vec_xi,账户xi及对应的向量Vec_xi作为项所构成在线社交网络OSN_X的账户向量
模型Model_X,其中,xi表示在线社交网络OSN_X的第i个账户,i=1,2,...,m,m为在线社交
网络OSN_X的账户数;
对账户节点序列集WalkList_Y做同样处理,得到在线社交网络OSN_Y中各账户yj及对应
的向量Vec_yj作为项所构成在线社交网络OSN_Y的账户向量模型Model_Y,其中yj表示在线
社交网络OSN_Y的第j个账户,j=1,2,...,n,n为在线社交网络OSN_Y的账户数;
(4)、计算两个在线社交网络OSN_X、OSN_Y对应的坐标空间之间的线性变换矩阵W
4.1)、用已知的两个在线社交网络OSN_X、OSN_Y中为同一用户的真实账户关联对<xk,yk>构建训练集RealPairL,其中,xk表示第k个同一用户...

【专利技术属性】
技术研发人员:罗绪成周帆刘梦娟解书颖
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1