一种基于张量分解和全貌表示的跨电商书城用户对齐方法技术

技术编号:37156234 阅读:28 留言:0更新日期:2023-04-06 22:17
本发明专利技术属于网络对齐领域,具体涉及一种基于张量分解和全貌表示的跨电商书城用户对齐方法,包括:提取电商书城平台用户的基本属性信息和用户行为数据信息;采用“用户

【技术实现步骤摘要】
一种基于张量分解和全貌表示的跨电商书城用户对齐方法


[0001]本专利技术属于网络对齐
,具体涉及一种基于张量分解和全貌表示的跨电商书城用户对齐方法。

技术介绍

[0002]近年来,伴随着互联网技术的蓬勃发展以及大数据时代的来临,各种类型的社交网络以及电商平台应运而生,人们为了满足不同的需求会在多个社交网络及电商平台上注册自己的账号。异质网络用户对齐技术旨在对分布在不同平台的用户进行识别匹配。在商业领域,用户对齐技术为跨平台推荐和信息传播等方面提供了便利;在国家安全层面,用户对齐技术为匿名用户发现、舆情分析等重要任务扫清了障碍。因此,异构网络对齐研究受到国内外学者的广泛关注。
[0003]国内外研究者对用户对齐技术进行了大量的研究工作。现有的用户对齐方法总体上可以划分为两大类:基于用户属性和结构的对齐方法和基于机器学习和深度学习的对齐方法。基于用户属性和结构的方法利用用户在社交平台上公开的属性信息和社交网络的拓扑结构来衡量用户之间的相似度;基于机器学习和深度学习的方法通过特征工程人工提取用户特征,在标记数据的基础上训练分类模型,然本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于张量分解和全貌表示的跨电商书城用户对齐方法,其特征在于,包括:S1:提取电商书城平台用户的基本属性信息和用户行为数据信息;S2:采用“用户

行为

图书”张量分解模型对用户行为数据信息进行同态补偿,得到补偿后的用户行为数据;S3:采用UBN2vec全貌表示模型对补偿后的电商书城用户数据进行处理,得到包含丰富的属性信息、行为偏好信息以及用户邻域信息的用户节点嵌入表示矢量;S4:使用用户兴趣群组分块索引模型对电商书城用户进行兴趣群组划分,将兴趣偏好不同的用户划分到不同的兴趣群组中;S5:计算同一兴趣群组中用户节点嵌入表示矢量间的相似度,选取另一平台中相似度最高的用户作为待匹配用户的对齐用户。2.根据权利要求1所述的一种基于张量分解和全貌表示的跨电商书城用户对齐方法,其特征在于,构建“用户

行为

图书”张量分解模型的过程,包括:S21:获取用户历史行为信息,构建维度为“用户

行为

图书”的待补全张量M∈R
I
×
J
×
K
,其中,R
I
×
J
×
K
表示三阶张量,I、J、K分别表示张量R的三个维度;S22:对待补全张量M通过张量分解,并根据可观测索引集Ω中观测到的部分用户行为信息恢复出完整的低秩张量Y∈R
I
×
J
×
K
;该过程表示为:受制于Y
Ω
=M
Ω
其中,‖Y‖
*
表示低秩张量Y的迹范数,Y
Ω
表示张量Y中可观测索引集Ω对应位置的元素,M
Ω
表示张量M中可观测索引集Ω对应位置的元素。S23:将张量分解模型的张量迹范数‖Y‖
*
转换为张量Y沿n个模式展开的所有矩阵y
(i)
的迹范数的凸组合,得到凸优化模型;该模型表示为:受制于Y
Ω
=M
Ω
其中,ω
i
表示矩阵迹范数的组合系数,y
(i)
表示低秩张量Y沿n个模式展开的矩阵,||y
(i)
||
*
表示矩阵y
(i)
的迹范数,Y
Ω
表示张量Y中可观测索引集Ω对应位置的元素,M
Ω
表示张量M中可观测索引集Ω对应位置的元素。S24:采用高精度低秩张量补全算法求解凸优化模型,在算法运行过程中引入n个辅助变量得到等价凸优化模型;该模型表示为:其中,A
i(i)
是辅助张量A
i
沿n个模式展开的矩阵,||A
i(i)
||
*
是矩阵A
i(i)
的迹范数,Y
Ω
表示张量Y中可观测索引集Ω对应位置的元素,M
Ω
表示张量M中可观测索引集Ω对应位置的元素,Y表示低秩张量,ω
i
表示矩阵迹范数的组合系数。S25:将增广拉格朗日函数融入等价凸优化模型,得到“用户

行为

图书”张量分解模
型;该模型表示为:其中,Y表示低秩张量,表示拉格朗日乘子张量集合,λ是惩罚因子,A为辅助张量,A
i(i)
是辅助张量A
i
沿n个模式展开的矩阵,||A
i(i)
||
*
是矩阵A
i(i)
的迹范数,<Y

A
i
,W
i
>表示张量Y

A
i
和拉格朗日乘子张量W
i
的内积,表示引入的每个中间变量与用户行为完整张量差值的F范数的平方值。3.根据权利要求1所述的一种基于张量分解和全貌表示的跨电商书城用户对齐方法,其特征在于,采用“用户

行为

图书”张量分解模型对稀疏的用户行为数据进行同态补偿,包括:其中,Y
k+1
表示第k+1次迭代时低秩张量Y的值,即同态补偿后的用户行为数据,argminL(.)表示目标函数取得最小值时的变量值,A
k+1
表示第k+1次迭代时辅助张量A的值,表示第k+1次迭代时拉格朗日乘子张量W
i
的值,λ表示惩罚因子。4.根据权利要求1所述的一种基于张量分解和全貌表示的跨电商书城用户对齐方法,其特征在于,UBN2vec全貌表示模型包括:用户邻域嵌入模块、用户行为嵌入模块、用户属性嵌入模块;根据电商书城用户实际行为记录构建异质电商书城网络,使用deepwalk模型学习异质电商书城网络的网络拓扑结构,忽略异质电商书城网络的节点属性信息和用户行为类型,将异质电商书城网络简化为单一边类型的同质网络,得到用户邻域嵌入模块;根据异质电商书城网络中不同的边类型,将原始电商书城网络分离为若干只包含某种特定边类型的子网络,得到用户行为嵌入模块;根据异质电商书城网络融入属性编码和属性特征转换,得到用户属性嵌入模块,融合用户邻域嵌入模块、用户行为嵌入模块、用户属性嵌入模块,得到UBN2vec全貌表示模型。5.根据权利要求1所述的一种基于张量分解和全貌表示的跨电商书城用户对齐方法,其特征在于,采用UBN2vec全貌表示模型对补偿后的电商书城用户数据进行处理,包括:S31:随机选择电商书城网络中一个用户节点或图书节点作为起始节点v
i
,从节点v
i
出发生成m条最大长度为k的截断随机游走序列W
(i)
;S32:采取word2vec中的skip

gram模型的策略,根据每条随机游走序列中的中心节点v
m
的嵌入表示预测周围节点v
j
的嵌入表示,建立节点预测的似然概率函数和映射函数;节点预测的似然概率函数:
映射函数:E:v∈V

X
|V|
×
d
其中,E表示映射函数,即书城平台中所有节点的矢量表示矩阵X
|V|
×
d

【专利技术属性】
技术研发人员:段思睿龙雨洵肖云鹏庞育才王蓉余翔李暾
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1