当前位置: 首页 > 专利查询>南京大学专利>正文

一种融合用户兴趣时序波动的个性化推荐方法及系统技术方案

技术编号:29926281 阅读:23 留言:0更新日期:2021-09-04 18:47
一种融合用户兴趣时序波动的个性化推荐方法及系统,该方法包括采集用户与商品的交互数据,融合时序波动变化,对用户兴趣时序波动进行识别分类,得到小幅和大幅兴趣两种波动序列,分别使用小幅兴趣波动序列以及大幅兴趣波动序列有针对性地对用户不同时段的兴趣波动变化建模进行预测,并根据预测结果完成对用户的个性化推荐。本发明专利技术通过研究抽取不同幅度的用户兴趣波动特征,更好地挖掘和刻画用户兴趣波动变化,实现动态精准的个性化服务,很好地提高预测准确性和可解释性。提高预测准确性和可解释性。提高预测准确性和可解释性。

【技术实现步骤摘要】
一种融合用户兴趣时序波动的个性化推荐方法及系统


[0001]本专利技术属于多媒体信息处理领域,具体涉及一种融合用户兴趣时序波动的个性化推荐方法及系统。

技术介绍

[0002]大数据环境下,云计算、数据挖掘技术日益兴起,以微博、微信为代表的新型程序应用逐渐主导现代社交网络平台。在线数据资源发生急剧膨胀,呈现出结构复杂化、形式多样化等特征。同时,随着用户与各类信息平台间的交互场景愈发常见和频繁,大量交互反馈的用户行为信息不断涌现出来,为采集多源的用户兴趣特征数据提供很大空间,如浏览记录、购买记录和操作信息等网络行为日志信息。通过利用属性特征、历史行为等信息不断挖掘用户真实兴趣偏好,可为用户匹配推荐符合用户需求的信息或服务。
[0003]目前,在推荐系统研究领域中,个性化推荐系统受到广泛关注。用户兴趣和偏好挖掘的核心是获取和维护与用户兴趣、需求和习惯相关知识的过程,也是开展个性化服务推荐的关键所在。以用户为中心,根据用户的个性化需求开展具有针对性和主动性的信息服务,是提高信息服务质量和信息资源利用效率的重要手段。按推荐方法的不同,可分为协同过本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合用户兴趣时序波动的个性化推荐方法,其特征在于,所述个性化推荐方法包括以下步骤:步骤1:采集用户对需进行个性化推荐的商品的交互信息,交互信息具体包括用户信息、商品名称、用户评分、商品类型与时间戳;步骤2:对步骤1采集的数据即交互信息进行预处理,得到时间序列数据;步骤3:将步骤2所得到的时间序列数据根据用户兴趣波动幅度分成小幅兴趣波动序列X以及大幅兴趣波动序列Y;如果所述时间序列数据属于小幅兴趣波动序列X进入步骤4,如果属于大幅兴趣波动序列Y则进入步骤5;步骤4:使用步骤3所得的小幅兴趣波动序列X作为数据源,构建小幅兴趣神经网络框架进行预测后进入步骤6;步骤5:使用步骤3所得的大幅兴趣波动序列Y作为数据源,构建大幅兴趣神经网络框架进行预测后进入步骤6;步骤6:根据步骤4或步骤5的预测结果对商品进行推荐。2.根据权利要求1所述的个性化推荐方法,其特征在于:所述步骤2包括以下内容:步骤201:将步骤1所采集的交互信息按照时间由远及近的顺序进行排列得到时序化数据集;步骤202:将步骤201所得到的时序化数据集根据商品类型划分出复合类别;复合类别由多个初始类别元素组成,初始类别元素指对商品类型中子类型的定义;步骤203:使用步骤202所得的复合类别构建基于类别的时间序列数据。3.根据权利要求2所述的个性化推荐方法,其特征在于:在所述步骤202中,每种复合类别至少包含5个初始类别元素;对于不满足数量要求的复合类别,将其与另外复合类别合并,合并规则为优先将两者包含相同初始类别元素最多的复合类别合并;所述复合类别由多个初始类别元素组成,初始类别元素指对商品类型中子类型的定义。4.根据权利要求3所述的个性化推荐方法,其特征在于:在所述步骤203中,将不同用户的N个复合类别中的数据划分成序列数据x1,x2…
x
N
,其中x
N
表示复合类别的时序数据样本,继而把每个时序数据样本分为k个时间序列数据,分段后的时间序列数据为即为t时刻的样本时序向量;k表示时间序列数据中样本点数量,N为用户复合类别的总数。5.根据权利要求4所述的个性化推荐方法,其特征在于:所述步骤3包括以下内容:步骤301:设置兴趣波动序列阈值α;步骤302:计算时间序列数据方差的总差和的绝对值S;
其中,N
t
的含义为第t个时间片段内样本个数,N
t+1
的含义为第t+1个时间片段内样本个数,表示中所有数据的平均值,表示t时刻的样本时序向量,表示中所有数据的平均值,为t+1时刻的样本时序向量;步骤303:根据步骤301中的兴趣波动序列阈值α以及步骤302计算得到的S对用户兴趣波动幅度进行分类,得到小幅兴趣波动序列X以及大幅兴趣波动序列Y:6.根据权利要求5所述的个性化推荐方法,其特征在于:所述兴趣波动序列阈值α的取值区间为(0.05,0.2]。7.根据权利要求6所述的个性化推荐方法,其特征在于:所述步骤4包括以下内容:步骤401:构建以下目标训练预测函数:其中,Θ表示待定特征系数向量,取值范围为[Θ0,Θ1],Θ0为偏移量,Θ1为变量系数,Θ0和Θ1为需要求取的未知量,X
(t)
表示t时刻小幅兴趣波动序列,表示预测值序列;步骤402:利用步骤401的目标训练预测函数计算最优用户特征系数,得到最优用户特征系数集合;步骤403:利用步骤402所得到的最优用户特征系数集合,预测用户U对包含G初始类别元素的复合类别商品的评分。8.根据权利要求7所述的个性化推荐方法,其特征在于:所述步骤402包括以下内容:步骤402.1:基于步骤401得到的目标训练预测函数,按照下式构建目标函数步骤402.1:基于步骤401得到的目标训练预测函数,按照下式构建目标函数其中,λ为正则化参数;k表示时间序列数据中样本点数量;n表示最优用户特征系数的特征数量;y
(t)
是X
(t)
中t时刻下的数值;w
(t)
表示t时刻的时间衰减因子,σ
e
表示第e个正则项;w
(t)
由时间权重因子δ表示,即:w
(t)
~δ
k

t
其中,δ
k

t
表示时间权重因子δ的k

t次方,δ是一组范围在[0,1]的常数。步骤402.2:对目标函数公式求导:
其中,表示X
(t)
对Θ的偏导,λ
Θ
表示λ对Θ的偏导,Θ
T
的含义是Θ的转置向量,表示对待定特征系数向量Θ求导,σ
ll
表示第ll个正则系数;步骤402.3:通过步骤402.2的求导得到以下梯度公式,对所有样本点每一次迭代沿梯度的反方向更新参数,直至收敛,训练特征系数使得误差和最小:其中,γ为控制学习速率的学习因子,σ
i
表示第i个求导后的正则系数;步骤402.4:训练最优用户特征系数;选择每种类别下误差和小于阈值的h 组用户特征系数进行训练,其中误差和的阈值取对应类型的所有误差总和均值,即:其中,M表示每种类别下误差和小于阈值的h组用户特征系数集合,n
g
的含义是类别g的样本总数,Θ
h
表示每种类别下误差和小于阈值的h组待定特征系数向量,Θ
gj
表示类别g中第gj个待定特征系数向量,表示对于类别g中第gj个样本的预测值序列,表示对于第h个样本的预测值序列。9.根据权利要求8所述的个性化推荐方法,其特征在于:在所述步骤403中,根据用户U在o时刻评分,预测下次在o+1时刻的评分,则o+1时刻用户U对包含G初始类别元素的复合类别项目的评分预测为:其中,Θ(t)表示符合条件的兴趣特征系数,表示满足M集合中第q组待定特征系数向量对应的o时刻的小幅兴趣波动序列,h表示每种类别下误差和小于阈值的用户特征系数集合数量,Θ
i
表示第i个待定特征系数向量,n
G
表示包含G初始类别元素的复合类别总数量,表示包含G初始类别元素的复合类别中的小幅兴趣波动序列。10.根据权利要求9所述的个性化推荐方法,其特征在于:所述步骤5包括以下内容:步骤501:构造聚类目标函数J(β,D,μ,d),迭代直至相邻两次迭代中目标函数J(β,D,μ,d)改进小于目标函数阈值,则进入步骤502;
步骤502:构造时序特征数据集;其中T
l
表示时序特征数据集,z
q
表示...

【专利技术属性】
技术研发人员:胡广伟丁浩
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1