System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于隐式反馈的协同过滤算法的优化策略制造技术_技高网
当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于隐式反馈的协同过滤算法的优化策略制造技术

技术编号:41330152 阅读:14 留言:0更新日期:2024-05-13 15:08
本发明专利技术公开了一种基于隐式反馈的协同过滤算法的优化策略,涉及协同过滤算法推荐领域,包括:基于用户的隐式反馈数据计算用户对交互商品的偏好值及商品热度;根据用户对交互商品的偏好值以及商品集合对每一个用户建立最近邻模型,预测该用户对部分未交互商品的偏好值,并将这部分未交互商品标注为该用户的交互商品;计算用户对所有商品有兴趣或无兴趣的置信度;采用改进ALS优化算法对用户和商品进行建模,获得用户‑商品模型;基于用户‑商品模型实现针对给定用户的商品推荐。本发明专利技术用于对隐式反馈数据进行一个高质量的分析,并提高基于隐式反馈数据的模型训练质量,同时有效缓解数据稀疏性带来的消极影响。

【技术实现步骤摘要】

本专利技术涉及协同过滤算法推荐,尤其涉及一种基于隐式反馈的协同过滤算法的优化策略


技术介绍

1、随着互联网的迅猛发展,电子商务已经成为现代商业中不可或缺的一部分。在电子商务领域,推荐系统在提高用户满意度、促进销售和增强平台竞争力方面扮演着关键角色。然而,传统推荐系统仍然面临着用户-商品交互矩阵高维且稀疏以及隐式反馈数据难以处理的问题。

2、针对隐式反馈数据的处理方面,现有的协同过滤算法(例如基于深度学习的神经协同过滤算法)往往是根据用户是否交互而划分正负例,而不会对潜在的假正例和假负例进行识别。这种做法在训练无噪声数据时的确可以取得很好的效果。但是,在实际环境中,用户的交互数据是存在大量的噪声的,例如,用户交互过的商品有可能只是误点、帮购或者是购买之后反馈不好;用户未交互过的商品也有可能只是没看到等等。这些潜在的假正例和假负例都无法被我们直接识别,其需要进一步的分析。

3、针对用户-商品交互矩阵数据稀疏性问题,现有的协同过滤算法(例如矩阵分解算法)可以通过将用户-商品交互矩阵转化为两个低秩矩阵的乘积来缓解数据稀疏性。然而,在模型训练过程中(例如als优化算法),由于矩阵中存在大量的空值,即使是矩阵分解算法也难以将其转化为两个准确的低维矩阵,因此需要对矩阵进行一个初步的优化。同时,als优化算法往往将空值默认为0值,且置信度均设置相同,表示用户对每一个未交互商品不感兴趣的可能性是相同的。而这显然是不合理的,因此关于als优化算法中用户对未交互商品不感兴趣的置信度还需要得到进一步的分析。


<p>技术实现思路

1、本专利技术的目的在于解决现有技术中的问题。

2、本专利技术解决其技术问题所采用的技术方案是:提供一种基于隐式反馈的协同过滤算法的优化策略,包括以下步骤:

3、基于用户的隐式反馈数据计算用户对交互商品的偏好值及商品热度,所述隐式反馈数据包括用户、商品、交互行为和交互时间;

4、根据用户对交互商品的偏好值以及商品集合对每一个用户建立最近邻模型,预测该用户对部分未交互商品的偏好值,并将这部分未交互商品标注为该用户的交互商品,其它未交互商品仍作为该用户的未交互商品;

5、计算用户对所有商品有兴趣或无兴趣的置信度,对于交互商品,基于用户对交互商品的偏好值计算置信度;对于用户的未交互商品,基于商品热度计算置信度;

6、采用改进als优化算法对用户和商品进行建模,获得用户-商品模型;所述改进als优化算法指对于用户对未交互商品的置信度采用根据商品热度计算的置信度,以及在训练过程中设置阈值判定损失过大的数据为假负例,降低假负例在训练中的权重;

7、基于用户-商品模型实现针对给定用户的商品推荐。

8、优选的,用户对交互商品的偏好值的计算过程包括以下步骤:

9、计算每一条隐式反馈数据所反映出来的用户对交互商品的局部偏好值,表示为:

10、;

11、;

12、其中,表示该条隐式反馈数据中的用户对商品的局部偏好值,表示用户对商品的交互行为的量化值;表示该条隐式反馈数据的时间权重,表示时间衰减系数,表示当前时间戳值,表示隐式反馈数据发生的时间戳值;

13、对于用户进行同一交互商品的局部偏好值聚合,得到用户对交互商品的偏好值,表示为:

14、;

15、其中,表示用于u对商品i的偏好值。

16、优选的,对于表示用户对商品的交互行为的量化值,取值规则为:对于浏览行为,;对于收藏行为,;对于加入购物车行为,;对于购买行为,。

17、优选的,对于计算出的用户对交互商品的偏好值,还通过设定偏好值阈值并结合隐式反馈数据来过滤假正例,所述假正例指用户对其产生过交互但实际并不感兴趣的商品;

18、所述偏好值阈值设定为:

19、;

20、其中,表示用户的偏好值阈值,表示用户对其所交互商品的偏好值的平均值,表示用户对其所交互商品的偏好值的标准差,表示范围系数;

21、所述隐式反馈数据还包括交互时长和交互频次;

22、过滤假正例的规则为:当用户对商品的交互行为浏览行为,且交互时长<10s、交互频次=1、偏好值<偏好值阈值时,则认为此条交互数据为假正例,其中交互时长指用户此条浏览行为的时间戳与下一条最近时间段的交互行为的时间戳的差值绝对值;当用户对商品的交互行为为购买行为,且用户对此商品不存在其他交互行为,则将用户对此商品的偏好值进行削弱,具体计算公式如下:

23、;

24、其中,表示用户购买的商品数量,表示用户不经过其他交互行为直接购买的商品数量。

25、优选的,商品热度表示为:

26、;

27、其中,表示商品的热度值,表示对商品存在交互行为的用户集合,表示所有用户的集合,表示用于u对商品i的偏好值。

28、优选的,对于计算出的用户对交互商品的偏好值,还通过计算商品热度来更新用户对商品的偏好值,具体为:

29、;

30、其中,表示商品的热度值,表示热度惩罚系数,表示用于u对商品i的偏好值。

31、优选的,所述根据用户对交互商品的偏好值以及商品集合对每一个用户建立最近邻模型,包括以下步骤:

32、基于用户对交互商品的偏好值以及商品集合计算用户间的相似度,表示为:

33、;

34、其中,表示用户和用户间的相似度,和分别表示用户和用户所交互的商品集合,表示用户和用户均产生过交互的商品集合的模,表示用户和用户均交互过的商品集合的模,和分别表示用户和用户对商品的偏好值,和分别表示用户和用户对所交互商品的偏好值的平均值;

35、对每一位用户,选择相似度最高的用户作为其最近邻用户;

36、基于最近邻用户计算每一位用户对部分未交互商品的偏好值,所述部分未交互商品指用户未交互过但该用户最近邻交互过的商品,表示为:

37、;

38、;

39、其中,表示用户对商品有兴趣或无兴趣的置信度,均为超参数,表示商品的商品热度,表示所有商品热度的平均值,和分别表示用户和用户对商品的偏好值,表示用户和用户间的相似度,和分别表示用户和用户的交互商品集合。

40、优选的,所述计算用户对所有商品有兴趣或无兴趣的置信度,包括以下步骤:

41、将用户对未交互商品的偏好值定义为0;

42、通过用户对商品的偏好值计算用户对商品的置信度,具体计算公式如下:

43、;

44、其中,表示用户对商品有兴趣或无兴趣的置信度,表示置信度系数,表示用户对商品的偏好值;表示超参数,表示超参数,表示商品的商品热度,表示所有商品热度的平均值。

45、优选的,所述采用改进als优化算法对用户和商品进行建模,包括以下步骤:

46、s1,随机初始化用户特征向量矩阵p和商品特征向本文档来自技高网...

【技术保护点】

1.一种基于隐式反馈的协同过滤算法的优化策略,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,用户对交互商品的偏好值的计算过程包括以下步骤:

3.根据权利要求2所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,对于表示用户对商品的交互行为的量化值,取值规则为:对于浏览行为,;对于收藏行为,;对于加入购物车行为,;对于购买行为,。

4.根据权利要求2所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,对于计算出的用户对交互商品的偏好值,还通过设定偏好值阈值并结合隐式反馈数据来过滤假正例,所述假正例指用户对其产生过交互但实际并不感兴趣的商品;

5.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,商品热度表示为:

6.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,对于计算出的用户对交互商品的偏好值,还通过计算商品热度来更新用户对商品的偏好值,具体为:

7.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,所述根据用户对交互商品的偏好值以及商品集合对每一个用户建立最近邻模型,包括以下步骤:

8.根据权利要求7所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,所述计算用户对所有商品有兴趣或无兴趣的置信度,包括以下步骤:

9.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,所述采用改进ALS优化算法对用户和商品进行建模,包括以下步骤:

10.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,所述基于用户-商品模型实现针对给定用户的商品推荐,具体为:

...

【技术特征摘要】

1.一种基于隐式反馈的协同过滤算法的优化策略,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,用户对交互商品的偏好值的计算过程包括以下步骤:

3.根据权利要求2所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,对于表示用户对商品的交互行为的量化值,取值规则为:对于浏览行为,;对于收藏行为,;对于加入购物车行为,;对于购买行为,。

4.根据权利要求2所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,对于计算出的用户对交互商品的偏好值,还通过设定偏好值阈值并结合隐式反馈数据来过滤假正例,所述假正例指用户对其产生过交互但实际并不感兴趣的商品;

5.根据权利要求1所述的基于隐式反馈的协同过滤算法的优化策略,其特征在于,商品热度表示为:

6.根据权...

【专利技术属性】
技术研发人员:吕晟王佳斌颜鹏贵邓凡林熙隆
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1