基于加权提取兴趣度的电子终端个性化推荐方法技术

技术编号:19099252 阅读:22 留言:0更新日期:2018-10-03 02:56
本发明专利技术公开了一种基于加权提取兴趣度的电子终端个性化推荐方法技术方案为:收集用户在访问系统过程中对物品产生的不同行为记录,由于它们反映出的用户对物品的兴趣程度是不同的。利用遗传算法对这几种用户行为在影响用户兴趣度上所占的权值进行优化,得到用户对电子终端产品产生的每种行为影响兴趣度的程度,对用户行为加权求和得到用户对电子终端产品的兴趣度。当系统采集到的用户行为数据较少时,采用基于用户加权行为兴趣提取与基于内容的推荐算法进行组合推荐,当用户行为数据积累到一定程度,则采用基于用户加权行为兴趣提取和协同过滤的推荐算法进行组合推荐,通过这种方式达到提高推荐质量的目的。

【技术实现步骤摘要】
基于加权提取兴趣度的电子终端个性化推荐方法
本专利技术涉及电子终端个性化推荐
,具体地指一种基于加权提取兴趣度的电子终端个性化推荐方法。
技术介绍
随着人们进入第四代移动通讯技术时代,以智能电子终端为代表的移动设备得到了充分的普及。日常生活中人们在选购智能电子终端时,也同样面临着信息过载的问题。想要挑选到一款合适的电子终端,人们会综合考虑多方面的因素,不仅仅是电子终端的外观、详细参数人们还会关注其他用户的评论信息等等。比如,人们在选购电子终端时,价格是很多人都会考虑的一个因素,然而,据中关村在线统计目前市面上在售的电子终端价格在1000元以下的有598款,价格在1000到2000之间的有316款,价格在2000到3000元之间的电子终端有136款,价格在3000元以上的有150款。在这么多选择的情况下,消费者想要挑选一款最适合自己的电子终端着实要耗费不少的时间。
技术实现思路
本专利技术的目的就是要提供一种基于加权提取兴趣度的电子终端个性化推荐方法,该方法基于遗传算法、基于内容的推荐算法和协同过滤算法,达到更精确的预测用户偏好、提高推荐质量的目的。为实现此目的,本专利技术所设计的基于加权提取兴趣度的电子终端个性化推荐方法,其特征在于,它包括如下步骤:步骤1:建立基于电子终端基础信息及功能介绍数据库的网页,在用户通过互联网浏览该网页时,收集用户在该网页中对电子终端产品产生的收藏、浏览、搜索和评分行为数据;步骤2:将用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣的程度设为待求参数,将这些行为数据的加权和与实际兴趣值的均方差作为遗传算法的适应度函数;步骤3:利用采用了所述的适应度函数的遗传算法来计算用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值;步骤4:将步骤3求出的权值以及对电子终端产品产生的收藏、浏览、搜索和评分行为数据,进行加权求和得到用户对所有产生过上述行为的电子终端产品的兴趣度;步骤5:统计收集到的所有用户对电子终端产品产生的行为记录的总量,然后按照如下公式计算稀疏性,判断用户对电子终端产品产生的行为矩阵的稀疏性是否达到设定稀疏性阈值;若未达到,执行步骤6~8;若达到,执行步骤9~11;Sparsity=1-(C/(U×I))其中,Sparsity表示稀疏性,C表示收集到的所有用户对电子终端产品产生的行为记录的总量,U表示对电子终端产品产生过行为的用户数,I表示有用户对其产生过行为的电子终端产品的总量;步骤6:提取电子终端产品的基础信息及功能介绍信息,并进行量化,得到用于描述电子终端产品的特征向量;步骤7:将步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度大于对应兴趣度阈值的电子终端产品,且属于用户在预设时间内产生行为的K个电子终端产品加入到描述用户兴趣模型的集合中,对用户兴趣模型集合中的电子终端产品的特征向量求均值,计算得到用户的兴趣描述模型;步骤8:计算用户兴趣描述模型与电子终端产品的特征向量的相似度,将用户未产生过行为且相似度最高的N个电子终端产品推荐给用户;步骤9:对每个用户建立一个产品列表,根据步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度,将该兴趣度大于对应兴趣度阈值的电子终端产品加入到该用户的产品列表中;步骤10:对每个用户,将他产品列表中的电子终端产品两两在共现矩阵中加1,然后将共现矩阵归一化得到电子终端产品之间的相似度;步骤11:将在步骤4得到的所有用户兴趣度分别与预设兴趣度阈值进行比较,将用户兴趣度大于预设兴趣度阈值所对应的电子终端产品定义为用户喜欢的电子终端产品,选取K个用户喜欢的电子终端产品,根据电子终端产品之间的相似度预测用户对与这K款电子终端产品相似的产品的兴趣度,推荐用户兴趣度预测值最高的N款电子终端产品(即给用户推荐与他过去喜欢的物品相似的物品)。总体而言,本专利技术与现有技术相比,具有以下有益效果:通过利用遗传算法对用户行为的学习,得到用户几种行为影响用户兴趣度的程度,能够更精确的得到用户对物品的兴趣度,知道了用户对哪些电子终端产品具有更高的兴趣度才能够更精确的给用户推荐与他喜欢的电子终端产品相似的物品,提高了推荐的质量。协同过滤算法既有适用范围广、推荐结果新颖性高等优点也存在冷启动和稀疏性等问题,而基于内容的推荐算法则正好与其互补,不存在冷启动问题但是存在内容提取的问题,使其适用范围受限,故将两种推荐算法综合运用,如果仅采用协同过滤,则前期由于收集到的用户行为记录较少,会存在冷启动和数据稀疏问题,使用基于内容的推荐算法则不会有。但是,由于基于内容的推荐算法也有一定的不足,由于目前特征提取的技术并不完全成熟,我们通过分析产品的属性来量化得到产品特征描述模型这一过程比较复杂。而协同过滤利用集体智慧的思想,根据所有用户对电子终端产品产生的行为来确定物品之间的相似性,这一计算过程简单方便。故本方法可以使协同过滤算法和基于内容的推荐算法优势互补,同时利用遗传算法来学习用户行为,得到用户几种行为影响用户兴趣度的程度,能够更精确的得到用户对物品的兴趣度,便于更准确的得到用户偏好模型,做出个性化的推荐,与传统协同过滤算法相比,能有效缓解冷启动以及数据稀疏带来的问题,实现推荐质量的提高。附图说明图1为本专利技术的流程图;具体实施方式以下结合附图和具体实施例对本专利技术作进一步的详细说明:本专利技术所设计的一种基于加权提取兴趣度的电子终端个性化推荐方法,如图1所示,它包括如下步骤:步骤1:建立基于电子终端(手机、电脑等)基础信息及功能介绍数据库的网页,在用户通过互联网浏览该网页时,收集用户在该网页中对电子终端产品产生的收藏、浏览、搜索和评分行为数据;步骤2:将用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣的程度设为待求参数,将这些行为数据的加权和与实际兴趣值的均方差(RMSE)作为遗传算法的适应度函数;步骤3:利用采用了所述的适应度函数的遗传算法来计算用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值;步骤4:将步骤3求出的权值以及对电子终端产品产生的收藏、浏览、搜索和评分行为数据,进行加权求和得到用户对所有产生过上述行为的电子终端产品的兴趣度;步骤5:统计收集到的所有用户对电子终端产品产生的行为记录的总量,然后按照如下公式计算稀疏性,判断用户对电子终端产品产生的行为矩阵的稀疏性是否达到设定稀疏性阈值(在程序中通过if语句判断,如if(Sparsity<=0.9),则根据判断结果执行下一操作);若未达到,执行步骤6~8;若达到,执行步骤9~11;Sparsity=1-(C/(U×I))其中,Sparsity表示稀疏性,C表示收集到的所有用户对电子终端产品产生的行为记录的总量,U表示对电子终端产品产生过行为的用户数,I表示有用户对其产生过行为的电子终端产品的总量;步骤6:提取电子终端产品的基础信息及功能介绍信息,并进行量化,得到用于描述电子终端产品的特征向量;步骤7:将步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度大于对应兴趣度阈值的电子终端产品,且属于用户在预设时间(如当前时间至12个小时之前)内产生行为的K个电子终端产品加入到描述用户兴趣模型的集合中,对用户兴趣模型集合本文档来自技高网...

【技术保护点】
1.一种基于加权提取兴趣度的电子终端个性化推荐方法,其特征在于,它包括如下步骤:步骤1:建立基于电子终端基础信息及功能介绍数据库的网页,在用户通过互联网浏览该网页时,收集用户在该网页中对电子终端产品产生的收藏、浏览、搜索和评分行为数据;步骤2:将用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣的程度设为待求参数,将这些行为数据的加权和与实际兴趣值的均方差作为遗传算法的适应度函数;步骤3:利用采用了所述的适应度函数的遗传算法来计算用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值;步骤4:将步骤3求出的权值以及对电子终端产品产生的收藏、浏览、搜索和评分行为数据,进行加权求和得到用户对所有产生过上述行为的电子终端产品的兴趣度;步骤5:统计收集到的所有用户对电子终端产品产生的行为记录的总量,然后按照如下公式计算稀疏性,判断用户对电子终端产品产生的行为矩阵的稀疏性是否达到设定稀疏性阈值;若未达到,执行步骤6~8;若达到,执行步骤9~11;Sparsity=1‑(C/(U×I))其中,Sparsity表示稀疏性,C表示收集到的所有用户对电子终端产品产生的行为记录的总量,U表示对电子终端产品产生过行为的用户数,I表示有用户对其产生过行为的电子终端产品的总量;步骤6:提取电子终端产品的基础信息及功能介绍信息,并进行量化,得到用于描述电子终端产品的特征向量;步骤7:将步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度大于对应兴趣度阈值的电子终端产品,且属于用户在预设时间内产生行为的K个电子终端产品加入到描述用户兴趣模型的集合中,对用户兴趣模型集合中的电子终端产品的特征向量求均值,计算得到用户的兴趣描述模型;步骤8:计算用户兴趣描述模型与电子终端产品的特征向量的相似度,将用户未产生过行为且相似度最高的N个电子终端产品推荐给用户;步骤9:对每个用户建立一个产品列表,根据步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度,将该兴趣度大于对应兴趣度阈值的电子终端产品加入到该用户的产品列表中;步骤10:对每个用户,将他产品列表中的电子终端产品两两在共现矩阵中加1,然后将共现矩阵归一化得到电子终端产品之间的相似度;步骤11:将在步骤4得到的所有用户兴趣度分别与预设兴趣度阈值进行比较,将用户兴趣度大于预设兴趣度阈值所对应的电子终端产品定义为用户喜欢的电子终端产品,选取K个用户喜欢的电子终端产品,根据电子终端产品之间的相似度预测用户对与这K款电子终端产品相似的产品的兴趣度,推荐用户兴趣度预测值最高的N款电子终端产品。...

【技术特征摘要】
1.一种基于加权提取兴趣度的电子终端个性化推荐方法,其特征在于,它包括如下步骤:步骤1:建立基于电子终端基础信息及功能介绍数据库的网页,在用户通过互联网浏览该网页时,收集用户在该网页中对电子终端产品产生的收藏、浏览、搜索和评分行为数据;步骤2:将用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣的程度设为待求参数,将这些行为数据的加权和与实际兴趣值的均方差作为遗传算法的适应度函数;步骤3:利用采用了所述的适应度函数的遗传算法来计算用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值;步骤4:将步骤3求出的权值以及对电子终端产品产生的收藏、浏览、搜索和评分行为数据,进行加权求和得到用户对所有产生过上述行为的电子终端产品的兴趣度;步骤5:统计收集到的所有用户对电子终端产品产生的行为记录的总量,然后按照如下公式计算稀疏性,判断用户对电子终端产品产生的行为矩阵的稀疏性是否达到设定稀疏性阈值;若未达到,执行步骤6~8;若达到,执行步骤9~11;Sparsity=1-(C/(U×I))其中,Sparsity表示稀疏性,C表示收集到的所有用户对电子终端产品产生的行为记录的总量,U表示对电子终端产品产生过行为的用户数,I表示有用户对其产生过行为的电子终端产品的总量;步骤6:提取电子终端产品的基础信息及功能介绍信息,并进行量化,得到用于描述电子终端产品的特征向量;步骤7:将步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度大于对应兴趣度阈值的电子终端产品,且属于用户在预设时间内产生行为的K个电子终端产品加入到描述用户兴趣模型的集合中,对用户兴趣模型集合中的电子终端产品的特征向量求均值,计算得到用户的兴趣描述模型;步骤8:计算用户兴趣描述模型与电子终端产品的特征向量的相似度,将用户未产生过行为且相似度最高的N个电子终端产品推荐给用户;步骤9:对每个用户建立一个产品列表,根据步骤4计算的用户对所有产生过上述行为的电子终端产品的兴趣度,将该兴趣度大于对应兴趣度阈值的电子终端产品加入到该用户的产品列表中;步骤10:对每个用户,将他产品列表中的电子终端产品两两在共现矩阵中加1,然后将共现矩阵归一化得到电子终端产品之间的相似度;步骤11:将在步骤4得到的所有用户兴趣度分别与预设兴趣度阈值进行比较,将用户兴趣度大于预设兴趣度阈值所对应的电子终端产品定义为用户喜欢的电子终端产品,选取K个用户喜欢的电子终端产品,根据电子终端产品之间的相似度预测用户对与这K款电子终端产品相似的产品的兴趣度,推荐用户兴趣度预测值最高的N款电子终端产品。2.根据权利要求1所述的基于加权提取兴趣度的电子终端个性化推荐方法,其特征在于:所述步骤3中,利用采用了所述的适应度函数的遗传算法来计算用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值的具体方法为:设用户对电子终端产品产生的收藏、浏览、搜索和评分行为影响用户兴趣度的权值分别为:x(1)、x(2)、x(3)、x(4),则它们需满足约束条件x(1)+x(2)+x(3)+x(4)=1,兴趣度观测值Xobs,i等于用户对某一电子终端产品产生的收藏、浏览、搜索和评分行为与这些收藏、浏览、搜索和评分行为所占兴趣度权值的加权和,Xmodel,i表示用户对该电子终端产品实际的兴趣度,RMSE是一种广泛使...

【专利技术属性】
技术研发人员:阮幼林刘雨
申请(专利权)人:武汉理工大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1