一种推荐系统减少重复推荐的方法技术方案

技术编号:18116277 阅读:38 留言:0更新日期:2018-06-03 08:50
本发明专利技术公开了一种推荐系统减少重复推荐的方法,所述方法包括典型用户类行为特征库、购后典型用户类特征库和需求发现跟踪法。该方法考虑引入时间情境,考虑行为时效性和信息热度影响;首先利用问卷法和特征聚类法对用户聚类,发掘典型用户特征库;然后通过URL差异比较法和特征关键词法标定用户行为,分析计算得到可量化的用户访问路径复杂度、页面驻留时长和访问精度等高可辨识特征;最后利用时间情境分割法将购物行程分为购物前和购物后,并利用需求判别法判断两个购物行程需求状态,从而实现智能推荐减少系统重复推荐目的。本发明专利技术通过引入时间情境分割购物行程实现用户需求状态的发现跟踪,有效的提高了重复推荐发生概率,取得了良好的用户体验,并节省了系统开销。

【技术实现步骤摘要】
一种推荐系统减少重复推荐的方法
本专利技术属于信息抽取与数据分析领域。具体来讲,涉及一种推送系统中减少重复推荐的方法。
技术介绍
随着电子商务规模不断扩大,导致信息过载问题的出现,在此背景下推荐系统随之产生并被逐渐应用。目前,对于推荐没有公认的分类标准,一种常用分类为:基于内容推荐、协同过滤推荐、混合推荐和流行度推荐。研究发现,以上相关推荐方法在用户网购整个过程中均有应用。首先,用户通过购物门户网站浏览或搜索信息,系统获取并提取用户行为信息;继而输入推荐运算模块进行一系列运算,最后获得用户当下推荐信息。计算中,多侧重于发现相似用户或相似项目信息,利用统计知识和群智思想形成最后推荐。从上述分析可知,目前推荐技术缺乏对用户需求状态的跟踪,利用的是“尽可能多推”的策略,“盲目”进行多次重复推荐,从而来刺激用户消费。长此以往,会导致用户的流失,并对用户形成骚扰,这是一种短见的策略。因此,如何减少盲目重复形成智能有效推荐,是推荐中的一个十分重要且亟待解决的问题,为此本专利技术提出一种推荐系统减少重复推荐的方法。
技术实现思路
本专利技术的目的旨在于提供一种推荐系统减少重复推荐的方法,从而提升推荐系统的推荐质量,增加用户QoS和EOS,提高网站转化率。为了解决
技术介绍
中的问题,本专利技术提供了一种系统减少重复推荐方法包括:首先,对获取的日志数据利用Spass和SQLsever工具编程进行清洗、变换和集成,然后在SQLserver2000中建表存储。定义1浏览量(PV),某一页面或商品在一定时间段内被访问的次数,按时间长短分为:分钟浏览量、小时浏览量、天浏览量等。定义2驻留时长(LoR),用户发起一个服务请求进入会话到离开或进入下一个会话的所花费的时间,刻画了用户对页面或商品信息的兴趣程度。定义3购买率(BR),用户浏览物品有四种典型行为,即点击、收藏、加入购物车和购买,则可将购买率定义为BR=C1/(α1C2+α2C3+α3C4),其中Ci(i=1、2、3、4)分别对应四种用户行为,αi(i=1、2、3)分别表示不同行为对购买的贡献度。定义4内容复杂度(CC)一次用户网购过程中,期间用户会建立若干会话,浏览若干种类的的商品,这反映了用户浏览行为复杂度和集中度。则可用单次会话用户访问的商品量与商品类的比值,即Cd=Vg/Vc,其中Vg和Vc分别表示用户访问的商品数目和商品类目数。定义5路径复杂度(Pa_C)按时间序构成的URL序列记录了用户的访问路径,路径对应相应的页面和行为,则路径复杂度定义为行为-页面序列的改变频率。一种推荐系统减少重复推荐的方法步骤如下:第一步,首先进行问卷抽样调查实验,取得典型网购用户类的行为特征;然后利用SQLserver查询分析器计算用户路径状态序列和各高可辨识特征,并构建用户特征向量空间模型。第二步,引入时间情境,考虑用户记忆和行为时效性,并对用户数据按行程进行分割。所述方法选用牛顿冷却率度量这一过程,H=H0exp[-k(t2-t1)],其中H0为初始热度,k为热度冷却衰减率因子,t1和t2分别表示初始和当前时刻。当用户日志数据热度衰减至一阈值时,舍弃对应数据加入计算。利用K-means对用户特征进行聚类分类的到两个类库。第三步,用户需求的判别发现,利用SQLserver根据各特征计算法编程实现目标用户特征的分析,然后与典型用户类行为特征库匹配获取用户所述类型判断是否需求,并根据用户评分进一步验证确认判断需求。第四步,由第三步确定当前用户需求状态,利用特征KNN法寻找用户K-近邻,然后根据K-近邻构建评分矩阵形成推荐表列,对用户进行需求驱动推荐。第五步,进一步地,分析购后日志数据,利用所述第三步所述方法与购后类库比较,确定用户需求状态,然后利用第四步方法形成推荐表列,对推荐表列排序取热度升序top-N进行推荐。附图说明此处所说明的附图用来对本申请的进一步理解,构成本申请的一部分。本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为推荐系统减少重复推荐方法实现流程;图2为典型用户特征及标志特征;图3为方法需求发现跟踪示意图。具体实施方式以下将结合附图对本专利技术及实施例进行详尽的阐述,保证本专利技术的优点和特征能更加清晰易懂,籍此对本申请如何利用技术手段解决
技术介绍
问题,并达成技术功效的实施过程能更好理解并据此施行。本专利技术根本目的在于提供一种推荐系统减少重复推荐的方法,从而提升推荐系统的推荐质量,增加用户QoS和EOS,提高网站转化率。本专利技术包括准备期的典型用户类行为特征库、购后典型用户类特征库,推荐实施中的需求发现跟踪法,如图1所示为本专利技术提供的一种推荐系统减少重复推荐方法的工作流程图。其步骤如下:Step1:引入时间情境,利用问卷法和特征聚类法发掘得到典型用户特征库;Step2:利用差异比较法和特征关键词法分析用户行为,得到可量化的路径复杂度、访问精度等高可辨识特征;Step3:利用时间情境分割法,将购物行程分为购物前后购物后,利用需求判别法判断两分程需求状态;Step4:根据需求状态和购物行程所在阶段,确定推荐方法和推荐物品表列。进一步地,在发掘典型用户特征库过程中,通过挖掘用户访问数据发现用户事件存在明显的四类,即浏览、轻交互、重交互和交易四类;进一步地,根据问卷抽样调查实验结果,结合用户特征向量空间模型聚类,进一步深入发掘发现用户聚集为五个类簇;根据五个类簇特征特点人工标记为五类用户,即犹豫型、理性型、追潮型、完美实用型和行动敏捷型,其特征行为和标志特征如图2所示。进一步地,当用户发起一次购物时,网站日志系统收到会话请求,并创建相应的用户访问日志加以记录;方法计算模块获取到记录数据进行事务注入,然后调用方法中特征计算模块(对应SQL查询指令或处理程序函数)得到当前用户行为特征,紧接着时间情境分割行程状态获取对应典型用户类库信息判断用户需求状态,需求发现跟踪示意图如图3所示。进一步地,当用户存在需求或需要刺激驱动时,利用KNN算法构建用户K-近邻(K的取值决定邻居容器大小),然后根据K-近邻构建评分矩阵形成推荐表列;鉴于单独由K-近邻评分形成推荐存在焦点集中和长尾商品挖掘能力差的问题,引入物品热度度量整个过程中物品热度值,利用牛顿冷却率进行冷却。对推荐表列按热度升序排序,最后去top-N进行推荐。以上实施例仅为本专利技术的示例性实施例。如前所述,应理解本专利技术并非局限于此,对于本
的普通技术人员而言,在本专利技术所披露的技术范围内,对本专利技术做出改动和变换,都应在本专利技术的保护范围之内。本文档来自技高网
...
一种推荐系统减少重复推荐的方法

【技术保护点】
一种推荐系统减少重复推荐的方法,其特征在于,所述方法包括典型用户类行为特征库、购后典型用户类特征库和需求跟踪发现法。所述方法典型用户类行为特征库,用于用户购物行程中用户发起访问时的用户需求状况的确定与判断;所述需求跟踪发现法,用于从用户显式和隐式行为数据中挖掘用户兴趣,从而发现用户需求并进行跟踪;所述方法购后典型用户类特征库,用于判断用户购物过程中,需求满足后的用户后续行为是否仍存在持续需求。

【技术特征摘要】
1.一种推荐系统减少重复推荐的方法,其特征在于,所述方法包括典型用户类行为特征库、购后典型用户类特征库和需求跟踪发现法。所述方法典型用户类行为特征库,用于用户购物行程中用户发起访问时的用户需求状况的确定与判断;所述需求跟踪发现法,用于从用户显式和隐式行为数据中挖掘用户兴趣,从而发现用户需求并进行跟踪;所述方法购后典型用户类特征库,用于判断用户购物过程中,需求满足后的用户后续行为是否仍存在持续需求。2.根据权利要求1所述的需求发现方法,其特征在于,所述方法首先从服务器端用户日志中抽取时间和URL信息,将其整合并按时间组织序列,然后通过URL差异比较法和URL特征关键词分析法确认用户行为,从而据此进一步获得用户访问路径复杂度、页面驻留时长和访问精度特征信息。最后,根据需求判别法对用户访问行为需求状态进行判断发现。3.根据权利要求2所述需求判别法,其特征在于,利用调查问卷法和访问历史数据挖掘法,构建典型用户类行为...

【专利技术属性】
技术研发人员:张毅邓金左理政
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1