基于逻辑回归的电力积分商品推荐方法及系统技术方案

技术编号:21915091 阅读:35 留言:0更新日期:2019-08-21 12:45
本公开公开了基于逻辑回归的电力积分商品推荐方法及系统,包括:针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。

Electricity Integral Commodity Recommendation Method and System Based on Logical Regression

【技术实现步骤摘要】
基于逻辑回归的电力积分商品推荐方法及系统
本公开涉及个性化推荐领域,尤其涉及基于逻辑回归的电力积分商品推荐方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:近年来,信息技术的高速发展导致互联网用户的数量不断增加,数据量呈指数型爆发增长,人们已经进入了一个信息过载的时代,大数据背景下如何在海量的信息中获取用户想要的信息已经成为一项重要的研究课题,推荐算法作为一项克服信息过载的重要技术已经广泛应用于电子商务领域,经过学术界和工业界长期的研究和应用,已经比较成熟,其产生的经济效益是巨大的。目前在推荐系统中应用最为广泛的当属协同过滤算法,其中包括基于邻居和模型两类方法,基于邻居的方法核心是计算用户之间或物品之间的相似度从而进行下一步的推荐工作。基于模型的方法核心内容是将用户—物品的关系评估数据转化为不同的模型,例如因式分解、贝叶斯网络等模型,通过这些模型向用户进行相应的推荐。用户兴趣具有时间性,当前主流的推荐系统在给用户进行推荐时通常侧重于考虑用户兴趣偏好,对于用户兴趣变化的考虑则略显不足。不同的用户具有不同的行为习惯,在电子商务领域亦是如此,传统的推荐系统没有考虑用户的行为习惯,全部予以计算和推荐,这在无形之中增加了系统的负担,也使得推荐的目标性不强。
技术实现思路
为了解决现有技术的不足,本公开提供了基于逻辑回归的电力积分商品推荐方法及系统,通过一种潜在客户预测模型,筛选出可能进行积分兑换的用户,从而使推荐工作更具有目标性,也能够减轻推荐系统的负担,推荐采用协同过滤算法,在传统的协同过滤算法的基础上结合时间因素为目标用户进行推荐。第一方面,本公开提供了基于逻辑回归的电力积分商品推荐方法;基于逻辑回归的电力积分商品推荐方法,包括:对用户进行聚类,获得不同的用户群体;针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。第二方面,本公开提供了基于逻辑回归的电力积分商品推荐系统;基于逻辑回归的电力积分商品推荐系统,包括:用户分类模块,对用户进行聚类,获得不同的用户群体;最相关特征获取模块,其被配置为针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;潜在客户预测模型构建模块,其被配置为采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;积分兑换用户预测模块,其被配置为基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;商品推荐模块,其被配置为对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。本专利技术的有益效果:1.基于逻辑回归算法建立的潜在客户预测模型,一定程度上解决了潜在积分兑换客户的确定问题,充分利用样本信息,使挖掘的结果也比较可靠,通过对用户进行分层聚类,不仅能够细化用户的分类,同时也能够获得更加精确的用户最相关特征信息,逻辑回归算法的使用能够快速确定用户进行兑换积分的可能性,从而使接下来的推荐工作更具有针对性,潜在客户预测模型重点是用户聚类,核心是逻辑回归预测,在提取用户特征信息时可以不拘一格,根据实际情况充实用户数据从而获得不一样的用户最相关数据。2.推荐方面采用的是协同过滤算法,根据目标用户已经操作过的商品,通过计算基于时间的用户对商品的偏好从而确定目标用户潜在的偏好物品,根据物品相似度得到推荐列表并返还给用户。3、整个模型包含两部分:潜在客户预测和协同过滤推荐;潜在客户预测模型优势在于相较于其他模型并不复杂,随着数据量的增加,不会导致计算量呈指数上升,这一点满足系统对时间的要求;推荐部分的优势在于计算商品相似度时并不需要重复计算,只需要在系统商品变更时才会进行计算,同样满足系统实时性要求。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1潜在客户预测模型图;图2数据库关系图;图3实验时数据样例图;图4推荐系统模型图;图5用户兑换数据比例图;图6有无相关特征分析的潜在客户预测效果对比;图7推荐准确率;图8推荐召回率。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一,本实施例提供了基于逻辑回归的电力积分商品推荐方法;基于逻辑回归的电力积分商品推荐方法,包括:S0:对用户进行聚类,获得不同的用户群体;S1:针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;S2:采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;S3:基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;S4:对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。作为一个或多个实施例,所述对用户进行聚类,获得不同的用户群体,是指:基于积分兑换用户的评价指标,对用户采用聚类方式进行分类;对每一类用户的历史积分兑换记录,采用基于互信息的特征选择方法进行最相关特征选择。作为一个或多个实施例,所述基于积分兑换用户的评价指标,对用户采用聚类方式进行分类;具体步骤包括:积分兑换用户的评价指标,包括:积分兑换用户的年积分兑换量和月积分兑换量;采集积分兑换用户的年积分兑换量和月积分兑换量;采用模糊C均值算法对年积分兑换用户进行聚类,得到r个簇;采用模糊C均值算法对月积分兑换用户进行聚类,得到s个簇;将用户分为r×s个类。作为一个或多个实施例,所述历史积分兑换记录,包括:用户本文档来自技高网
...

【技术保护点】
1.基于逻辑回归的电力积分商品推荐方法,其特征是,包括:对用户进行聚类,获得不同的用户群体;针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。

【技术特征摘要】
1.基于逻辑回归的电力积分商品推荐方法,其特征是,包括:对用户进行聚类,获得不同的用户群体;针对每一类用户获取有积分且曾用积分兑换过商品的正样本用户的最相关特征数据,还获取有积分且未用积分兑换过商品的负样本用户的最相关特征数据;采用逻辑回归算法,以正样本用户的最相关特征数据、负样本用户的最相关特征数据、以及积分兑换与否标签作为训练集数据,建立潜在客户预测模型;基于潜在客户预测模型,根据待预测用户的历史积分兑换记录,预测用户进行积分兑换的概率;对于概率大于设定阈值的用户,视为潜在的积分兑换用户,采用协同过滤算法为潜在的积分兑换用户推荐商品。2.如权利要求1所述的方法,其特征是,所述对用户进行聚类,获得不同的用户群体,是指:基于积分兑换用户的评价指标,对用户采用聚类方式进行分类;对每一类用户的历史积分兑换记录,采用基于互信息的特征选择方法进行最相关特征选择。3.如权利要求2所述的方法,其特征是,所述基于积分兑换用户的评价指标,对用户采用聚类方式进行分类;具体步骤包括:积分兑换用户的评价指标,包括:积分兑换用户的年积分兑换量和月积分兑换量;采集积分兑换用户的年积分兑换量和月积分兑换量;采用模糊C均值算法对年积分兑换用户进行聚类,得到r个簇;采用模糊C均值算法对月积分兑换用户进行聚类,得到s个簇;将用户分为r×s个类。4.如权利要求1所述的方法,其特征是,所述历史积分兑换记录,包括:用户积分累积余额、用户积分兑换信息、用户积分兑换时间、用户积分兑换次数、用户积分兑换频率或最后一次积分兑换行为发生时间到当前时间的时间间隔。5.如权利要求1所述的方法,其特征是,采用基于互信息的特征选择方法进行最相关特征选择,是选取互信息最大的前k个特征作为该类用户最相关特征。6.如权利要求1所述的方法,其特征是,采用协同过滤算法为潜在积分兑换用户推荐商品,具体步骤包括:采集潜在用户的历史商品浏览行为数据,提取历史浏览商品属性、历史购买商品属性和历史购买商品的价格;计算商城已有商品与用户历史浏览商品的属性的第一相似度...

【专利技术属性】
技术研发人员:史玉良张晖管永明吕梁张洪涛吕贺
申请(专利权)人:山大地纬软件股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1