System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
所属的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram),只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。尽管上面已经示出和描述了本专利技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本专利技术的限制,本领域的普通技术人员在本专利技术的范围内可以对上述实施例进行变化、修改、替换和变型。
技术介绍
1、随着网络服务的迅速发展,“信息过载”的问题经常出现:例如在电商平台,用户面对海量的物品列表应该如何做出选择
2、现有推荐往往采用某一特定推荐模型,无法有效结合不同模型的优势进行综合推荐,且推荐系统普遍存在冷启动与数据稀疏性问题,在信息为王的时代,如何快速、精准的响应用户需求亟待解决。
3、例如在授权公告号为cn103886047b的中国专利中公开了一种面向流式数据的分布式在线推荐方法,涉及数据推荐
,该方法采用分布式计算环境,对用户行为产生的流式数据直接进行处理,把用户对物品点击行为数据按用户编号和物品编号进行分组,把对应分组中的数据发送到相应的工作单元中,并根据用户的推荐反馈生成负样本,再用随机梯度下降算法进行统一的矩阵分解训练,采用协同过滤方法计算与用户最近感兴趣的品相似的物品集合,结合原推荐列表作为候选推荐集合,根据训练结果对候选集中的物品排序得到推荐结果。
4、而在授权公告号为cn109508424b的中国专利中公开了一种基于特征演进的流式数据推荐方法,该方法将模型切换由一个点拓展到一个时间段,在模型切换时间段中,新旧两种特征集合和推荐模型同时存在并同时发挥作用;通过权重因子,将两个模型得到的推荐结果相结合,从而得到该时间段中的最终推荐结果。以上专利均存在本
技术介绍
提出的问题:现有的推荐算法未能有效利用不同推荐模型的优势,并且当用户和商品没有相关的历史反馈时,现有的推荐方法无法对新用户和新商品做出有效地推荐。
技术实现思路
1、为了克服现有技术存在的缺陷与不足,本专利技术提供基于流式数据的商品智能排序方法及系统,通过构建冷启动推荐模型和自适应集成学习模型,结合不同推荐模型的优势实现对新用户和新商品的有效推荐。
2、为了达到上述目的,本专利技术采用以下技术方案:
3、本专利技术提供基于流式数据的商品智能排序方法,包括下述步骤:
4、获取用户行为数据和商品特征数据,用户行为数据包括用户行为历史数据和用户行为实时数据;
5、对用户行为数据进行预处理,预处理包括异常值去除、稀疏数据填充和数据交叉采样;
6、构建冷启动推荐模型,向新用户推荐与该用户偏好商品相似度最高的商品并记录新用户行为数据;
7、将用户行为数据和新用户行为数据输入自适应集成学习模型计算商品的排序得分;
8、生成商品排序列表,将商品按照排序得分从高到低排序供用户选择。
9、作为优选的技术方案,所述异常值去除用于去除用户行为数据中的异常数据,具体步骤包括:
10、通过k-means算法对用户行为历史数据进行分析,获得聚类中心,计算用户行为实时数据与聚类中心的距离,并与阈值相对比;
11、若用户行为实时数据不属于任何一个聚类中心,则标记该用户行为实时数据为异常状态,若用户行为实时数据属于某个聚类中心,则将用户行为实时数据加入用户行为历史数据并计算新的聚类中心;
12、比较被标记为异常状态的用户行为实时数据邻近的t时期内的数据点是否为异常状态,若t时刻内的数据点存在异常状态,则将标记为异常状态的用户行为实时数据保存为用户新偏好,若t时期内的数据点均为非异常状态,则去除该异常状态的用户行为实时数据。
13、作为优选的技术方案,所述稀疏数据填充用于对用户行为历史数据中的缺失值进行填充,具体步骤包括:
14、计算用户评分权重系数,用下式表示:
15、
16、式中sxi表示用户x对商品i的评分,ix表示所有被用户x评价过的商品集合,syi表示用户y对商品i的评分,iy表示所有被用户y评价过的商品集合,ix,y表示用户x与用户y共同评分的所有商品的集合,wscore表示用户评分权重系数;
17、计算用户相似度,用下式表示:
18、
19、式中表示用户x在ix,y上的平均评分,表示用户x所有评价过的商品的平均评分,表示用户y在ix,y上的平均评分,表示用户y所有评价过的商品的平均评分,simu(x,y)表示用户x与用户y的相似度;
20、将用户相似度大于阈值的所有用户的数据项平均值作为缺失值进行数据填充。
21、作为优选的技术方案,所述冷启动推荐模型包括用户冷启动单元和商品相似度计算单元,通过用户冷启动单元得到用户的偏好商品,通过商品相似度计算单元得到商品的相似度。
22、作为优选的技术方案,所述自适应集成学习模型用于计算商品的排序得分,具体步骤包括:
23、对子推荐模型生成的商品评分进行归一化处理:
24、
25、式中c(u,i)表示子推荐模型c对用户u推荐商品i的推荐分数,cmax表示子推荐模型c对用户u推荐的最高分,cmin表示子推荐模型c对用户推荐u的最低分,combic(u,i)表示子推荐模型c对用户u推荐商品i经归一化后的推荐得分;
26、计算引入用户行为参数的子推荐模型权重,用下式表示:
27、
28、式中表示子推荐模型c对于用户u的初始权重,c表示子推荐模型的个数,p(c,u)表示子推荐模型c推荐的商品被用户u选择的次数,表示子推荐模型c对于用户u的权重;
29、计算商品排序得分,计算过程用下式表示:
本文档来自技高网...【技术保护点】
1.基于流式数据的商品智能排序方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述异常值去除用于去除用户行为数据中的异常数据,具体步骤包括:
3.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述稀疏数据填充用于对用户行为历史数据中的缺失值进行填充,具体步骤包括:
4.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述冷启动推荐模型包括用户冷启动单元和商品相似度计算单元,通过用户冷启动单元得到用户的偏好商品,通过商品相似度计算单元得到商品的相似度。
5.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述自适应集成学习模型用于计算商品的排序得分,计算过程用下式表示:
6.根据权利要求4所述的基于流式数据的商品智能排序方法,其特征在于,所述用户冷启动单元用于计算新用户偏好,具体步骤包括:
7.根据权利要求4所述的基于流式数据的商品智能排序方法,其特征在于,所述商品相似度计算单元用于计算商品相似度,具体步骤包
8.基于流式数据的商品智能排序系统,其基于权利要求1-7中任一项所述的基于流式数据的商品智能排序方法实现,其特征在于,所述系统包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现权利要求1-7中任一项所述的基于流式数据的商品智能排序方法。
10.一种控制器,包括存储器和处理器,所述存储器用于存储计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现权利要求1-7中任一项所述的基于流式数据的商品智能排序方法。
...【技术特征摘要】
1.基于流式数据的商品智能排序方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述异常值去除用于去除用户行为数据中的异常数据,具体步骤包括:
3.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述稀疏数据填充用于对用户行为历史数据中的缺失值进行填充,具体步骤包括:
4.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述冷启动推荐模型包括用户冷启动单元和商品相似度计算单元,通过用户冷启动单元得到用户的偏好商品,通过商品相似度计算单元得到商品的相似度。
5.根据权利要求1所述的基于流式数据的商品智能排序方法,其特征在于,所述自适应集成学习模型用于计算商品的排序得分,计算过程用下式表示:
6.根据权利...
【专利技术属性】
技术研发人员:戴云,
申请(专利权)人:江苏经贸职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。