一种推荐信息生成方法和系统技术方案

技术编号:21631452 阅读:17 留言:0更新日期:2019-07-17 11:54
本发明专利技术公开了一种推荐信息生成方法和系统,方法包括:获取原始交易数据,原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理用户信息和交易记录以获取用户向量和交易向量;基于叉积模处理用户向量和交易向量以获取用户商品间相似度并赋予对应的评分;根据评分进行用户与商品关联性的排序以获取Top‑K列表,根据Top‑K列表输出推荐信息。系统用于执行方法。本发明专利技术通过解析原始交易数据以获取用户信息和交易记录,根据标签赋予规则处理以关系的矩阵,基于叉积模处理矩阵以获取相似度和评分,根据评分进行推荐信息的生成,相对于传统的向量点积或距离方式提高对大量数据的处理效果。

A Method and System of Recommendation Information Generation

【技术实现步骤摘要】
一种推荐信息生成方法和系统
本专利技术涉及网络信息处理
,尤其是一种推荐信息生成方法和系统。
技术介绍
随着网络商务的发展,在在线商城中进行销售的物品越来越多,商品的种类繁多已经成为一种信息过载,用户需要从海量的商品中快速选择自己感兴趣和符合需求的物品,推荐系统作为一种信息过滤系统,在线商城的推荐系统对用户的兴趣检测就显得十分重要。在传统的算法中,往往用向量点积或距离做客户兴趣相关性检测,往往需要引入人为规则进行改进,数据量大了以后鲁棒性较差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的是提供一种推荐信息生成方法和系统。本专利技术所采用的技术方案是:第一方面,本专利技术提供一种推荐信息生成方法,包括步骤:获取原始交易数据,所述原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量;基于叉积模处理所述用户向量和所述交易向量以获取用户商品间相似度并赋予对应的评分;根据评分进行用户与商品关联性的排序以获取Top-K列表,根据Top-K列表输出推荐信息。优选地,所述根据预设的标签赋予规则处理所述用户信息和交易记录具体包括:根据预设的标签赋予规则匹配所述用户信息和交易记录,基于用户信息的标签和交易记录的标签生成关系矩阵;以用户标签为起点,交易标签为终点的向量为用户向量;以交易标签为终点,另一个交易标签为终点的向量为交易向量。优选地,所述叉积模处理具体包括:计算最少两个向量的长度平方,计算向量上的元素值的平方和,计算平方和的乘积A,计算向量上的点的元素值的乘积和的平方B,评分S的平方S2=A-B,其中,元素值为点对应的标签的值。优选地,还包括步骤:更新标签赋予规则,基于更新的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量。优选地,更新标签赋予规则包括增加或减少标签,具体的,以叉积模和的最大化为目标函数,基于头脑风暴算法决定增加或减少标签。第二方面,本专利技术提供一种推荐信息生成系统,包括:原始数据处理模块,用于获取原始交易数据,所述原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量;评分模块,用于基于叉积模处理所述用户向量和所述交易向量以获取用户商品间相似度并赋予对应的评分;推荐模块,用于根据评分进行用户与商品关联性的排序以获取Top-K列表,根据Top-K列表输出推荐信息。优选地,所述根据预设的标签赋予规则处理所述用户信息和交易记录具体包括:根据预设的标签赋予规则匹配所述用户信息和交易记录,基于用户信息的标签和交易记录的标签生成关系矩阵;以用户标签为起点,交易标签为终点的向量为用户向量;以交易标签为终点,另一个交易标签为终点的向量为交易向量。优选地,所述叉积模处理具体包括:计算最少两个向量的长度平方,计算向量上的元素值的平方和,计算平方和的乘积A,计算向量上的点的元素值的乘积和的平方B,评分S的平方S2=A-B,其中,元素值为点对应的标签的值。优选地,还包括更新模块,用于更新标签赋予规则,基于更新的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量优选地,更新标签赋予规则包括增加或减少标签,具体的,以叉积模和的最大化为目标函数,基于头脑风暴算法决定增加或减少标签。本专利技术的有益效果是:本专利技术通过解析原始交易数据以获取用户信息和交易记录,根据标签赋予规则处理以关系的矩阵,基于叉积模处理矩阵以获取相似度和评分,根据评分进行推荐信息的生成,相对于传统的向量点积或距离方式提高对大量数据的处理效果。附图说明图1是本专利技术的一种推荐信息生成方法的示意图;图2是本专利技术的一种推荐信息生成系统的示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。实施例1对于“看了这个商品的还看了”这种推荐形式,无论是京东还是淘宝,或者易购网站,这样的推荐产品可以说是推荐系统的标配。类似的点评类网站的“喜欢了这部电影的还喜欢了”,社交网站的“关注了这个人还关注了”,这些都只是一个古老的推荐算法,叫做基于物品条目的协同过滤,其缺点在于会出现需求次数较少,仍然反复推荐的情况,这种没有考虑用户的购物兴趣变更的推荐方法,不仅不能满足客户推荐的需求,还容易因为出现现阶段无用的物品引起客户的不满。本专利技术在考虑客户的属性变更和商品更新的基础上,提出对应的方法,本实施例提供如图1所示一种推荐信息生成方法,包括步骤:S1、获取原始交易数据,所述原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量;S2、基于叉积模处理所述用户向量和所述交易向量以获取用户商品间相似度并赋予对应的评分;S3、根据评分进行用户与商品关联性的排序以获取Top-K列表,根据Top-K列表输出推荐信息。其中,步骤S1获取原始交易数据,具体可以是来源于网上商城的数据,用户数量和商品数量往往比较巨大,对计算资源的需求成为瓶颈,所以本方案按年龄,教育程度,居住地,收入水平等标签(这部分的标签适用于用户信息,其来源于用户注册时填写的信息)来分类和聚类用户,把物品的价格与用户承受的支出水平关联起来,这样至少可以关注到用户群的兴趣的整体迁移。物品对应的消费者数量大小可以按价格,年龄,收入水平,教育程度等(标签)进行分类调整,对于计算物品之间的相似度稀疏稠密度就可以按统计准确度需要任意调节了;而交易记录为用户实际购买的物品,可以以生活物品、工具、食品、使用寿命等标签来进行标记;对应的,用户中符合同一标签的,可以以其他标签作为变化的趋势(即向量),例如,同属于30岁~40岁,则符合同一(年龄)标签,此时,以教育程度作为变化的趋势,则可以生成一个向量,该向量以年龄为起点,向不同教育程度(小学、初中、大学等,其对应一个值,这个值即矩阵的其中一维的坐标),依次类推,可以形成关于用户的变换向量(即用户向量);而交易向量具体为个人的交易商品的标签的变换的趋势,同时,当个人变成同一用户信息的人群时,可以形成更为泛用的趋势,例如,同属于30岁~40岁,其购买商品中均出现商品甲,且商品甲的出现次数随着年龄增加而增加,则说明随着年龄增加,商品甲又或者类似的商品被购买的可能性就增加,对应的趋势即为交易向量。以用户的标签、交易(商品)的标签作为坐标系的一维,则可以形成多维的关系网,即关系矩阵,以用户标签为起点,交易标签为终点的向量为用户向量(即什么样的用户采购了什么样的商品);以交易标签为终点,另一个交易标签为终点的向量为交易向量(即用户买了什么样的商品之后,下一个购买商品会是什么样的商品),通过这两个方式,能够获取用户标签和商品标签的关系,商品标签和(下一个)商品标签的关系。关系矩阵往往是一个稀疏矩阵,没有交互记录处(即矩阵的点)为空值;矢量的维度可以是用户的年龄,教育水平,收入水平等数目(即标签的值,例如年龄从10岁到100岁),一个用户标签代表向量的一维,这个向量的总维度是总用户标签数量;矢量各个维度的取值是聚类用户对这个物品的教育记录,可以是行为本身的布尔值,也可以是消费行为量化如时间长短、次数多少等,还可以是消费的评价分数,而不同标签的交本文档来自技高网...

【技术保护点】
1.一种推荐信息生成方法,其特征在于,包括步骤:获取原始交易数据,所述原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量;基于叉积模处理所述用户向量和所述交易向量以获取用户商品间相似度并赋予对应的评分;根据评分进行用户与商品关联性的排序以获取Top‑K列表,根据Top‑K列表输出推荐信息。

【技术特征摘要】
1.一种推荐信息生成方法,其特征在于,包括步骤:获取原始交易数据,所述原始交易数据包括用户信息和交易记录,根据预设的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量;基于叉积模处理所述用户向量和所述交易向量以获取用户商品间相似度并赋予对应的评分;根据评分进行用户与商品关联性的排序以获取Top-K列表,根据Top-K列表输出推荐信息。2.根据权利要求1所述的一种推荐信息生成方法,其特征在于,所述根据预设的标签赋予规则处理所述用户信息和交易记录具体包括:根据预设的标签赋予规则匹配所述用户信息和交易记录,基于用户信息的标签和交易记录的标签生成关系矩阵;以用户标签为起点,交易标签为终点的向量为用户向量;以交易标签为终点,另一个交易标签为终点的向量为交易向量。3.根据权利要求1所述的一种推荐信息生成方法,其特征在于,所述叉积模处理具体包括:计算最少两个向量的长度平方,计算向量上的元素值的平方和,计算平方和的乘积A,计算向量上的点的元素值的乘积和的平方B,评分S的平方S2=A-B,其中,元素值为点对应的标签的值。4.根据权利要求1所述的一种推荐信息生成方法,其特征在于,还包括步骤:更新标签赋予规则,基于更新的标签赋予规则处理所述用户信息和交易记录以获取用户向量和交易向量。5.根据权利要求4所述的一种推荐信息生成方法,其特征在于,更新标签赋予规则包括增加或减少标签,具体的,以叉积模和的最大化为目标函数,基于头脑风暴算法决定增加或减少标签。6.一种推荐信息生成系统...

【专利技术属性】
技术研发人员:史玉回黄骏张大步
申请(专利权)人:南方科技大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1