一种基于异质信息网络的推荐方法及装置制造方法及图纸

技术编号:27773635 阅读:20 留言:0更新日期:2021-03-23 13:01
本发明专利技术公开了一种基于异质信息网络的推荐方法及装置,包括步骤:获取用户数据、物品数据、用户对物品的行为数据、物品对用户的曝光数据;据用户对物品的行为数据、物品对用户的曝光数据、用户数据构造异质信息网络;通过预设算法对有历史行为的用户和没有历史行为的用户分别计算获取推荐候选物品集;在推荐候选物品集的基础上使用分类学习算法来预测用户对物品的偏好程度,然后将用户对物品按照偏好程度从大到小依次排列,选出用户最有可能感兴趣的物品。本发明专利技术有效解决历史行为数据不足导致的用户冷启动问题,提升个性化推荐系统用户体验,同时通过结合用户隐式反馈信息提高推荐准确度。

【技术实现步骤摘要】
一种基于异质信息网络的推荐方法及装置
本专利技术涉及大数据和数据挖掘推荐系统
,具体来说,涉及一种基于异质信息网络的推荐方法及装置。
技术介绍
随着信息互联网技术和电子商务的飞速发展,用户面对海量的网络信息变得手足无措。如何挖掘潜在用户,如何精准地向潜在客户推荐商品成为了电子商务平台、需要解决的首要问题。对于用户而言,在没有明确的需求的情况下面对网络上数量庞大的商品信息时很难做出选择,信息的利用率反而降低,这种现象被称之为信息超载.个性化推荐被认为是当前解决信息超载问题最有效的工具之一。个性化推荐系统广泛应用于电子商务、网络视频音乐、个性化阅读、个性化邮件以及社交网络等。推荐系统包含两个关键阶段,召回和排序。召回阶段从全量信息集合中触发尽可能多的正确结果,排序阶段则将召回阶段得到的候选集进行精准排序,推荐给用户。推荐系统里召回阶段应用最广泛的是协同过滤技术,主要包括基于用户的协同过滤、基于物品的协同过滤、基于模型的协同过滤,这三类方法均针对表示用户和物品之间关系的二维矩阵进行分析计算。其中基于用户的协同过滤方法根据用户对物品的历史行为计算用户之间的相似度,然后收集和分析相似用户的感兴趣的物品作为目标用户的候选集。基于物品的协同过滤方法根据用户对物品的行为计算物品之间的相似度,根据物品的相似度和用户历史行为为用户生成召回候选集。基于模型的协同过滤方法利用矩阵分解或机器学习从历史行为数据中提取特征,计算用户和物品的向量化表示,根据用户和物品向量的点积计算用户和物品间的相关性,根据相关性高低为用户生成召回候选集。基于图的推荐算法中,用户和物品的关系被表示为二部图的形式,通过诸如随机游走方法计算目标用户与图中所有节点的相关性,将其与物品间的相关性表示目标用户对物品的感兴趣程度,据此构造推荐物品候选集。由于协同过滤技术和基于图的推荐技术都是根据用户的历史行为和兴趣预测用户未来的行为和兴趣,大量的用户行为数据就成为推荐系统的重要组成部分和先决条件。对于个性化推荐系统来说,新的系统、新的用户、新的内容对推荐系统来说,需要通过累计一定的曝光量和互动量来收集相关基础数据。这个从零开始积累基础数据的过程就是冷启动,其效果的好坏关系到产品新用户的留存和转化,因此冷启动问题是推荐系统研究开发过程中备受关注的问题。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的上述技术问题,本专利技术提出一种基于异质信息网络的推荐方法及装置,能够解决上述问题。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于异质信息网络的推荐方法,包括步骤:S1获取用户数据、物品数据、用户对物品的行为数据、物品对用户的曝光数据;S2据用户对物品的行为数据、物品对用户的曝光数据、用户数据构造异质信息网络;S3通过预设算法对有历史行为的用户和没有历史行为的用户分别计算获取推荐候选物品集;S4在推荐候选物品集的基础上使用分类学习算法来预测用户对物品的偏好程度,然后将用户对物品按照偏好程度从大到小依次排列,选出用户最有可能感兴趣的物品;S5过滤重复推荐和状态异常的物品,当召回和排序结果不足时,使用全局热门物品、新上架物品进行补充,合并物品基础信息,将包含完整信息的物品推荐列表返回给服务请求端。进一步的,步骤S2中:所述异质信息网络中包含三类节点,第一类为用户特征节点,根据用户属性数据生成用户特征节点,其中对连续属性进行离散化,对离散属性采用one-hot编码方法进行处理;第二类为用户节点;第三类为物品节点;所述异质信息网络中包含两类边,第一类边存在于第二类节点与第一类节点之间,表示用户具有的特征;第二类边存在于第二类节点和第三类节点之间,表示用户对物品的偏好。进一步的,用户对物品的偏好权值为点击率CTR,即用户点击该物品的次数除以该物品对目标用户曝光的次数。进一步的,步骤S3具体为:对于有历史行为的用户,通过对第二类节点、第三类节点、以及第二类边构成的用户-物品二分网络,使用第一预设算法计算用户节点与物品节点间的相关性,取相关性最高的n个物品作为目标用户的推荐物品候选集;对于无历史行为的用户,通过对第一类节点、第二类节点、以及第一类边构成的用户-特征二分网络,使用第二预设算法计算用户节点之间的相似性。进一步的,所述取相关性最高的n个物品作为目标用户的推荐物品候选集具体包括:根据相关性找出前k个有历史行为的最近邻用户,加权累加上述k-近邻用户点击过的物品,权值为用户对物品的点击率,累加值作为目标新用户对该物品的偏好,取偏好最高的前n个物品作为目标新用户的推荐物品候选集。一种基于异质信息网络的推荐装置,包括:数据采集模块;所述数据采集模块采集用户数据、物品数据、用户对物品的行为数据和物品对用户的曝光数据;异质信息网络构建模块;所述异质信息网络构建模块根据用户对物品的行为数据、物品对用户的曝光数据、用户数据构造异质信息网络;召回模块;所述召回模块通过预设算法对有历史行为的用户和没有历史行为的用户分别计算获取推荐候选物品集;排序模块;所述排序模块在推荐候选物品集的基础上使用分类学习算法来预测用户对物品的偏好程度,然后将用户对物品按照偏好程度从大到小依次排列,选出用户最有可能感兴趣的物品;推荐服务模块;所述推荐服务模块过滤重复推荐和状态异常的物品,当召回和排序结果不足时,使用全局热门物品、新上架物品进行补充,合并物品基础信息,将包含完整信息的物品推荐列表返回给服务请求端。进一步的,所述异质信息网络中包含三类节点,第一类为用户特征节点,根据用户属性数据生成用户特征节点,其中对连续属性进行离散化,对离散属性采用one-hot编码方法进行处理;第二类为用户节点;第三类为物品节点;所述异质信息网络中包含两类边,第一类边存在于第二类节点与第一类节点之间,表示用户具有的特征;第二类边存在于第二类节点和第三类节点之间,表示用户对物品的偏好。进一步的,用户对物品的偏好权值为点击率CTR,即用户点击该物品的次数除以该物品对目标用户曝光的次数。进一步的,所述分别计算获取推荐候选物品集具体为:对于有历史行为的用户,通过对第二类节点、第三类节点、以及第二类边构成的用户-物品二分网络,使用第一预设算法计算用户节点与物品节点间的相关性,取相关性最高的n个物品作为目标用户的推荐物品候选集;对于无历史行为的用户,通过对第一类节点、第二类节点、以及第一类边构成的用户-特征二分网络,使用第二预设算法计算用户节点之间的相似性。进一步的,所述取相关性最高的n个物品作为目标用户的推荐物品候选集具体包括:根据相关性找出前k个有历史行为的最近邻用户,加权累加上述k-近邻用户点击过的物品,权值为用户对物品的点击率,累加值作为目标新用户对该物品的偏好,取偏好最高的前n个物品作为目标新用户的推荐物品候选集。本专利技术的有益效果:本文档来自技高网
...

【技术保护点】
1.一种基于异质信息网络的推荐方法,其特征在于,包括步骤:/nS1获取用户数据、物品数据、用户对物品的行为数据、物品对用户的曝光数据;/nS2据用户对物品的行为数据、物品对用户的曝光数据、用户数据构造异质信息网络;/nS3通过预设算法对有历史行为的用户和没有历史行为的用户分别计算获取推荐候选物品集;/nS4在推荐候选物品集的基础上使用分类学习算法来预测用户对物品的偏好程度,然后将用户对物品按照偏好程度从大到小依次排列,选出用户最有可能感兴趣的物品;/nS5过滤重复推荐和状态异常的物品,当召回和排序结果不足时,使用全局热门物品、新上架物品进行补充,合并物品基础信息,将包含完整信息的物品推荐列表返回给服务请求端。/n

【技术特征摘要】
1.一种基于异质信息网络的推荐方法,其特征在于,包括步骤:
S1获取用户数据、物品数据、用户对物品的行为数据、物品对用户的曝光数据;
S2据用户对物品的行为数据、物品对用户的曝光数据、用户数据构造异质信息网络;
S3通过预设算法对有历史行为的用户和没有历史行为的用户分别计算获取推荐候选物品集;
S4在推荐候选物品集的基础上使用分类学习算法来预测用户对物品的偏好程度,然后将用户对物品按照偏好程度从大到小依次排列,选出用户最有可能感兴趣的物品;
S5过滤重复推荐和状态异常的物品,当召回和排序结果不足时,使用全局热门物品、新上架物品进行补充,合并物品基础信息,将包含完整信息的物品推荐列表返回给服务请求端。


2.根据权利要求1所述的基于异质信息网络的推荐方法,其特征在于,步骤S2中:
所述异质信息网络中包含三类节点,第一类为用户特征节点,根据用户属性数据生成用户特征节点,其中对连续属性进行离散化,对离散属性采用one-hot编码方法进行处理;第二类为用户节点;第三类为物品节点;
所述异质信息网络中包含两类边,第一类边存在于第二类节点与第一类节点之间,表示用户具有的特征;第二类边存在于第二类节点和第三类节点之间,表示用户对物品的偏好。


3.根据权利要求2所述的基于异质信息网络的推荐方法,其特征在于,用户对物品的偏好权值为点击率CTR,即用户点击该物品的次数除以该物品对目标用户曝光的次数。


4.根据权利要求2所述的基于异质信息网络的推荐方法,其特征在于,步骤S3具体为:
对于有历史行为的用户,通过对第二类节点、第三类节点、以及第二类边构成的用户-物品二分网络,使用第一预设算法计算用户节点与物品节点间的相关性,取相关性最高的n个物品作为目标用户的推荐物品候选集;
对于无历史行为的用户,通过对第一类节点、第二类节点、以及第一类边构成的用户-特征二分网络,使用第二预设算法计算用户节点之间的相似性。


5.根据权利要求4所述的基于异质信息网络的推荐方法,其特征在于,所述取相关性最高的n个物品作为目标用户的推荐物品候选集具体包括:
根据相关性找出前k个有历史行为的最近邻用户,加权累加上述k-近邻用户点击过的物品,权值为用户对物品的点击率,累加值作为目标新用户对该物品的偏好,取偏好最高的前n个物品作为目标新用户的推荐物品候选集。


6.一种基于异质信息网络的推荐装置,其特征在于,包括:

【专利技术属性】
技术研发人员:何伟张晶亮谢水庚郝志强刘雪妍
申请(专利权)人:北京航天云路有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1