基于局部敏感哈希的用户冷启动产品推荐方法及系统技术方案

技术编号:26418831 阅读:20 留言:0更新日期:2020-11-20 14:14
本发明专利技术提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统,该方法包括:采集当前时间窗口内的产品操作数据,选取第一热门产品;获取产品自带信息,生成产品向量数据;根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;建立产品大类与兴趣标签的关联关系;如果新用户的用户类型为游客模式用户,将第一热门产品作为首次曝光产品进行展示;如果为注册用户,获取选择的兴趣标签,获取第二热门产品,按照预设权重生成首次曝光产品进行展示;在新用户与首次曝光产品户发生交互行为时,根据产品之间的相似度查找交互相似产品,并将相似产品作为新的曝光产品进行展示,本发明专利技术能够生成个性化的用户冷启动结果,提高用户体验。

【技术实现步骤摘要】
基于局部敏感哈希的用户冷启动产品推荐方法及系统
本专利技术涉及数据处理
,尤指一种基于局部敏感哈希的用户冷启动产品推荐方法及系统。
技术介绍
随着互联网的发展,跨境APP面临着严重的信息过载问题,推荐系统作为解决跨境场景下信息过载有效手段之一,可利用用户与跨境APP的交互记录为用户推荐其可能喜欢的物品。在现有技术中,当新用户登录到银行系统中时,比较常用的推荐方式有两种:1、随机推荐方式,当新用户进入银行系统中时,推荐算法在物品库中随机选择若干个物品推荐给用户;这种方式没有利用用户与银行系统的任何交互信息,推荐结果往往无法令用户满意。2、筛选出与当前登录用户最相近的一批用户,并根据这批用户的偏好信息为登录用户进行推荐。由于“游客”类用户没有任何信息,难以计算相似用户的情况。此外,当用户量大量增加时,用户相似度的计算量迅速增加,耗费资源。因此,由于新用户没有或者只有少量记录、信息,推荐系统很难为他们进行合理的推荐,严重影响用户首次使用跨境APP时的体验,增加客户流失的风险。综上来看,亟需一种可以克服上述问题,改善用户冷启动登录体验的技术方案。
技术实现思路
为克服上述问题,本专利技术提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统,该方法及系统利用局部敏感哈希算法得到产品之间的相似度,通过采集产品热度及用户感兴趣的标签给新用户推荐首次曝光产品,当用户与曝光产品发生交互时,通过计算好的产品相似度进行曝光产品的更新,该推荐处理的过程中采用的局部敏感哈希算法可以保证在较小计算量完成海量产品相似性的计算,通过相似度对曝光产品进行更新能够提高用户冷启动准确性,并且有效提高了游客模式用户的冷启动时的体验。在本专利技术实施例的第一方面,提出了一种基于局部敏感哈希的用户冷启动产品推荐方法,该方法包括:采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;当新用户登录跨境APP时,检测用户类型;如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。在本专利技术实施例的第二方面,提出了一种基于局部敏感哈希的用户冷启动产品推荐系统,该系统包括:数据采集模块,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;产品信息处理模块,用于获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;产品相似度计算模块,用于根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;标签关联模块,用于记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;登录检测模块,用于当新用户登录跨境APP时,检测用户类型;游客用户产品展示模块,用于在所述新用户的用户类型为游客模式用户的情况下,将所述第一热门产品作为首次曝光产品进行展示;注册用户产品展示模块,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;曝光产品更新模块,用于在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。在本专利技术实施例的第三方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于局部敏感哈希的用户冷启动产品推荐方法。在本专利技术实施例的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现基于局部敏感哈希的用户冷启动产品推荐方法。本专利技术提出的基于局部敏感哈希的用户冷启动产品推荐方法及系统可以利用用户与系统的交互信息,生成个性化的用户冷启动结果,提高新用户体验;并且为游客模式用户提供合适冷启动结果,使推荐内容更加全面;在产品推荐过程中,本专利技术采用基于敏感哈希计算产品相似度,减少计算量,降低成本,根据该些产品相似度计算结果,结合用户与推荐产品行为反馈,实时对推荐内容进行修正,提高用户冷启动结果的准确度。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术一实施例的基于局部敏感哈希的用户冷启动产品推荐方法的流程示意图。图2是本专利技术一具体实施例的产品信息处理的详细流程示意图。图3是本专利技术一具体实施例的新用户为注册用户时生成首次曝光产品的详细流程示意图。图4是本专利技术一实施例的基于局部敏感哈希的用户冷启动产品推荐系统的架构示意图。图5是本专利技术一具体实施例的产品信息处理模块的详细架构示意图。图6是本专利技术一具体实施例的注册用户产品展示模块的详细架构示意图。图7是本专利技术一实施例的计算机设备结构示意图。具体实施方式下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。根据本专利技术的实施方式,提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统。在本专利技术实施例中,需要说明的术语有:局部敏感哈希:LSH算法基于一个假设,如果两个文本在原有的数据空间是相似的,那么分别经过哈希函数转换以后的它们也具有很高的相似度。相反,如果它们本身是不相似的,那么经过转换后它们应仍不具有相似性。用户本文档来自技高网...

【技术保护点】
1.一种基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,该方法包括:/n采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;/n获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;/n根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;/n记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;/n当新用户登录跨境APP时,检测用户类型;/n如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;/n如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;/n在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。/n

【技术特征摘要】
1.一种基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,该方法包括:
采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
当新用户登录跨境APP时,检测用户类型;
如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;
如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。


2.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品,包括:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品,得到第一热门产品。


3.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。


4.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据,包括:
获取产品自带信息;
利用spark计算引擎对所述产品自带信息进行整合;
将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。


5.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示,包括:
在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品。


6.根据权利要求5所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。


7.一种基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,该系统包括:
数据采集模块,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
产品信息处理模块,用于获取产品自带信息,对所述产品自带信息进行整合,并将...

【专利技术属性】
技术研发人员:狄潇然
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1