【技术实现步骤摘要】
基于局部敏感哈希的用户冷启动产品推荐方法及系统
本专利技术涉及数据处理
,尤指一种基于局部敏感哈希的用户冷启动产品推荐方法及系统。
技术介绍
随着互联网的发展,跨境APP面临着严重的信息过载问题,推荐系统作为解决跨境场景下信息过载有效手段之一,可利用用户与跨境APP的交互记录为用户推荐其可能喜欢的物品。在现有技术中,当新用户登录到银行系统中时,比较常用的推荐方式有两种:1、随机推荐方式,当新用户进入银行系统中时,推荐算法在物品库中随机选择若干个物品推荐给用户;这种方式没有利用用户与银行系统的任何交互信息,推荐结果往往无法令用户满意。2、筛选出与当前登录用户最相近的一批用户,并根据这批用户的偏好信息为登录用户进行推荐。由于“游客”类用户没有任何信息,难以计算相似用户的情况。此外,当用户量大量增加时,用户相似度的计算量迅速增加,耗费资源。因此,由于新用户没有或者只有少量记录、信息,推荐系统很难为他们进行合理的推荐,严重影响用户首次使用跨境APP时的体验,增加客户流失的风险。综上来看,亟需一种可以克服上述问题,改善用户冷启动登录体验的技术方案。
技术实现思路
为克服上述问题,本专利技术提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统,该方法及系统利用局部敏感哈希算法得到产品之间的相似度,通过采集产品热度及用户感兴趣的标签给新用户推荐首次曝光产品,当用户与曝光产品发生交互时,通过计算好的产品相似度进行曝光产品的更新,该推荐处理的过程中采用的局部敏感哈希 ...
【技术保护点】
1.一种基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,该方法包括:/n采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;/n获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;/n根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;/n记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;/n当新用户登录跨境APP时,检测用户类型;/n如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;/n如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;/n在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。/n
【技术特征摘要】
1.一种基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,该方法包括:
采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
当新用户登录跨境APP时,检测用户类型;
如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;
如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
2.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品,包括:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品,得到第一热门产品。
3.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。
4.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据,包括:
获取产品自带信息;
利用spark计算引擎对所述产品自带信息进行整合;
将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。
5.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示,包括:
在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品。
6.根据权利要求5所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。
7.一种基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,该系统包括:
数据采集模块,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
产品信息处理模块,用于获取产品自带信息,对所述产品自带信息进行整合,并将...
【专利技术属性】
技术研发人员:狄潇然,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。