一种信息推荐方法及装置、计算机可读存储介质制造方法及图纸

技术编号:21034677 阅读:19 留言:0更新日期:2019-05-04 05:33
本发明专利技术实施例公开了一种信息推荐方法及装置、计算机可读存储介质,所述信息推荐方法包括:获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。

【技术实现步骤摘要】
一种信息推荐方法及装置、计算机可读存储介质
本专利技术涉及大数据分析与计算领域,尤其涉及一种信息推荐方法及装置、计算机可读存储介质。
技术介绍
互联网的蓬勃发展带来了海量信息的爆发,为了提高用户在海量信息中有针对性地获取所需信息的效率,可以通过留存分析用户兴趣获得用户需求,进而有针对性的推荐用户感兴趣的信息。目前主流的留存分析计算方法是对数据进行采集,上传至高吞吐量的分布式发布订阅消息系统,用于处理网站中的所有动作流数据,如网页浏览、搜索或者其他访问对象的访问数据,该留存分析使用Hive脚本语言,根据用户主动标识、用户关注关系或者分析用户特征来获取推荐信息。然而,现有的留存分析计算方法为一种T+1模式的离线计算模型,对离线的数据进行留存分析,存在准确度低的问题,且现有的留存分析仅仅基于留存分析结果直接获取推荐信息,存在信息推荐缺乏灵活性的问题。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种信息推荐方法及装置、计算机可读存储介质,能够基于访问对象进行有针对性的推荐,提升了信息推荐的灵活性。本专利技术的技术方案是这样实现的:第一方面,本专利技术实施例提供一种信息推荐方法,所述方法包括:获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。第二方面,本专利技术实施例提供一种信息推荐装置,所述装置包括:获取单元,用于获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;确定单元,用于根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;聚类单元,用于根据所述各访问方对于所述各被访问对象的访问留存量,对所述各访问方进行聚类;推荐单元,用于根据聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。第三方面,本专利技术实施例提供一种信息推荐装置,其中,所述信息推荐装置至少包括处理器、存储有所述处理器可执行指令的存储器、通信接口,以及用于连接所述处理器、所述存储器和所述通信接口的总线,当所述指令被执行时,所述处理器执行时实现上述实施例提供的信息推荐方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的信息推荐方法。本专利技术实施例提供了一种信息推荐方法及装置、计算机可读存储介质,该信息推荐方法包括:获取实时流数据;实时流数据包括:各被访问对象的标识与各访问方对于各被访问对象的登录时刻的映射关系;根据映射关系,确定各访问方对于各被访问对象的访问留存量;根据访问留存量,对各访问方进行聚类,得到聚类结果;根据聚类结果,向各访问方推荐与聚类中心相对应的被访问对象。也就是说,一方面,本专利技术实施例获取实时流数据,能够基于实时流数据进行实时有效的留存分析,另一方面,在获取访问留存信息之后,还利用留存信息对各访问方进行聚类,并针对聚类结果进行信息推荐,如此,能够基于各访问方进行有针对性的推荐,提高了信息推荐的灵活性和准确性。附图说明图1为本专利技术实施例提供的一种信息推荐方法的实现流程示意图一;图2为本专利技术实施例提供的一种信息推荐方法的实现流程示意图二;图3为本专利技术实施例提供的一种信息推荐方法的实现流程示意图三;图4为本专利技术实施例提供的一种信息推荐方法的实现流程示意图四;图5为本专利技术实施例提供的一种信息推荐方法的实现流程示意图五;图6为本专利技术实施例提供的一种信息推荐方法的实现流程示意图六;图7为本专利技术实施例提供的一种信息推荐方法的实现流程示意图七;图8为本专利技术实施例提供的一种信息推荐装置组成结构示意图一;图9为本专利技术实施例提供的一种信息推荐装置组成结构示意图二。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例一本专利技术实施例提供一种信息推荐方法,应用于信息推荐装置中,图1为本专利技术实施例提供的一种信息推荐方法的实现流程示意图一,如图1所示,在本专利技术实施例提供的一种信息推荐方法中的信息推荐装置实现信息推荐方法可以包括步骤101至步骤104。如下:步骤101、获取实时流数据。本专利技术实施例中,为了解决目前的留存分析采用离线计算模型存在的计算数据量大和无法得到实时有效留存分析的问题,本专利技术实施例通过信息推荐装置获取实时流数据,其中,实时流数据包括:各被访问对象的标识与各访问方对于各被访问对象的登录时刻的映射关系。需要说明的是,信息推荐装置包括实时流系统和业务系统,该实时流系统是将业务系统产生的数据进行实时收集,交由流处理框架进行数据处理、统计,入库,并通过可视化的方式对统计结果进行实时展示;留存分析是判断各访问方访问各被访问对象是否持久的一种统计方法,可以最直观的监测到各访问方是否转化成为稳定的访问方,从而让各被访问对象的运营商以及开发了解访问方对各被访问对象的吸引程度。本专利技术实施例中,上述各被访问对象的标识用于表征访问方访问各被访问对象上的页面或者元素。需要说明的是,在访问方进行访问的过程中,访问类型包括注册访问类型和登录访问类型,依据不同的访问类型,对应的处理方式不同,因此,本专利技术实施例在获取实时流之前需要先确定访问方的访问类型。进一步,本专利技术实施例中信息推荐装置获取实时数据流可以包括:获取各访问方访问各访问对象的访问信息;当确定访问类型为登录访问时,获取各被访问对象的登录时刻;根据登录时刻和各被访问对象的标识,获取实时流数据。需要说明的是,访问信息包括各访问对象的标识和访问类型,访问类型用于表征各访问方的访问行为是登录访问还是注册访问,当确定是登录类型时,获取访问标识和登录时刻,生成的实时数据流可以是Login—访问方—登录时刻—被访问对象的标识;当确定是注册类型时,表明该用户刚注册,需要记录下一次登录时刻,进而得到实时流数据。示例性的,实时数据流可以是Login—a—2018-06-26—A页面。步骤102、根据映射关系,确定各访问方对于各被访问对象的访问留存量。本专利技术实施例中,信息推荐装置在获取实时流数据之后,根据映射关系,确定各访问方对于各被访问对象的访问留存量。需要说明的是,访问留存量可以表示为访问方—第一次登录时刻—登录时间差—被访问对象的标识—次数,其中,登录时间差是根据各访问方对于各被访问对象的登录时刻确定的,次数是根据各访问方在该登录时刻访问各访问对象的次数确定的。示例性地,访问留存量可以是a—2018-06-24—10—A页面—n,通过该访问留存量可以得到访问方a在第一次登录被访问对象为2018-06-24之后,间隔10天访问该被访问对象的标识对应的A页面的次数为n。需要说明的是,信息推荐装置根据映射关系,确定各访问方对于各被访问对象的访问留存量可以包括:对预设时间段内的实时数据流对应的映射关系进行去重处理,得到去重后的映射关系;对去重后的映射关系进行留存分析,得到各访问方对于各被访问对象的访问留存量,其中访问留存量包括被访问对象的留存量和访问方留存量。步骤103、根据访问留存量,对各访问方进行聚类本文档来自技高网...

【技术保护点】
1.一种信息推荐方法,其特征在于,所述方法包括:获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,所述方法包括:获取实时流数据;所述实时流数据包括:各被访问对象的标识与各访问方对于所述各被访问对象的登录时刻的映射关系;根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量;根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果;根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象。2.根据权利要求1所述的方法,其特征在于,所述根据所述映射关系,确定所述各访问方对于所述各被访问对象的访问留存量,包括:根据所述映射关系,确定所述各访问方访问所述各被访问对象的访问次数;根据所述访问次数以及所述各访问方访问所述各被访问对象的登录时刻,确定所述各访问方对于所述各被访问对象的访问留存量。3.根据权利要求1所述的方法,其特征在于,所述根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果之前,还包括:根据所述访问方在预定时间长度内对于所述各被访问对象的访问留存量是否低于预设值,判定所述各访问方的类型。4.根据权利要求1所述的方法,其特征在于,所述根据所述访问留存量,对所述各访问方进行聚类,得到聚类结果,包括:根据所述各被访问对象,设定初始质心;根据所述访问留存量和所述初始质心,对所述各访问方进行聚类,得到所述聚类结果。5.根据权利要求1所述的方法,其特征在于,所述根据所述聚类结果,向所述各访问方推荐与聚类中心相对应的被访问对象,包括:根据所述聚类结果,确定所述各访问方所属于的聚类中心;从所述各访问对象中,获取与所述聚类中心对应的被访问对象;向所述各访问方推荐所述被访问对象。6.根据权利要求2所述的方法,其特征在于,所述根据所述访问次数以及所述各访问方访问所述各被访问对象的登录时刻,确定所述各访问方对于所述...

【专利技术属性】
技术研发人员:曲之琳李琳吴耀华李小海
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1