【技术实现步骤摘要】
用于实时推荐的Flink流式处理引擎方法、装置及计算机设备
本申请涉及大数据推荐
,尤其涉及一种用于实时推荐的Flink流式处理引擎方法、装置及计算机设备。
技术介绍
随着用户体验的升级,推荐的实时性要求也相应的越来越高。传统的两层式推荐架构(应用层、离线层)会导致应用层功能复杂、响应超时以及数据不一致的现象产生。此外,在离线层实现推荐虽然快速但推荐时间精度只能到天;而由于用户的兴趣一般随着时间衰减急剧减小,如果不能在第一时间推送给用户感兴趣的物品则会导致转化率下降乃至用户流失。这使得构建一套能够实时分析用户行为并进行预测的实时推荐系统,使系统能够及时响应就变得非常有价值。实时推荐指的是可以实时感知用户行为的变化,并且根据用户实时产生的用户行为给用户推送精准的内容。目前典型的推荐系统分为三层架构,即:在线、近线和离线。通过离线或者近线的模型训练,近线的实时特征工程以及召回、排序,最后由在线层进行业务强制干扰以及兜底,充分体现了其在海量场景高速响应方面的价值。基于流式处理的推荐算法引擎则在近线部分处于核心 ...
【技术保护点】
1.一种用于实时推荐的Flink流式处理引擎方法,其特征在于,包括:/n根据计算模型文件对消息队列中的日志进行短期特征计算,将计算得到的短期特征存储到分布式存储层,所述分布式存储层存储有预先获取的长期特征;/n在接收到来自所述消息队列的事件时,从所述分布式存储层中读取待推荐用户的长期特征以及短期特征;/n根据预测模型文件、所述待推荐用户的长期特征以及短期特征进行实时预测,得到所述待推荐用户的偏好预测结果;/n将所述待推荐用户的偏好预测结果写入所述分布式存储层中。/n
【技术特征摘要】
1.一种用于实时推荐的Flink流式处理引擎方法,其特征在于,包括:
根据计算模型文件对消息队列中的日志进行短期特征计算,将计算得到的短期特征存储到分布式存储层,所述分布式存储层存储有预先获取的长期特征;
在接收到来自所述消息队列的事件时,从所述分布式存储层中读取待推荐用户的长期特征以及短期特征;
根据预测模型文件、所述待推荐用户的长期特征以及短期特征进行实时预测,得到所述待推荐用户的偏好预测结果;
将所述待推荐用户的偏好预测结果写入所述分布式存储层中。
2.根据权利要求1所述的方法,其特征在于,所述根据计算模型文件对消息队列中的日志进行短期特征计算之前,所述方法还包括:
获取配置文件,所述配置文件中包含配置参数;
从模型仓库中加载所述配置参数对应的预先训练好的模型文件,将所述模型文件发送至所述Flink流式处理引擎的各个分布式节点,所述模型文件包括所述计算模型文件及所述预测模型文件。
3.根据权利要求2所述的方法,其特征在于,所述获取配置文件,包括:
从分布式配置集群中同步至少一个配置文件,并将至少一个所述配置文件加载至内存中。
4.根据权利要求2所述的方法,其特征在于,所述从模型仓库中加载所述配置参数对应的模型文件,包括:
从所述配置参数中读取预先配置的模型标识参数,所述模型标识参数包括命名空间、模型名称以及模型版本;
从模型仓库中加载所述模型标识参数对应的模型文件。
5.根据权利要求2所述的方法,其特征在于,
所述根据计算模型文件对消息队列中的日志进行短期特征计算,包括:
通过各个所述分布式节点根据所述计算模型文件对所述日志进行短期特征计算;
所述根据预测模型文件、所述待推荐用户的长期特征以及短期特征进行实时预测,得到所述待推荐用户的偏好预测结果,包括:
通过各个所述分布式节点根据所述预测模型文件,生成预测模型;
将所述待推荐用户的长...
【专利技术属性】
技术研发人员:何肖明,周睿,
申请(专利权)人:苏宁金融科技南京有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。