【技术实现步骤摘要】
在线实时用户画像生成方法
本专利技术涉及一种在线实时用户画像生成方法。
技术介绍
用户画像的生成是用户个性化推荐系统的第一步,现有的用户画像生成系统,多是离线处理用户行为日志,定时产生或更新用户画像。这种画像产生方式,不能及时跟踪用户的偏好变化,推荐效果不能及时跟进,给用户的感觉不够敏感,现有的用户画像生成系统,多是离线处理用户行为日志,定时产生或更新用户画像。现有画像产生方式,不能及时跟踪用户的偏好变化,推荐效果不能及时跟进,给用户的感觉不够敏感。
技术实现思路
为克服现有技术的缺陷,本专利技术提供一种在线实时用户画像生成方法,本专利技术的技术方案是:在线实时用户画像生成方法,包括以下步骤:(1)对用户日志流数据化,形成流数据;(2)对流数据进行处理;(3)画像的热存储。所述的步骤(1)具体为:把收集的用户行为日志直接存入消息队列,即把原始的用户行为日志流数据化,包括以下步骤:a、实时读取日志文件产生的新数据;b、将日志文件解析,将每一条日志转化成包含所有预设字段的键值对;c、把键值对序列化成json格式,存入消息队列;所述的步骤(2)具体为:使用流计算模式,处理流程如下:1)日志数据校验,排除不包含有效行为的垃圾数据;有效行为包括点击,订阅和收藏;2)行为数据校验,检测行为日志的附带属性,排除不包含有效属性的日志;3)对历史画像提取并反序列化,从存储的消息队列中提取当前用户的历史画像,并将历史画像作为加载对象;具体为:a、从画像库中读取用户的历史画像数据;b、用读出的画像信息实例画一个新的画像对象;4)新行为日志更新;5)更新后的画像序列化入库。所述的步骤 ...
【技术保护点】
在线实时用户画像生成方法,其特征在于,包括以下步骤:(1)对用户日志流数据化,形成流数据;(2)对流数据进行处理;(3)画像的热存储。
【技术特征摘要】
1.在线实时用户画像生成方法,其特征在于,包括以下步骤:(1)对用户日志流数据化,形成流数据;(2)对流数据进行处理;(3)画像的热存储。2.根据权利要求1所述的在线实时用户画像生成方法,其特征在于,所述的步骤(1)具体为:把收集的用户行为日志直接存入消息队列,即把原始的用户行为日志流数据化,包括以下步骤:a、实时读取日志文件产生的新数据;b、将日志文件解析,将每一条日志转化成包含所有预设字段的键值对;c、把键值对序列化成json格式,存入消息队列。3.根据权利要求1所述的在线实时用户画像生成方法,其特征在于,所述的步骤(2)具体为:使用流计算模式,处理流程如下:1)日志数据校验,排除不包含有效行为的垃圾数据;有效行为包括点击,订阅和收藏;2)行为数据校验,检测行为日志的附带属性,排除不包含有效属性的日志;3)对历史画像提取并反序列化,从存储的消息队列中提取当前用户的历史画像...
【专利技术属性】
技术研发人员:白峻峰,张文战,刘子曜,苏伟杰,
申请(专利权)人:北京诸葛找房信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。