根据用户行为和用户画像构建推荐引擎的方法技术

技术编号:24169353 阅读:21 留言:0更新日期:2020-05-16 02:26
本申请公开了一种根据用户行为和用户画像构建推荐引擎的方法,涉及数据统计技术领域,该方法一具体实施方式包括步骤:采集用户信息以及房源信息;用户信息包括用户行为信息,预设频率阈值,用户行为的操作频率大于各类型对应频率阈值时为有效用户行为信息;还包括用户画像信息,用户画像信息包括用户消费信息和用户偏好信息;生成第一召回数据源和第二召回数据源,根据LBS服务生成第一推荐数据源,通过Spark分布式框架进行特征工程处理得到第二推荐数据源训练得到排序模型得到第一推荐房源,同时依据房主需求生成第二推荐房源,构建推荐引擎。该实施方式通过设置频率阈值,提高用户行为信息的准确性和高效性,以及提高训练模型的准确性。

A method of building recommendation engine based on user behavior and user profile

【技术实现步骤摘要】
根据用户行为和用户画像构建推荐引擎的方法
本申请涉及数据统计
,尤其涉及一种根据用户行为和用户画像构建推荐引擎的方法。
技术介绍
随着互联网的发展,用户的兴趣越来越广泛,且随着用户所处环境及生活水平的改变,用户的需求也在发生改变。目前,基于LBS(LocationBasedServices,基于位置的服务)推荐引擎召回和排序方法在长租公寓领域适用性存在的问题:1、当前长租公寓采集用户信息一般只根据用户的线上记录,渠道单一,造成用户信息遗漏,样本信息库缺失;2、召回方式行业内整体上是倒排索引加用户行为召回,未考虑高质量公寓所具有的优质地块价格等大宗标的物属性;3、粗排层内通用推荐粗排阶段未针对高价值稀疏标的的场景做优化,长租公寓场景需要多层粗排序,既需要针对客户强意图和标的物关键属性的匹配做LBS和价值匹配策略,又需要对用户次要需求和房屋次要房态、地段特征做匹配策略;4、排序层业界普遍基于用户线上行为做pair-wise或list-wise的LearningToRank模型排序。但是长租公寓除了需要考虑用户线上反馈还需要考虑带看、签约等情况,排序模型会更复杂,需要基于对排序模型做多级样本权重刻画,同时样本的高度稀疏性和交易的大额属性,需要对区域、房态等场景做深度细分,提升推荐质量;5、干预调整层业界普遍基于竞价排名的方式做精准的广告插入,并未基于长租公寓特有的LBS方式建模,推荐效果不理想。
技术实现思路
有鉴于此,本申请公开了一种根据用户行为和用户画像构建推荐引擎的方法,包括步骤:采集用户信息以及房源信息;所述用户信息包括用户行为信息,统计预设时期内的所述用户行为信息的类型和各类型对应的所述用户行为的操作频率,预设频率阈值,所述用户行为的操作频率大于各类型对应所述频率阈值时,所述用户行为信息包括有效用户行为信息;其中,所述用户行为信息的类型包括用户浏览网页信息和用户租住时长;所述用户信息还包括用户画像信息,所述用户画像信息包括用户消费信息和用户偏好信息;所述房源信息根据所述有效用户行为信息划分为实时用户行为信息和历史用户行为信息;将所述实时用户行为信息进行审查和校验,根据分布式流处理开源框架实时进入在线数据库;将所述历史用户行为信息生成日志,并将所述日志通过Spark框架计算引擎批量入离线数据仓库;所述在线数据库和所述离线数据仓库生成第一召回数据源;所述房源信息根据所述用户画像信息召回,通过离线数据仓库内置的光盘、以及通过LBS进行筛选得到第二召回数据源;将所述第一召回数据源和所述第二召回数据源根据LBS服务做价值匹配和地段特征匹配,得到相应的匹配度,依据所述匹配度依次从高到低排序生成第一推荐数据源;将所述第一推荐数据源通过Spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源;将所述第二推荐数据源训练得到排序模型;将所述房源信息输入到所述排序模型,得到所述房源信息的评分排序情况;设置评分阈值,所述房源信息的评分大于所述评分阈值的所述房源为第一推荐房源;同时依据房主需求生成第二推荐房源;根据所述第一推荐房源和所述第二推荐房源构建推荐引擎。优选的,通过线上、线下以及电销的方式采集所述用户信息。优选的,所述第一推荐房源的数量大于所述第二推荐房源的数量。优选的,所述第一推荐房源的数量与所述第二推荐房源的数量的比值为5∶1。优选的,所述特征工程处理包括将所述第一推荐数据源依次通过汇聚、提炼加工、筛选以及补全得到所述第二推荐数据源。优选的,所述将所述房源信息输入到所述排序模型,得到所述房源信息的评分排序情况包括:将所述房源信息进行权重刻画,根据所述房源信息的稀疏性和交易属性对区域、房态等场景做深度的划分,得到所述房源信息的评分排序情况。优选的,所述推荐引擎中还包括热点房源。与现有技术相比,本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,达到如下有益效果:1、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,设置用户行为操作的频率阈值,可以提高用户行为信息的准确性以及高效性。2、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,通过限定第一推荐房源和第二房源的关系可以有利于提高长租公寓的收益。3、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,采集信息渠道丰富,包括用户线上APP记录、线下带看沟通、电销方式;采集大量用户信息,生成整体的样本模型,涵盖高质量长租公寓具有的优质地块价格等大宗标的物属性。4、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,优化个性化推荐模式,通过对用户的行为和画像综合测算,在样本模型库中提取推荐匹配度较高的公寓。5、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,优化推荐排序模型,对线上,线下的带看、签约等情况制定新的匹配策略,对排序模型做多级样本权重刻画,降低现有排序模型的复杂度;同时针对样本的高度稀疏性和交易的大额属性对区域、房态等场景深度细分,提高推荐公寓质量。6、本专利技术提供的根据用户行为和用户画像构建推荐引擎的方法,优化干预调整层,基于长租公寓特有的LBS方式建模,设计出地块分布稀疏的大宗商品的长租公寓的特色推荐引擎。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本专利技术根据用户行为和用户画像构建推荐引擎的方法的一种流程图;图2为本专利技术根据用户行为和用户画像构建推荐引擎的方法的又一种流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。应注意到,所描述的实施例实际上仅仅是本专利技术一部分实施例,而不是全部的实施例,且实际上仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。本申请的保护范围当视所附权利要求所界定者为准。实施例1:图1为本专利技术根据用户行为和用户画像构建推荐引擎的方法的一种流程图,如图1所示,本实施例提供的一种根据用户行为和用户画像构建推荐引擎的方法,包括步骤:步骤101,采集用户信息以及房源信息;用户信息包括用户行为信息,统计预设时期内的用户行为信息的类型和各类型对应的用户行为的操作频率,预设频率阈值,用户行为的操作频率大于各类型对应频率阈值时,用户行为信息包括有效用户行为信息;其中,用户行为信息的类型包括用户浏览网页信息和用户租住时长;用户信息还包括和用户画像信息,用户画像信息包括用户消费信息和用户偏好信息;可以理解的是,当用户使用app浏览到一个房屋信息时,看误实际并不需要时,这是操作是无效的,当浏览一个房屋信息超过一定频率时,或者浏览同类房屋超过一定频率时,可以明确知道用户希望本文档来自技高网...

【技术保护点】
1.一种根据用户行为和用户画像构建推荐引擎的方法,其特征在于,包括步骤:/n采集用户信息以及房源信息;/n所述用户信息包括用户行为信息,统计预设时期内的所述用户行为信息的类型和各类型对应的所述用户行为的操作频率,预设频率阈值,所述用户行为的操作频率大于各类型对应所述频率阈值时,所述用户行为信息包括有效用户行为信息;其中,所述用户行为信息的类型包括用户浏览网页信息和用户租住时长;/n所述用户信息还包括用户画像信息,所述用户画像信息包括用户消费信息和用户偏好信息;所述房源信息根据所述有效用户行为信息划分为实时用户行为信息和历史用户行为信息;将所述实时用户行为信息进行审查和校验,根据分布式流处理开源框架实时进入在线数据库;将所述历史用户行为信息生成日志,并将所述日志通过Spark框架计算引擎批量入离线数据仓库;所述在线数据库和所述离线数据仓库生成第一召回数据源;/n所述房源信息根据所述用户画像信息召回,通过离线数据仓库内置的光盘、以及通过LBS进行筛选得到第二召回数据源;/n将所述第一召回数据源和所述第二召回数据源根据LBS服务做价值匹配和地段特征匹配,得到相应的匹配度,依据所述匹配度依次从高到低排序生成第一推荐数据源;/n将所述第一推荐数据源通过Spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源;/n将所述第二推荐数据源训练得到排序模型;/n将所述房源信息输入到所述排序模型,得到所述房源信息的评分排序情况;/n设置评分阈值,所述房源信息的评分大于所述评分阈值的所述房源为第一推荐房源;/n同时依据房主需求生成第二推荐房源;/n根据所述第一推荐房源和所述第二推荐房源构建推荐引擎。/n...

【技术特征摘要】
1.一种根据用户行为和用户画像构建推荐引擎的方法,其特征在于,包括步骤:
采集用户信息以及房源信息;
所述用户信息包括用户行为信息,统计预设时期内的所述用户行为信息的类型和各类型对应的所述用户行为的操作频率,预设频率阈值,所述用户行为的操作频率大于各类型对应所述频率阈值时,所述用户行为信息包括有效用户行为信息;其中,所述用户行为信息的类型包括用户浏览网页信息和用户租住时长;
所述用户信息还包括用户画像信息,所述用户画像信息包括用户消费信息和用户偏好信息;所述房源信息根据所述有效用户行为信息划分为实时用户行为信息和历史用户行为信息;将所述实时用户行为信息进行审查和校验,根据分布式流处理开源框架实时进入在线数据库;将所述历史用户行为信息生成日志,并将所述日志通过Spark框架计算引擎批量入离线数据仓库;所述在线数据库和所述离线数据仓库生成第一召回数据源;
所述房源信息根据所述用户画像信息召回,通过离线数据仓库内置的光盘、以及通过LBS进行筛选得到第二召回数据源;
将所述第一召回数据源和所述第二召回数据源根据LBS服务做价值匹配和地段特征匹配,得到相应的匹配度,依据所述匹配度依次从高到低排序生成第一推荐数据源;
将所述第一推荐数据源通过Spark分布式框架进行特征工程处理并进行评分得到第二推荐数据源;
将所述第二推荐数据源训练得到排序模型;
将所述房源信息输入到所述排序模型,得到所述房源信息的评分排序情况;
设置评分阈值...

【专利技术属性】
技术研发人员:李昭陈浩高靖崔岩卢述奇陈呈张宵
申请(专利权)人:青梧桐有限责任公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1