机器学习模型训练方法、推荐方法、装置及存储介质制造方法及图纸

技术编号:34761791 阅读:35 留言:0更新日期:2022-08-31 19:01
本申请实施例提供了一种机器学习模型训练方法、推荐方法、装置及计算机存储介质,其中,机器学习模型训练方法包括所述样本对象对应的PO I维度特征,以及,所述样本对象对应的场景维度特征和所述样本对象对应的样本对象群体特征两者中的至少一种;对所述PO I维度特征,以及,所述场景维度特征和所述样本对象群体特征两者中的至少一种进行特征融合,并对融合后的特征进行特征提取,分别获得场景搜索上下文属性特征向量和PO I属性特征向量;基于统计特征、场景搜索上下文属性特征向量和PO I属性特征向量,构建训练样本集;使用训练样本集,对机器学习模型进行训练。对机器学习模型进行训练。对机器学习模型进行训练。

【技术实现步骤摘要】
机器学习模型训练方法、推荐方法、装置及存储介质


[0001]本申请实施例涉及计算机
,尤其涉及一种机器学习模型训练方法、推荐方法、对应的装置及计算机存储介质。

技术介绍

[0002]个性化推荐是一种基于海量数据挖掘,以便为目标对象提供个性化的决策支持或信息服务的技术。随着通信技术的发展,越来越多的设备和应用还提供了基于LBS(Location Based Services,基于位置的服务)的个性化推荐服务。LBS是利用定位技术获取设备位置,并通过移动互联网向设备提供信息资源和基础服务的技术。
[0003]基于LBS的个性化推荐与经典推荐场景相比,因基于位置导致其数据稀疏,无法为机器学习模型的训练提供充足的训练样本。具体地,经典推荐场景如商品推荐场景,注重目标对象历史行为的挖掘和学习,可以根据目标对象对商品的点击、浏览等行为,向目标对象推荐商品,而基于LBS的推荐场景中,如地图导航应用的推荐场景中,目标对象对地图导航应用的推荐场景使用频率相对商品推荐低很多,并且,推荐结果和地理位置强相关,从而导致目标对象的数据和行为分布稀疏和分散。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器学习模型训练方法,包括:获取样本对象的统计特征,其中,所述统计特征包括所述样本对象对应的POI维度特征,以及,所述样本对象对应的场景维度特征和所述样本对象对应的样本对象群体特征两者中的至少一种;对所述POI维度特征,以及,所述场景维度特征和所述样本对象群体特征两者中的至少一种进行特征融合,并对融合后的特征进行特征提取,分别获得场景搜索上下文属性特征向量和POI属性特征向量;基于所述统计特征、所述场景搜索上下文属性特征向量和所述POI属性特征向量,构建训练样本集;使用所述训练样本集,对机器学习模型进行训练,以使训练完成的机器学习模型输出所述推荐对象的排序。2.根据权利要求1所述的方法,其中,所述POI维度特征包括:基于所述样本对象的历史POI操作数据获得的POI热度特征;所述场景维度特征包括:基于所述样本对象在不同场景下的历史操作转化至预设的推荐对象的第一转化特征;所述样本对象群体特征包括:基于所述样本对象所属的群体个性化特征数据转化至所述推荐对象的第二转化特征。3.根据权利要求2所述的方法,其中,所述不同场景通过不同的场景信息表征,所述场景信息包括:所述样本对象的位置信息、所述历史操作对应的时间信息、和所述历史操作对应的图面状态信息。4.根据权利要求2所述的方法,其中,所述对所述POI维度特征,以及,所述场景维度特征和所述样本对象群体特征两者中的至少一种进行特征融合,并对融合后的特征进行特征提取,分别获得场景搜索上下文属性特征向量和POI属性特征向量,包括:对所述POI热度特征、所述第一转化特征和所述第二转化特征进行特征拼接,并将拼接后的特征输入双塔模型进行特征提取,分别获得场景搜索上下文属性特征向量和POI属性特征向量。5.根据权利要求2所述的方法,其中,在所述基于所述统计特征、所述场景搜索上下文属性特征向量和所述POI属性特征向量,构建训练样本集之前,所述方法还包括:获取基于POI区域的负训练样本及所述样本对象的个性化特征数据,其中,所述负训练样本为所述POI维度特征对应的POI区域中与POI定位无关的样本,和/或,除所述POI维度特征、所述场景维度特征和所述样本对象群体特征之外的其他统计特征;所述基于所述统计特征、所述场景搜索上下文属性特征向量和所述POI属性特征向量,构建训练样本集,包括:基于所述统计特征、所述场景搜索上下文属性特征向量、所述POI属性特征向量、所述样本对象的个性化特征数据,和所述负训练样本,构建训练样本集。6.根据权利要求2

5任一项所述的方法,其中,所述POI热度特征通过以下方式获取:根据地理位置分片和时间窗口分片,统计对应的POI的点击量和/或点击率;根据所述点击量和/或点击率,获得所述POI热度特征。7.根据权利要求6所述的方法,其中,所述根据所述点击量和点击率,获得所述POI热度
特征,包括:对所述点击率进行贝叶斯平滑处理,根据所述点击量和处理后的所述点击率,获得所述POI热度特征。8.根据权利要求2

5任一项所述的方法,其中,所述第一转化特征通过以下方式获取:根据所述样本对象在不同场景下的地理位置分片的维度和时间窗口分片,统计所述样本对象的POI点击率和/或点击占比;根据所述点击率和/或点击占比,以及所述POI对应的推荐对象信息,获得所述第一转化特征。9.根据权利要求2

5任一项所述的方法,其中,所述第二转化特征通过以下方式获取:获得多个地理范围中的各个地理范围内的样本对象的个性化特征数据;根据所述个性化特征数据,将所述样本对象划分为多个群体;获取所述多个群体分别在所述各个地理范围内的POI点击率和/或点击占比;根据所述样本对象所在的群体对...

【专利技术属性】
技术研发人员:韩丹张晓光
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1