模型生成方法、餐馆排序方法、系统、设备和介质技术方案

技术编号:24998051 阅读:35 留言:0更新日期:2020-07-24 18:00
本发明专利技术公开了一种模型生成方法、餐馆排序方法、系统、设备和介质,通过获取多个用户的历史数据和多个餐馆的历史数据,基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;利用训练集中的训练数据对XGBOOST模型进行训练,以生成餐馆点击概率预测模型,进一步利用该模型预测用户点击餐馆的概率,对比现有技术中按距离排序出来的餐馆,本发明专利技术能够预测用户点击餐馆的概率,且在对餐馆进行排序时引入了多个考虑因素,包括用户维度特征、餐馆维度特征以及对应的用户餐馆偏好分,实现了餐馆按照用户个性化需求进行排序,为用户提供了与需求相匹配的餐馆。

【技术实现步骤摘要】
模型生成方法、餐馆排序方法、系统、设备和介质
本专利技术涉及OTA(OnlineTravelAgency,在线旅行社)平台的信息处理
,特别涉及一种模型生成方法、餐馆排序方法、系统、设备和介质。
技术介绍
目前对于酒店周边美食的排序,主要是基于酒店到餐馆距离的排序方法,这种方法着重考虑了距离的因素,但缺乏对用户偏好的考虑,不同用户对于餐馆价格、人气、风味菜系的需求不同,只按距离排序出来的餐馆不一定适合用户本身的消费偏好,与用户的需求匹配度低,排序方法不具有个性化需求。酒店周边美食是一种吸引用户下该酒店的重要参考因素,通过提升餐馆和用户的匹配度,进而提升酒店销量,提升用户体验,提高用户对品牌的满意度和忠诚度的目的。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中按距离排序出来的餐馆不一定适合用户本身的消费偏好,与用户的需求匹配度低的缺陷,提供一种模型生成方法、餐馆排序方法、系统、设备和介质。本专利技术是通过下述技术方案来解决上述技术问题:本专利技术提供了一种模型生成方法,所述模型生成方法包括:获取多个用户的历史数据和多个餐馆的历史数据;基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;其中,所述用户餐馆偏好分用于表征用户对餐馆的偏好程度;生成训练集,所述训练集中包括多组训练数据,每组训练数据均包括一组模型输入数据以及对应的模型输出数据,所述模型输入数据包括用户维度特征、餐馆维度特征以及对应的用户餐馆偏好分,对应的模型输出数据根据用户是否点击过餐馆页面标记为1或0;利用训练集中的训练数据对XGBOOST模型进行训练,以生成餐馆点击概率预测模型,所述餐馆点击概率预测模型用于预测用户点击餐馆的概率。较佳地,所述用户维度特征包括用户点击浏览餐馆情况、用户收藏预订餐馆情况和用户本身的基本属性;所述餐馆维度特征包括餐馆本身的基本属性。较佳地,所述获取每个用户对每个餐馆的用户餐馆偏好分的步骤包括:获取所述用户的第一历史数据,所述第一历史数据包括用户停留餐馆页面时长,用户点击餐馆的图片、所述用户对餐馆的评论;将所述用户的第一历数据输入至矩阵分解模型进行训练,以得到用户隐向量和餐馆隐向量;基于所述用户隐向量和餐馆隐向量,根据偏好分计算公式计算用户餐馆偏好分;所述偏好分计算公式如下:其中,ui表示用户隐向量,vi表示餐馆隐向量,n表示用户隐变量和餐馆隐变量的维度。本专利技术还提供了一种餐馆排序方法,所述餐馆排序方法用于对与酒店相对应的餐馆进行排序,所述餐馆排序方法包括:获取目标用户,并根据所述目标用户确定至少一个目标酒店;从与每个所述目标酒店对应的餐馆中选取多个目标餐馆;针对每个目标餐馆生成一组对应的待预测数据,所述待预测数据包括所述目标用户的用户维度特征、所述目标餐馆的餐馆维度特征以及所述目标用户对所述目标餐馆的用户餐馆偏好分;将每个目标餐馆对应的待预测数据输入至所述餐馆点击概率预测模型预测目标用户点击每一个目标餐馆的概率;所述餐馆点击概率预测模型使用前述的餐馆点击概率预测模型的生成方法生成。基于用户点击每一个目标餐馆的概率,对所述多个目标餐馆进行排序。较佳地,所述获取与所述目标酒店对应的多个目标餐馆的步骤包括:计算所述目标餐馆到所述目标酒店的距离,并选取所述距离小于第一预设值的目标餐馆,以得到第一目标餐馆;将所述至少一个目标酒店按照价格划分不同档次,从所述第一目标餐馆中选取价格与所述目标酒店档次相匹配的目标餐馆,以得到第二目标餐馆;对所述第二目标餐馆进行综合质量分的评定,并选取所述综合质量分大于第二预设值的目标餐馆作为所述目标酒店对应的目标餐馆。较佳地,所述餐馆排序方法还包括:对与每个所述目标酒店对应的餐馆中除所述目标餐馆之外的餐馆进行综合质量分评定,并按照综合质量分从高到低依次排在所有目标餐馆之后。本专利技术还提供了一种模型生成系统,所述模型生成系统包括:第一获取模块,获取多个用户的历史数据和多个餐馆的历史数据;第二获取模块,基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;其中,所述用户餐馆偏好分用于表征用户对餐馆的偏好程度;第一生成模块,生成训练集,所述训练集中包括多组训练数据,每组训练数据均包括一组模型输入数据以及对应的模型输出数据,所述模型输入数据包括用户维度特征、餐馆维度特征以及对应的用户餐馆偏好分,对应的模型输出数据根据用户是否点击过餐馆页面标记为1或0;训练模块,利用训练集中的训练数据对XGBOOST(ExtremeGradientBoosting,极端梯度提升)模型进行训练,以生成餐馆点击概率预测模型,所述餐馆点击概率预测模型用于预测用户点击餐馆的概率。较佳地,所述用户维度特征包括用户点击浏览餐馆情况、用户收藏预订餐馆情况和用户本身的基本属性;所述餐馆维度特征包括餐馆本身的基本属性。较佳地,所述第二获取模块包括:第一获取单元,获取所述用户的第一历史数据,所述第一历史数据包括用户停留餐馆页面时长,用户点击餐馆的图片、所述用户对餐馆的评论;输入单元,将所述用户的第一历数据输入至矩阵分解模型进行训练,以得到用户隐向量和餐馆隐向量;计算单元,基于所述用户隐向量和餐馆隐向量,根据偏好分计算公式计算用户餐馆偏好分;所述偏好分计算公式如下:其中,ui表示用户隐向量,vi表示餐馆隐向量,n表示用户隐变量和餐馆隐变量的维度。本专利技术还提供了一种餐馆排序系统,所述餐馆排序系统用于对与酒店相对应的餐馆进行排序,所述餐馆排序系统包括:第三获取模块,获取目标用户,并根据所述目标用户确定至少一个目标酒店;选取模块,从与每个所述目标酒店对应的餐馆中选取多个目标餐馆;第二生成模块,针对每个目标餐馆生成一组对应的待预测数据,所述待预测数据包括所述目标用户的用户维度特征、所述目标餐馆的餐馆维度特征以及所述目标用户对所述目标餐馆的用户餐馆偏好分;输入模块,将每个目标餐馆对应的待预测数据输入至所述餐馆点击概率预测模型预测目标用户点击每一个目标餐馆的概率;所述餐馆点击概率预测模型使用前述的餐馆点击概率预测模型的生成方法生成。第一排序模块,基于用户点击每一个目标餐馆的概率,对所述多个目标餐馆进行排序。较佳地,所述选取模块包括:第一选取单元,计算所述目标餐馆到所述目标酒店的距离,并选取所述距离小于第一预设值的目标餐馆,以得到第一目标餐馆;第二选取单元,将所述至少一个目标酒店按照价格划分不同档次,从所述第一目标餐馆中选取价格与所述目标酒店档次相匹配的目标餐馆,以得到第二目标餐馆;第三选取单元,对所述第二目标餐馆进行综合质量分的评定,并选取所述综本文档来自技高网...

【技术保护点】
1.一种模型生成方法,其特征在于,所述模型生成方法包括:/n获取多个用户的历史数据和多个餐馆的历史数据;/n基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;/n其中,所述用户餐馆偏好分用于表征用户对餐馆的偏好程度;/n生成训练集,所述训练集中包括多组训练数据,每组训练数据均包括一组模型输入数据以及对应的模型输出数据,所述模型输入数据包括用户维度特征、餐馆维度特征以及对应的用户餐馆偏好分,对应的模型输出数据根据用户是否点击过餐馆页面标记为1或0;/n利用训练集中的训练数据对XGBOOST模型进行训练,以生成餐馆点击概率预测模型,所述餐馆点击概率预测模型用于预测用户点击餐馆的概率。/n

【技术特征摘要】
1.一种模型生成方法,其特征在于,所述模型生成方法包括:
获取多个用户的历史数据和多个餐馆的历史数据;
基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;
其中,所述用户餐馆偏好分用于表征用户对餐馆的偏好程度;
生成训练集,所述训练集中包括多组训练数据,每组训练数据均包括一组模型输入数据以及对应的模型输出数据,所述模型输入数据包括用户维度特征、餐馆维度特征以及对应的用户餐馆偏好分,对应的模型输出数据根据用户是否点击过餐馆页面标记为1或0;
利用训练集中的训练数据对XGBOOST模型进行训练,以生成餐馆点击概率预测模型,所述餐馆点击概率预测模型用于预测用户点击餐馆的概率。


2.如权利要求1所述的模型生成方法,其特征在于,所述用户维度特征包括用户点击浏览餐馆情况、用户收藏预订餐馆情况和用户本身的基本属性;
所述餐馆维度特征包括餐馆本身的基本属性。


3.如权利要求1所述的模型生成方法,其特征在于,所述获取每个用户对每个餐馆的用户餐馆偏好分的步骤包括:
获取所述用户的第一历史数据,所述第一历史数据包括用户停留餐馆页面时长,用户点击餐馆的图片、所述用户对餐馆的评论;
将所述用户的第一历数据输入至矩阵分解模型进行训练,以得到用户隐向量和餐馆隐向量;
基于所述用户隐向量和餐馆隐向量,根据偏好分计算公式计算用户餐馆偏好分;
所述偏好分计算公式如下:



其中,ui表示用户隐向量,vi表示餐馆隐向量,n表示用户隐变量和餐馆隐变量的维度。


4.一种餐馆排序方法,所述餐馆排序方法用于对与酒店相对应的餐馆进行排序,其特征在于,所述餐馆排序方法包括:
获取目标用户,并根据所述目标用户确定至少一个目标酒店;
从与每个所述目标酒店对应的餐馆中选取多个目标餐馆;
针对每个目标餐馆生成一组对应的待预测数据,所述待预测数据包括所述目标用户的用户维度特征、所述目标餐馆的餐馆维度特征以及所述目标用户对所述目标餐馆的用户餐馆偏好分;
将每个目标餐馆对应的待预测数据输入至所述餐馆点击概率预测模型预测目标用户点击每一个目标餐馆的概率;
所述餐馆点击概率预测模型使用如权利要求1至3任一项所述的餐馆点击概率预测模型的生成方法生成;
基于用户点击每一个目标餐馆的概率,对所述多个目标餐馆进行排序。


5.如权利要求4所述的餐馆排序方法,其特征在于,所述获取与所述目标酒店对应的多个目标餐馆的步骤包括:
计算所述目标餐馆到所述目标酒店的距离,并选取所述距离小于第一预设值的目标餐馆,以得到第一目标餐馆;
将所述至少一个目标酒店按照价格划分不同档次,从所述第一目标餐馆中选取价格与所述目标酒店档次相匹配的目标餐馆,以得到第二目标餐馆;
对所述第二目标餐馆进行综合质量分的评定,并选取所述综合质量分大于第二预设值的目标餐馆作为所述目标酒店对应的目标餐馆。


6.如权利要求4所述的餐馆排序方法,其特征在于,所述餐馆排序方法还包括:
对与每个所述目标酒店对应的餐馆中除所述目标餐馆之外的餐馆进行综合质量分评定,并按照综合质量分从高到低依次排在所有目标餐馆之后。


7.一种模型生成系统,其特征在于,所述模型生成系统包括:
第一获取模块,获取多个用户的历史数据和多个餐馆的历史数据;
第二获取模块,基于历史数据,获取每个用户的用户维度特征、每个餐馆的餐馆维度特征以及每个用户对每个餐馆的用户餐馆偏好分;
其中,所述用户餐馆偏好分用...

【专利技术属性】
技术研发人员:王思博郭松荣罗超胡泓
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1