基于机器学习统计模型的入住酒店附近生活推荐系统方法技术方案

技术编号:16456350 阅读:46 留言:0更新日期:2017-10-25 20:47
本发明专利技术实施例提供了一种基于机器学习统计模型的入住酒店附近生活推荐系统,其特征在于,包括:信息采集模块:用于对用户数据进行采集;对城市地理位置对应相关信息的采集;以及对地图APP程序POI数据采集;数据存储模块:用于对数据进行分类存储,按照格式化的方式存储;存储采集模块采集到的数据以及经过算法模块计算后的数据;算法模块:采用算法DBScan在对数据进行计算和训练;匹配策略模块:执行用户和住所,用户和城市的兴趣地点匹配策略;该匹配策略按照业务逻辑、用户兴趣或用户反馈城市天气进行不同的或者几种结合的策略;推荐引擎模块:用于将所述匹配的兴趣地点坐标数据展示给用户。本发明专利技术还提供了相应的方法。

Recommendation system for living near Check Inn Hotel based on machine learning statistical model

The embodiment of the invention provides a recommendation system statistical machine learning model based on life near the Check Inn Hotel is characterized, including: information acquisition module for collection of user data; the information relating to the city location on the map and the corresponding acquisition program POI APP; data acquisition; data storage module for classification storage the data storage format in accordance with the way of storage; collect the data acquisition module and data module through the algorithm calculation; algorithm module: using DBScan algorithm to calculate and to training data; matching strategy module: user and user interest in city residence, and location matching strategy; the strategy of different or several strategies in accordance with the business logic and user interest or user feedback city weather; recommendation engine model Block: used to display the matched interest location coordinate data to the user. The invention also provides the corresponding method.

【技术实现步骤摘要】
基于机器学习统计模型的入住酒店附近生活推荐系统方法
本专利技术涉及电子商务的数据处理
,具体涉及基于位置的数据推送

技术介绍
对于很多找短租房的人,需要自己做一些旅游攻略,行程安排等。入住一个不熟悉的城市,不了解住处附近有什么吃喝玩乐的地方,不清楚整个城市有什么吃喝玩乐和城市特色的地方。自觉做一些攻略比较耗时和麻烦。本系统根据用户的历史出行行为习惯,之前入住当地用户的出行习惯等资料,为用户提供每次出行入住酒店附近的吃喝玩乐地,入住城市旅游,办公,特色地等出行信息。当前的很多手机APP,只是针对本地的出行特色信息进行发送,也只有位置或者好评率这几个简单的指标进行排序。用户需要自己进行搜索,从大量的信息中筛选出自己需要的出行信息。这对于初到一个陌生地方的用户来说,实在是一件非常困扰的事情。
技术实现思路
为解决上述技术问题,为用户快速的寻找其真正需要的特色出行信息;本专利技术实施例提出了一种基于机器学习统计模型的入住酒店附近生活推荐系统,其特征在于,包括:信息采集模块:用于对用户数据进行采集;对城市地理位置对应相关信息的采集;以及对地图APP程序POI数据采集;数据存储模块:本文档来自技高网...
基于机器学习统计模型的入住酒店附近生活推荐系统方法

【技术保护点】
一种基于机器学习统计模型的入住酒店附近生活推荐系统,其特征在于,包括:信息采集模块:用于对用户数据进行采集;对城市地理位置对应相关信息的采集;以及对地图APP程序POI数据采集;数据存储模块:用于对数据进行分类存储,按照格式化的方式存储;存储采集模块采集到的数据以及经过算法模块计算后的数据;算法模块:采用算法DBScan在对数据进行计算和训练;匹配策略模块:执行用户和住所,用户和城市的兴趣地点匹配策略;该匹配策略按照业务逻辑、用户兴趣或用户反馈城市天气进行不同的或者几种结合的策略;推荐引擎模块:用于将所述匹配的兴趣地点坐标数据展示给用户。

【技术特征摘要】
1.一种基于机器学习统计模型的入住酒店附近生活推荐系统,其特征在于,包括:信息采集模块:用于对用户数据进行采集;对城市地理位置对应相关信息的采集;以及对地图APP程序POI数据采集;数据存储模块:用于对数据进行分类存储,按照格式化的方式存储;存储采集模块采集到的数据以及经过算法模块计算后的数据;算法模块:采用算法DBScan在对数据进行计算和训练;匹配策略模块:执行用户和住所,用户和城市的兴趣地点匹配策略;该匹配策略按照业务逻辑、用户兴趣或用户反馈城市天气进行不同的或者几种结合的策略;推荐引擎模块:用于将所述匹配的兴趣地点坐标数据展示给用户。2.根据权利要求1所述的系统,其特征在于,所述格式化数据包括:用户ID,用户经度,用户纬度,用户到达地点的时间。3.根据权利要求2所述的系统,其特征在于,所述数据存储模块:用于获取到三个方面用户地理坐标经纬度数据;包括当前住房用户的历史经纬度数据,住房附近N公里内全部用户历史经纬度数据,房屋所在城市全部用户历史经纬度数据;数据存储在分布式Hive表中,通过Hive表获取可以获取三个月的历史地理经纬度坐标数据对(记做lat,lng)作为训练样本。4.根据权利要求3所述的系统,其特征在于,所述算法模块:采用Dbscan密度聚类算法,做经纬度聚类计算;按顺序取一个经纬度坐标lat,lng对记为点P1,从这个坐标点出发,找到这个坐标附近距离小于E(E是最小距离参数)的全部经纬度坐标点;其中最小距离阈值E是输入参数;坐标点的距离是用欧氏距离来计算的欧氏距离公式:欧式距离公式中的Xik,Xjk为坐标点信息;这个P1点和全部的经纬度坐标点都计算距离后,将距离按照从小到大的顺序排序找到距离小于E值的全部坐标点,如果小于阈值E的坐标点个数达到阈值G个,其中的G是算法输入参数设置一个范围内聚集多少个坐标点;将这些点群记为M1,那么点P1和点群M1算作一范围的群体,算法再继续找第二个点P2用同样的方法算第二个范围的群体M2,一直下去计算全部的经纬度点和相应的点,找到全部的点群;再计算点群与点群之间的距离,该距离仍然根据欧氏距离计算,如果两个点群之间的距离小于E那么这两个点群就可以合并成一个点群,如果距离大于E那么这两个点群就是记做两个点群集合,经过循环迭代的计算可以把全部的经纬度点,按照距离的大小聚集成不同的点群集合。5.根据权利要求4所述的系统,其特征在于,所述算法模块进一步包括:参数E和G的设置采用先估算大概值,然后通过网格搜索方式确定具体选值的方法来确定;最小距离阈值E的大小估算方法用实际的地理位置大小来估算;根据上面估算的E和G值,再通过网格搜索在估算范围内选择多个E多个G值进行多次试验的方式最终确定E和G的取值。6.根据权利要求5所述的系统,其特征在于,所述算法模块进一步包括:聚类后的三种数据中都聚类了多个点的集合;现在对每一个集合求出一个对应的中心点;计算方法一:对聚到一个地理位置集合里的全部坐标点;求经度最大值,最小值;计算平均值lng_avg=(lng_max-lng_min)/2纬度最大值,最小值;计算平均值lat_avg=(lat_max-lat_min)/2最后用经纬度平均值作为中心点;计算方法二:计算全部经纬度加和平均值,作为中心点;根据上面两种方法观察数据选择一个效果相对好的之一。7.根据权利要求6所述的系统,其特征在于,所述算法模块进一步包括:求出的多个中心点调用地图APP程序提供的API接口,获取聚类中心点的POI信息从而进行格式化保存。8.根据权利要求1所述的系统,其特征在于,所述匹配策略模块进一步包括:用户的地理兴趣标签按照时间排序,将时间段划分为:清晨,上午,中午,下午,晚上;根据不同时间段划分将用户地理兴趣点分类标签也按照时间划分;将划分后的兴趣地理信息标签与住房附近的兴趣标签和城市地理兴趣标签进行匹配;匹配就是找...

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:苏州发飚智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1