OTA的民宿客栈挖掘方法技术

技术编号:15691727 阅读:75 留言:0更新日期:2017-06-24 05:10
本发明专利技术公开了一种OTA的民宿客栈挖掘方法,包括以下步骤:S1、建立基于酒店文本信息的民宿客栈粗粒度挖掘模型;S2、建立基于酒店图像信息的民宿客栈细粒度挖掘模型;S3、结合所述粗粒度挖掘模型和所述细粒度挖掘模型对OTA酒店中的民宿客栈进行挖掘。本发明专利技术建立的基于酒店图像信息的民宿客栈细粒度挖掘模型,根据传统酒店和民宿客栈在外观图像内容上的差异性,在图像层面上进行民宿客栈的深度挖掘,提高了挖掘的准确性。本发明专利技术有效地利用酒店的文本信息和图像信息进行综合分析和判断,快速而准确地挖掘出了大量民宿客栈,极大地减少了人力成本的投入。

OTA Hostel Inn Mining Method

The invention discloses a OTA bed and Breakfast Inn mining method, which comprises the following steps: S1, a mining model, hotel text information based on S2, the establishment of coarse-grained; fine-grained mining model Hostel Inn Hotel Based on image information; S3, a combination of the coarse grained mining model and the fine-grained mining model explore the OTA hotel in the hostel inn. GuestHouse Inn Hotel fine-grained mining model based on image information established by the invention, according to the difference of Tradition Hotel and guesthouse inn in the appearance of image content, the depth of excavation of the inn in the B & B on the level of image, improve the accuracy of mining. The invention can effectively take advantage of the hotel's text information and image information to conduct a comprehensive analysis and judgment, quickly and accurately to dig out a lot of Home Inn, greatly reduce the labor cost of investment.

【技术实现步骤摘要】
OTA的民宿客栈挖掘方法
本专利技术涉及一种信息挖掘领域,特别是涉及一种OTA的民宿客栈挖掘方法。
技术介绍
当前,在旅游出行中选择入住民宿和客栈的游客数量不断增长。为了满足用户的需求,在线旅游公司(OTA)需要从现有售卖酒店中挖掘出尽可能多的民宿和客栈供用户选择。然而OTA售卖的酒店数量往往数以十万计,数量已远远超过人工挖掘的限度。因此,利用计算机对酒店的相关信息进行分析和判断,挖掘出其中的民宿和客栈成为了迫切的需求。民宿客栈挖掘的关键是判断酒店是属于传统酒店类型还是属于民宿客栈类型。当前,关于OTA的民宿客栈挖掘的相关研究尚未深入展开,鲜有利用计算机自动从OTA售卖的海量酒店中挖掘出民宿和客栈的方法,实现民宿客栈的快速而准确的挖掘成为了一项具有挑战性的任务。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中无法对OTA售卖酒店中的民宿客栈进行快速而准确挖掘的缺陷,提供一种实用性强、准确率高、速度快的OTA的民宿客栈挖掘方法。本专利技术是通过下述技术方案来解决上述技术问题的:本专利技术提供了一种OTA的民宿客栈挖掘方法,其特点在于,包括以下步骤:S1、建立基于酒店文本信息的本文档来自技高网...
OTA的民宿客栈挖掘方法

【技术保护点】
一种OTA的民宿客栈挖掘方法,其特征在于,包括以下步骤:S1、建立基于酒店文本信息的民宿客栈粗粒度挖掘模型;S2、建立基于酒店图像信息的民宿客栈细粒度挖掘模型;S3、结合所述粗粒度挖掘模型和所述细粒度挖掘模型对OTA酒店中的民宿客栈进行挖掘。

【技术特征摘要】
1.一种OTA的民宿客栈挖掘方法,其特征在于,包括以下步骤:S1、建立基于酒店文本信息的民宿客栈粗粒度挖掘模型;S2、建立基于酒店图像信息的民宿客栈细粒度挖掘模型;S3、结合所述粗粒度挖掘模型和所述细粒度挖掘模型对OTA酒店中的民宿客栈进行挖掘。2.如权利要求1所述的OTA的民宿客栈挖掘方法,其特征在于,步骤S1包括:S11、建立一系列关键字集合,包括:包含集团酒店关键字的第一集合;包含传统酒店的酒店名称关键字的第二集合;包含传统酒店的房型名称关键字的第三集合;包含民宿客栈的酒店名称关键字的第四集合;包含古镇、景区和商业区关键字的第五集合;包含民宿客栈的用户点评关键字的第六集合;S12、对于待挖掘的OTA酒店,若属于步骤S11建立的第一集合中的集团酒店关键字对应的集团酒店,或酒店名称中出现步骤S11建立的第二集合中的关键字,或房型名称中出现步骤S11建立的第三集合中的关键字,则所述待挖掘的OTA酒店被判为属于传统酒店;若酒店名称中出现步骤S11建立的第四集合中的关键字,则所述待挖掘的OTA酒店被判为属于民宿客栈;若不满足上述两种情况,则执行S13;S13、利用步骤S11建立的第五集合,结合所述待挖掘的OTA酒店的位置信息进行进一步挖掘,若酒店位于所述第五集合中的古镇和商业区关键字对应的古镇和商业区,或位于所述第五集合中的景区关键字对应的景区附近第一距离阈值范围内,则所述待挖掘的OTA酒店被判为待定酒店,若不满足,则执行S14;S14、将步骤S11建立的第六集合中的关键字在所述待挖掘的OTA酒店的用户点评中进行搜索,若包括所述关键字的用户点评数量大于等于第一阈值并且所述用户点评数量占所有用户点评的比例大于等于第二阈值,则所述酒店被判为待定酒店,否则被判为传统酒店。3.如权利要求1所述的OTA的民宿客栈挖掘方法,其特征在于,步骤S2包括:S21、收集多个图像,并生成第一图像训练集;S22、利用所述第一图像训练集训练基于深度神经网络的图像特征提取模型;S23、收集传统酒店和民宿客栈两个类别的外观图像,生成第二图像训练集;S24、利用所述第二图像训练集训练基于外观图像的传统酒店...

【专利技术属性】
技术研发人员:李翔严捷冰李发科鞠涛伟
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1