System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种酒店智能搜索方法及系统。
技术介绍
1、随着经济的发展和生活水平的提高,旅游业得到了较快的发展。人们出行旅游的需求持续增长,对酒店住宿服务的要求也越来越高。
2、然而,现有的酒店搜索方式大多还停留在用户手动输入关键词进行搜索的阶段,如需搜索某地区符合自己需求的酒店,用户需要自行综合考虑酒店的地理位置、房型、设施、价格等多方面条件,逐项去选择筛选,操作复杂且十分耗时。这种传统的人工搜索方式,很难充分满足用户日益增长的个性化需求,无法提供智能化的酒店订房服务。另外,除了上述几个简单的属性之外,一些诸如酒店的详细房型、设施、服务、窗户、用户评价等深层次酒店属性经常被忽略,这些缺点导致无法实现快速高效的酒店搜索,且不能准确匹配用户的个性化需求。
3、综上,现有技术中,在搜索酒店时需要逐项去选择筛选,导致操作复杂且十分耗时,并且会忽略酒店的其它属性,从而导致搜索出来的酒店难以与用户需求匹配。
技术实现思路
1、基于此,本专利技术的目的是提供一种酒店智能搜索方法及系统,以至少解决上述现有技术当中的不足。
2、第一方面,本专利技术提供一种酒店智能搜索方法,所述方法包括:
3、收集各个酒店官网的数据以及ota平台的数据,以得到各个酒店的酒店数据集,并对所述酒店数据集进行预处理,得到规范化酒店数据集;
4、基于自然语言处理技术提取所述规范化酒店数据集中的关键词以及情感词,基于图像识别技术提取所述规范化酒店
5、基于所述各个酒店的所述多特征索引构建多特征索引库;
6、获取用户的需求信息,对所述需求信息进行解析以及识别,以分别得到所述用户对酒店的需求特征以及所述用户的搜索意图;
7、分析所述搜索意图得到意图语句,并将所述意图语句映射到高维向量空间,以输出结构化的字典;
8、基于所述多特征索引库对所述结构化的字典进行多轮查询,以识别得到若干优质候选酒店,并将若干所述优质候选酒店进行排序,以得到优质候选酒店列表。
9、与现有技术相比,本专利技术的有益效果是:通过提取规范化酒店数据集中的关键特征,可以避免忽略酒店的各项属性,使得酒店的特征更为的全面,并且通过各个酒店对应的多特征索引构建多特征索引库,并通过多特征索引库对根据用户需求得到的结构化字典进行多轮查询,从而能够得到与用户需求匹配的若干优质候选酒店,并通过排序后,得到优质候选酒店列表,从而使得用户能够选择与其需求最为匹配的酒店。
10、进一步的,所述收集各个酒店官网的数据以及ota平台的数据,以得到各个酒店的酒店数据集,并对所述酒店数据集进行预处理,得到规范化酒店数据集的步骤包括:
11、采用网络爬虫收集各个酒店官网的酒店数据、ota平台上的网络文本数据、图片数据以及评分数据;
12、清洗所述酒店数据、所述网络文本数据、所述图片数据以及所述评分数据,以去除无效数据得到所述规范化酒店数据集。
13、进一步的,所述对所述需求信息进行解析以及识别,以分别得到所述用户对酒店的需求特征以及所述用户的搜索意图的步骤包括:
14、基于自然语言处理技术对所述需求信息进行深度语义解析,以提取出所述用户对于酒店的地理位置需求、房型需求以及价格需求;
15、基于所述需求信息识别出所述用户的搜索意图。
16、进一步的,所述分析所述搜索意图得到意图语句,并将所述意图语句映射到高维向量空间,以输出结构化的字典的步骤包括:
17、基于所述搜索意图提取意图语句,并通过文本向量化技术将所述意图语句映射到高维向量空间,以输出结构化的字典;
18、将所述结构化的字典转换为个性化与推荐的输入集,其中,所述输出结构化的字典包括所述用户对于酒店的所有需求。
19、进一步的,所述基于所述多特征索引库对所述结构化的字典进行多轮查询,以识别得到若干优质候选酒店的步骤包括:
20、将所述结构化的字典作为查询条件,并基于所述多特征索引库对所述查询条件进行多轮查询索引,以识别得到若干优质候选酒店;
21、对若干所述优质候选酒店进行相关性打分,以得到若干所述优质候选酒店的匹配得分。
22、进一步的,所述将若干所述优质候选酒店进行排序,以得到优质候选酒店列表的步骤包括:
23、构建评估模型,以使所述评估模型评估若干所述优质候选酒店与所述需求信息的匹配度;
24、根据所述匹配度对若干所述优质候选酒店进行排序,以生成优质候选酒店列表。
25、第二方面,本专利技术提供一种酒店智能搜索系统,所述系统包括:
26、收集模块,用于收集各个酒店官网的数据以及ota平台的数据,以得到各个酒店的酒店数据集,并对所述酒店数据集进行预处理,得到规范化酒店数据集;
27、提取模块,用于基于自然语言处理技术提取所述规范化酒店数据集中的关键词以及情感词,基于图像识别技术提取所述规范化酒店数据集中的视觉特征,并获取所述规范化酒店数据集中的统计特征,基于所述关键词、所述情感词、所述视觉特征以及所述统计特征构建各个酒店的多特征索引;
28、构建模块,用于基于所述各个酒店的所述多特征索引构建多特征索引库;
29、获取模块,用于获取用户的需求信息,对所述需求信息进行解析以及识别,以分别得到所述用户对酒店的需求特征以及所述用户的搜索意图;
30、分析模块,用于分析所述搜索意图得到意图语句,并将所述意图语句映射到高维向量空间,以输出结构化的字典;
31、查询模块,用于基于所述多特征索引库对所述结构化的字典进行多轮查询,以识别得到若干优质候选酒店,并将若干所述优质候选酒店进行排序,以得到优质候选酒店列表。
本文档来自技高网...【技术保护点】
1.一种酒店智能搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述收集各个酒店官网的数据以及OTA平台的数据,以得到各个酒店的酒店数据集,并对所述酒店数据集进行预处理,得到规范化酒店数据集的步骤包括:
3.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述对所述需求信息进行解析以及识别,以分别得到所述用户对酒店的需求特征以及所述用户的搜索意图的步骤包括:
4.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述分析所述搜索意图得到意图语句,并将所述意图语句映射到高维向量空间,以输出结构化的字典的步骤包括:
5.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述基于所述多特征索引库对所述结构化的字典进行多轮查询,以识别得到若干优质候选酒店的步骤包括:
6.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述将若干所述优质候选酒店进行排序,以得到优质候选酒店列表的步骤包括:
7.一种酒店智能搜索系统,其特征在于,所述系统包括:
【技术特征摘要】
1.一种酒店智能搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述收集各个酒店官网的数据以及ota平台的数据,以得到各个酒店的酒店数据集,并对所述酒店数据集进行预处理,得到规范化酒店数据集的步骤包括:
3.根据权利要求1所述的酒店智能搜索方法,其特征在于,所述对所述需求信息进行解析以及识别,以分别得到所述用户对酒店的需求特征以及所述用户的搜索意图的步骤包括:
4.根据权利要求1所述的酒店智能搜索方...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。