一种酒店多维度特征的匹配方法及装置制造方法及图纸

技术编号:38051689 阅读:12 留言:0更新日期:2023-06-30 11:17
本申请提供了一种酒店多维度特征的匹配方法及装置,该方法包括:获取待匹配酒店的原始酒店数据;对原始酒店数据进行预处理,得到酒店数据,其中,预处理包括:提取原始酒店数据的多维度特征、删除原始酒店数据中的干扰信息和将原始酒店数据中的酒店名称和地址进行分词;根据酒店数据计算待匹配酒店与多个目标酒店的第一相似度值;若多个目标酒店中存在第一目标酒店与待匹配酒店的第一相似度值大于预设的第一阈值,则判定待匹配酒店与第一目标酒店匹配成功。本申请提供的方法,通过针对多维度特征来进行酒店匹配,提高了酒店匹配的准确度。度。度。

【技术实现步骤摘要】
一种酒店多维度特征的匹配方法及装置


[0001]本申请涉及数据处理
,尤其涉及一种酒店多维度特征的匹配方法及装置。

技术介绍

[0002]酒店分销平台需要将不同的供应商的大量酒店资源进行聚合并面向分销渠道统一销售,其中不同供应商酒店数据匹配是分销平台实现资源聚合、比价和统一销售的基础。
[0003]由于酒店行业缺乏统一的数据标准,业内一般采用自动化匹配以降低人工匹配投入。现有的酒店自动匹配方法统一遵循以下流程:针对酒店名称、地址进行相似度计算,并引入位置信息、电话等维度,加权计算出两家酒店的总体相似度,通过预设阈值判断是否为同一家酒店,然后将匹配结果进行人工核验,核验成功则上线销售,核验失败则需要新建酒店。
[0004]可见,目前采用的方法,在综合多个维度信息计算相似度时缺乏弹性,仅关注酒店信息总体的相似度这一单一阈值,而没有对不同维度的关键特征分别设置判断标准和对应权重,判断方式不够灵活。

技术实现思路

[0005]有鉴于此,本申请提供了一种酒店多维度特征的匹配方法及装置,目的在于提高酒店自动匹配的准确度。
[0006]本申请的一方面提供了一种酒店多维度特征的匹配方法,所述方法包括:
[0007]获取待匹配酒店的原始酒店数据;
[0008]对所述原始酒店数据进行预处理,得到酒店数据,其中,所述预处理包括:提取所述原始酒店数据的多维度特征、删除所述原始酒店数据中的干扰信息和将所述原始酒店数据中的酒店名称和地址进行分词;
[0009]根据所述酒店数据计算所述待匹配酒店与多个目标酒店的第一相似度值;
[0010]若所述多个目标酒店中存在第一目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则判定所述待匹配酒店与所述第一目标酒店匹配成功。
[0011]可选的,所述方法还包括:
[0012]若所述多个目标酒店中不存在目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则筛选出预设数量的候选酒店,其中,所述候选酒店与所述待匹配酒店的第一相似度值小于或等于所述预设的第一阈值且大于预设的第二阈值的目标酒店。
[0013]可选的,所述方法还包括:
[0014]通过相似度匹配模型对所述酒店数据与所述候选酒店的酒店数据进行相似度打分,得到第二相似度值;
[0015]若所述候选酒店中存在第二目标酒店与所述待匹配酒店的第二相似度值大于预设的第三阈值,则判定所述待匹配酒店与所述第二目标酒店匹配成功。
[0016]可选的,所述根据所述酒店数据计算所述待匹配酒店与多个目标酒店的第一相似度值,包括:
[0017]根据所述多维度特征分别计算所述待匹配酒店与所述目标酒店的多个第三相似度值;
[0018]根据预设的各个维度特征的权重和所述多个第三相似度值计算,得到所述第一相似度值。
[0019]可选的,在判定所述待匹配酒店与所述第一目标酒店匹配成功之后,所述方法还包括:
[0020]根据所述原始酒店数据获取供应商信息;
[0021]将所述供应商信息与所述第一目标酒店的映射关系存储到数据库中。
[0022]本申请的第二方面提供了一种酒店多维度特征的匹配装置,所述装置包括:获取模块、处理模块和相似度计算模块;
[0023]所述获取模块,用于获取待匹配酒店的原始酒店数据;
[0024]所述处理模块,用于对所述原始酒店数据进行预处理,得到酒店数据,其中,所述预处理包括提取所述原始酒店数据的多维度特征、删除所述原始酒店数据中的干扰信息和将所述原始酒店数据中的酒店名称和地址进行分词;
[0025]所述相似度计算模块,用于根据所述酒店数据计算所述待匹配酒店与多个目标酒店的第一相似度值;
[0026]若所述多个目标酒店中存在第一目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则所述处理模块,还用于判定所述待匹配酒店与所述第一目标酒店匹配成功。
[0027]可选的,若所述多个目标酒店中不存在目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则所述处理模块,还用于筛选出预设数量的候选酒店,其中,所述候选酒店与所述酒店的第一相似度值小于或等于所述预设的第一阈值且大于预设的第二阈值的目标酒店。
[0028]可选的,所述相似度计算模块,还用于通过相似度匹配模型对所述酒店数据与所述候选酒店的酒店数据进行相似度打分,得到第二相似度值;
[0029]若所述候选酒店中存在第二目标酒店与所述待匹配酒店的第二相似度值大于预设的第三阈值,则所述处理模块,用于判定所述待匹配酒店与所述第二目标酒店匹配成功。
[0030]可选的,所述相似度计算模块,具体用于:
[0031]所述相似度计算模块,用于根据所述多维度特征分别计算所述待匹配酒店与所述目标酒店的多个第三相似度值;
[0032]所述相似度计算模块,还用于根据预设的各个维度特征的权重和所述多个第三相似度值计算,得到所述第一相似度值。
[0033]可选的,所述处理模块,还用于根据所述原始酒店数据获取供应商信息;
[0034]所述处理模块,还用于将所述供应商信息与所述第一目标酒店的映射关系存储到数据库中。
[0035]本申请提供了一种酒店多维度特征的匹配方法及装置,该方法包括:获取待匹配酒店的原始酒店数据;对原始酒店数据进行预处理,得到酒店数据,其中,预处理包括:提取
原始酒店数据的多维度特征、删除原始酒店数据中的干扰信息和将原始酒店数据中的酒店名称和地址进行分词;根据酒店数据计算待匹配酒店与多个目标酒店的第一相似度值;若多个目标酒店中存在第一目标酒店与待匹配酒店的第一相似度值大于预设的第一阈值,则判定待匹配酒店与第一目标酒店匹配成功。本申请提供的方法,通过针对多维度特征来进行酒店匹配,提高了酒店匹配的准确度。
附图说明
[0036]图1为本申请实施例提供的一种酒店多维度特征的匹配方法的流程示意图;
[0037]图2为本申请实施例提供的一种示例性应用场景示意图;
[0038]图3为本申请实施例提供的一种未经过预处理的原始数据的示例图;
[0039]图4为本申请实施例提供的一种预处理得到的预处理数据的示例图;
[0040]图5为本申请实施例提供的一种余弦相似度的计算方法的示例图;
[0041]图6为本申请实施例提供的一种深度学习相似度匹配模型的结构示意图;
[0042]图7为本申请实施例提供的一种酒店多维度特征的匹配装置的结构示意图。
具体实施方式
[0043]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0044]下面结合图1,介绍本申请提供的一种酒店多维度特征的匹配方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种酒店多维度特征的匹配方法,其特征在于,所述方法包括:获取待匹配酒店的原始酒店数据;对所述原始酒店数据进行预处理,得到酒店数据,其中,所述预处理包括:提取所述原始酒店数据的多维度特征、删除所述原始酒店数据中的干扰信息和将所述原始酒店数据中的酒店名称和地址进行分词;根据所述酒店数据计算所述待匹配酒店与多个目标酒店的第一相似度值;若所述多个目标酒店中存在第一目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则判定所述待匹配酒店与所述第一目标酒店匹配成功。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述多个目标酒店中不存在目标酒店与所述待匹配酒店的第一相似度值大于预设的第一阈值,则筛选出预设数量的候选酒店,其中,所述候选酒店与所述待匹配酒店的第一相似度值小于或等于所述预设的第一阈值且大于预设的第二阈值的目标酒店。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:通过相似度匹配模型对所述酒店数据与所述候选酒店的酒店数据进行相似度打分,得到第二相似度值;若所述候选酒店中存在第二目标酒店与所述待匹配酒店的第二相似度值大于预设的第三阈值,则判定所述待匹配酒店与所述第二目标酒店匹配成功。4.根据权利要求1所述的方法,其特征在于,所述根据所述酒店数据计算所述待匹配酒店与多个目标酒店的第一相似度值,包括:根据所述多维度特征分别计算所述待匹配酒店与所述目标酒店的多个第三相似度值;根据预设的各个维度特征的权重和所述多个第三相似度值计算,得到所述第一相似度值。5.根据权利要求1所述的方法,其特征在于,在判定所述待匹配酒店与所述第一目标酒店匹配成功之后,所述方法还包括:根据所述原始酒店数据获取供应商信息;将所述供应商信息与所述第一目标酒店的映射关系存储到数据库中。6.一种酒店多维度特征的匹配装置,其特征在于,所述装置包括:获取模块、处理...

【专利技术属性】
技术研发人员:薛峰李享王贽
申请(专利权)人:中国民航信息网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1