【技术实现步骤摘要】
旅游实体名词匹配方法、系统、设备及存储介质
[0001]本专利技术涉及人工智能领域,具体地说,涉及旅游实体名词匹配方法、系统、设备及存储介质。
技术介绍
[0002]实体名词一般是表述文本中具有特定意义的实体,例如景点名称,城市名称,专有名词等。实体名词的匹配是问答系统、信息提取、句法分析等应用领域的重要基础。在旅游的搜索中,对景点POI(Point of Interest,兴趣点,指互联网电子地图中的点类数据)的描述是景点名称、地址等多个互相之间相关性并不高的文本。如果采用全部文本域中检索的方式,就可能会产生大量的误召回。因此做词典类型的结构化召回,只在景点名称相关文本域检索,从而只召回相关的景点,精准地满足了用户需求。
[0003]针对文本域问题的解决,最终落脚点仍旧是文本匹配。文本匹配是自然语言处理中的一个重要任务,通常以文本相似度计算和文本相关性计算的形式出现,在搜索引擎、智能问答、知识检索、信息流推荐等应用系统中起核心支撑作用。一般的,文本匹配任务的目标是给定一个搜索项和一些候选的文档,从这些文档中找出与搜 ...
【技术保护点】
【技术特征摘要】
1.一种旅游实体名词匹配方法,其特征在于,包括以下步骤:基于旅游景点POI信息建立旅游实体名词词典;将所述旅游实体名词词典数据输入神经网络模型进行训练,并保存训练好的旅游实体名词预测匹配模型;以及将一待匹配的实体名词输入所述旅游实体名词词典和所述旅游实体名词预测匹配模型进行匹配,得到匹配输出。2.如权利要求1所述的旅游实体名词匹配方法,其特征在于,所述基于旅游景点POI信息建立旅游实体名词词典,包括:基于旅游业务数据资源获取旅游实体名词和旅游实体资源数据;分别计算所述旅游实体资源数据和所述旅游实体名词之间的匹配相似度,并分别根据所述匹配相似度对所述旅游实体资源数据进行排序;设置所述匹配相似度的阈值用于划分所述旅游实体资源数据,将所述匹配相似度高于所述阈值的所述旅游实体资源数据作为成功匹配结果,将匹配相似度低于所述阈值的所述旅游实体资源数据作为失败匹配结果;以及分别建立所述旅游实体名词、所述成功匹配结果和所述失败匹配结果之间的映射关系,并建立所述旅游实体名词词典。3.如权利要求2所述的旅游实体名词匹配方法,其特征在于,所述将所述旅游实体名词词典数据输入神经网络模型进行训练,并保存训练好的神经网络模型,包括:基于所述旅游实体名词词典获取所述旅游实体名词、所述成功匹配结果和所述失败匹配结果,建立训练数据集,并标注训练标签;对所述训练数据集进行文本预处理;将经过预处理的所述训练数据集和所述训练标签数据输入中文RoBERTa模型进行训练;以及保存经过训练的所述中文RoBERTa模型,得到所述旅游实体名词预测匹配模型。4.如权利要求2所述的旅游实体名词匹配方法,其特征在于,所述将一待匹配的实体名词输入所述旅游实体名词词典和所述旅游实体名词预测匹配模型进行匹配,得到匹配输出,包括:将一待匹配的实体名词输入所述旅游实体名词词典进行匹配,得到第一匹配结果;在所述第一匹配结果为成功匹配结果的情况下,将所述第一匹配结果作为匹配结果输出,在所述第一匹配结果为失败匹配结果的情况下,将所述待匹配的实体名词输入所述旅游实体名词预测匹配模型,得到第二匹配结果;以及在所述第二匹配结...
【专利技术属性】
技术研发人员:陈辰,赵华,鞠剑勋,李健,
申请(专利权)人:携程旅游信息技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。